All Downloads are FREE. Search and download functionalities are using the official Maven repository.

cn.wanghaomiao.seimi.annotation.Crawler Maven / Gradle / Ivy

Go to download

一个支持分布式的可以高效开发且可以高效运行的爬虫框架。设计思想上融合了spring与scrapy的优点。

There is a newer version: 2.1.4
Show newest version
package cn.wanghaomiao.seimi.annotation;

import cn.wanghaomiao.seimi.core.SeimiQueue;
import cn.wanghaomiao.seimi.def.DefaultLocalQueue;

import java.lang.annotation.*;

/**
 * 用于定义一个类为爬虫规则文件
 * @author 汪浩淼 [[email protected]]
 *         Date: 2015/5/28.
 */
@Target({ ElementType.TYPE, ElementType.FIELD })
@Retention(RetentionPolicy.RUNTIME)
@Documented
public @interface Crawler {
    /**
     * 如果需要特殊指定爬虫规则的名字,那么就设置这个就好了,默认爬虫类名
     */
    String name() default "";

    /**
     * e.g.  http://user:passwd@host:port
     *       https://user:passwd@host:port
     *       socket://user:passwd@host:port
     */
    String proxy() default "";

    /**
     * 指定crawler是否启用cookie
     */
    boolean useCookie() default false;

    /**
     * 用来指定消费队列的具体实现
     */
    Class queue() default DefaultLocalQueue.class;
}




© 2015 - 2024 Weber Informatics LLC | Privacy Policy