JSpider是一个用Java实现的WebSpider
2015-08-11 02:31
281 查看
JSpider是一个用Java实现的WebSpider,JSpider的执行格式如下:
jspider [URL] [ConfigName]
URL一定要加上协议名称,如:http://,否则会报错。如果省掉ConfigName,则采用默认配置。
JSpider
的行为是由配置文件具体配置的,比如采用什么插件,结果存储方式等等都在conf\[ConfigName]\目录下设置。JSpider默认的配置种类
很少,用途也不大。但是JSpider非常容易扩展,可以利用它开发强大的网页抓取与数据分析工具。要做到这些,需要对JSpider的原理有深入的了
解,然后根据自己的需求开发插件,撰写配置文件。
jspider [URL] [ConfigName]
URL一定要加上协议名称,如:http://,否则会报错。如果省掉ConfigName,则采用默认配置。
JSpider
的行为是由配置文件具体配置的,比如采用什么插件,结果存储方式等等都在conf\[ConfigName]\目录下设置。JSpider默认的配置种类
很少,用途也不大。但是JSpider非常容易扩展,可以利用它开发强大的网页抓取与数据分析工具。要做到这些,需要对JSpider的原理有深入的了
解,然后根据自己的需求开发插件,撰写配置文件。
相关文章推荐
- JAVA爬虫 WebCollector
- JAVA爬虫 WebCollector
- Nutch 是一个开源Java 实现的搜索引擎
- Nutch 是一个开源Java 实现的搜索引擎
- Struts2表单回显原理,struts2表单回显
- Spring中的转换器:Converter
- Java基础-IO流
- Spring问题
- Struts问题
- Ultra-Ptr 在eclipse中编译的办法
- eclipse 常用设置
- java实现文件的复制,移动
- IT技术:唯一ID高效率生成方式
- 利用JAVA线程安全队列简单实现读者写者问题。
- 尚硅谷公开课--struts2--4--struts2中扩展名的配置
- 尚硅谷公开课--struts2--5--ActionSuport
- cxf-2.7.3+spring3.0.7
- java中的注解
- Win10下Eclipse插件EasyShell兼容问题处理
- [转]java 为什么wait(),notify(),notifyAll()必须在同步方法/代码块中调用?