您的位置:首页 > 其它

根据给定的URL自动获取其中的正文

2013-02-04 12:19 225 查看
采用了哈工大“基于行块分布函数”的算法实现,示例代码如下:

import apollo.crawler.core.net.TextExtract;

public class TextExtractDemo {

/**
* @param args
*/
public static void main(String[] args) {
String urlStr = args[0];
System.out.println(new TextExtract().getTextFromUrl(urlStr));
}

}

需要添加依赖库apollo-crawler-core-1.0.0.jar
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  爬虫开发