您的位置:首页 > 编程语言 > Java开发

用Java爬取网页

2015-08-17 09:19 549 查看

之前用python爬取网页了,现在我们在用Java来爬取网页,两者可以对比一下,个人感觉python语言简洁清新,比较好用.

[code]public static void main(String[] args){    
    NodeList rt= getNodeList("http://www.ip138.com:8080/search.asp"); 
    System.out.println(rt.toHtml());
}   

public static NodeList getNodeList(String url){
    Parser parser = null;
    HtmlPage visitor = null;
    try {
        parser = new Parser(url);
            parser.setEncoding("UTF-8");
            visitor = new HtmlPage(parser);
            parser.visitAllNodesWith(visitor);
    } catch (ParserException e) {
            e.printStackTrace();
    }
    NodeList nodeList = visitor.getBody();
    return nodeList;
}


运行结果

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: