用Java爬取网页
2015-08-17 09:19
549 查看
之前用python爬取网页了,现在我们在用Java来爬取网页,两者可以对比一下,个人感觉python语言简洁清新,比较好用.
[code]public static void main(String[] args){ NodeList rt= getNodeList("http://www.ip138.com:8080/search.asp"); System.out.println(rt.toHtml()); } public static NodeList getNodeList(String url){ Parser parser = null; HtmlPage visitor = null; try { parser = new Parser(url); parser.setEncoding("UTF-8"); visitor = new HtmlPage(parser); parser.visitAllNodesWith(visitor); } catch (ParserException e) { e.printStackTrace(); } NodeList nodeList = visitor.getBody(); return nodeList; }
运行结果
相关文章推荐
- java 子类和父类构造函数关系
- Spring 注解@Transactional
- BaseAdapter java.lang.ArrayIndexOutOfBoundsException: length=2; index=2 dispatchTouchEvent
- 《Java设计模式》之观察者模式(1)
- java学习之JAXB解析xml
- Java常用类及其常用方法
- java虚拟机内存管理介绍
- eclipse和pydev的配置
- Java类的初始化、继承
- javafx Hanoi
- 使用 Eclipse 的 SVN 主要插件创建项目/支/标签
- spring框架内置笔记本
- 《Java设计模式》之单例模式
- Java用native2ascii命令做unicode编码转换
- java多线程(二)锁对象
- JavaFX它ListView使用
- Java泛型范围缩减(继承实现)
- java finalize方法
- Java IO: ByteArrayInputStream
- web挖掘之Apriori算法 JAVA实现