简单Java爬虫
2015-06-27 20:31
453 查看
到Apache官网下载httpcomponents-client-4.4,在项目中导入jar
主要类:HttpClient,HttpGet,HttpResponse,HttpEntity
主要类:HttpClient,HttpGet,HttpResponse,HttpEntity
public static void getContentFromUrl(String url) { HttpClient client = new DefaultHttpClient(); HttpGet getHttp = new HttpGet(url); while (true) { try { HttpResponse response = client.execute(getHttp); HttpEntity entity = response.getEntity(); String content = null; String str = null; if (entity != null) { content = EntityUtils.toString(entity); str = new String(content.getBytes("ISO-8859-1"), "UTF-8"); //在这里可以正则匹配str获得需要的信息 } sleep(2000); } catch (IOException | InterruptedException | ParseException e) { e.printStackTrace(); } } }
相关文章推荐
- 【Leetcode】Summary Ranges
- Java学习笔记----main
- Struts框架之手工编写代码方式实现校验
- Spring2集成iBatis2
- 谷歌宣布Android Studio将取代Eclipse编译环境 中止对后者支持
- java反射详解
- Spring集成JMS
- java-jvm电子书合集
- JAVA8 最新电子书集合
- java并发电子书合集
- spring+hibernate
- 【Java EE 学习 22 下】【单线程下载】【单线程断点下载】【多线程下载】
- java WebSocket 简易聊天消息推送
- Java的3种Base64加密方法
- java中的匿名内部类总结
- Java内存分析
- 泛型程序设计
- java战斗系列-战斗MAVENPW结构
- Eclipse安装SVN插件
- Vijava 学习笔记之数据中心下(集群和非集群的资源池和ESXI)树形结构展示