使用java7的try-resource-wi 3ff0 th语法用httpclient抓取网页并用jsoup获取网页对象
2017-02-27 09:18
621 查看
String html = null; try(CloseableHttpClient client = HttpClients.createDefault(); CloseableHttpResponse response = client.execute(new HttpGet("http://www.baidu.com")); InputStream inputStream = response.getEntity().getContent()){ html = IOUtils.toString(inputStream); } System.out.println(html); Document document = Jsoup.parse(html); System.out.println(document.toString());
try(Closeable closeable = ....;....;){do something}
java7的try-resource-with语法能够在语法块结束后能够自动关闭try()里实现closeable或autocloseable接口对象的连接,省去了写finally语句的麻烦。
从例子上可以看到在try块里最后一句是获取目标url的响应结果字符串。然后就能用这个字符串构建一个jsoup的document对象,就可以开始我们的爬取计划了
相关文章推荐
- 关于网页抓取信息 Jsoup 和 HttpUnit 的使用
- android:获取富文本图片和使用Jsoup抓取腾讯新闻网页数据
- 使用ruby_Hpricot_httpclient 获取网页图片
- 使用HttpClient+Jericho HTML Parser 实现网页抓取
- 《程序员的第一年》---------- 【抓取网页数据】定时查寻淘宝搜索结果并用excel记录下来(HttpWebRequest与正则等的使用)
- 使用 Apache HttpClient 工具模拟百度蜘蛛或浏览器抓取和解压gzip网页
- 使用Eclipse+httpClient+Jsoup读取网页数据-初级
- Android登录client,验证码的获取,网页数据抓取与解析,HttpWatch基本使用
- Java7中使用try-with-resource语法 实现两种复制文件方法
- HttpClient+jsoup实现网页数据抓取和处理
- httpclient自动获取页面编码,解决网页抓取乱码问题
- httpClient获取Jsoup解析网页
- JSP学习笔记(七十五):使用HttpClient远程抓取网页内容
- JSP学习笔记(七十五):使用HttpClient远程抓取网页内容
- 使用 idHTTP 获取 UTF-8 编码的中文网页 - 回复同学 "Delphi学习者" 的问题
- 使用HttpWebRequest抓取网页
- 使用网页抓取技术获取自己World Community Grid任务信息的经历
- httpclient 网页抓取 几个问题
- 利用httpclient抓取网页内容
- vs 调用com对象 Msxml2.XMLHTTP 获取网页源码