获取https网页的内容
2017-02-06 10:45
609 查看
public static String getHtmlString(String url) { try { URL uri = new URL(url); HttpsURLConnection con = (HttpsURLConnection) uri.openConnection(); con.setInstanceFollowRedirects(false); con.setUseCaches(false); con.setAllowUserInteraction(false); con.setRequestProperty("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0"); con.connect(); StringBuffer sb = new StringBuffer(); String line = ""; BufferedReader URLinput = new BufferedReader(new InputStreamReader( con.getInputStream())); while ((line = URLinput.readLine()) != null) { sb.append(line); } con.disconnect(); return sb.toString().toLowerCase(); } catch (Exception e) { e.printStackTrace(); return "f"; } }
需要注意的就是这一句模拟浏览器进行访问
con.setRequestProperty("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0");
相关文章推荐
- 利用cpdetector获取文件编码格式,同时得到网页内容。增加http/https通用方式
- vbs+xmlhttp获取网页内容
- 获取远程网页的内容之一(downmoon原创)
- .NET下获取网页的内容的封装类
- 获取网页内容
- 抓取网页并获取指定内容段
- 使用XPath解析HTML获取网页内容
- 获取远程网页的内容之二(downmoon原创)
- 自动判断网页编码获取网页源代码内容的函数
- 获取网页中的密码和文本输入框的内容
- 获取网页中密码和文本框中的内容
- 获取网页中密码和文本框中的内容
- javascript使用xmlhttp获取网页内容
- VC++中使用使用winnet类获取网页内容
- 获取IE和Gecko内核的浏览器的网页内容的demo
- 获取网页内容并显示出来
- asp.net 获取远程网页内容
- 获取远程网页的内容之一(downmoon原创)