java Jsoup 抓取页面数据
2019-08-02 12:22
2156 查看
原文链接:https://www.geek-share.com/detail/2692191800.html
List<ImageBean> imgList = new ArrayList<ImageBean>(); ImageBean image = null; String imageTime = ""; String imageName = ""; String url = ""; for (Map.Entry<String, String> entry : map.entrySet()) { try { Document doc = Jsoup.connect(entry.getKey()).get(); Elements scripts = doc.select("script"); JSONObject obj = null; String[] datas = entry.getValue().split(this.split); for (int i = 0; i < scripts.size(); i++) { Element script = scripts.get(i); // Get the script part Pattern p = Pattern.compile(datas[3]); // 匹配图片链接地址的正则表达式 Matcher m = p.matcher(script.html()); // 匹配的字符串 while (m.find()) { image = new ImageBean(); String matchStr = m.group(1); obj = JSONObject.parseObject(matchStr); url = datas[1] + obj.getString(datas[4]); image.setUrl(url); imageTime = getImageTime(url); image.setName(imageTime); image.setType(datas[3]); image.setImageType(datas[5]); imgList.add(image); } } } catch (IOException e) { e.printStackTrace(); } }
<entry key="http://www.nmc.cn/publish/nwp/t639/ea/500hPa-hgt.html"> <value>高度场~http://image.nmc.cn~type~data.push\((\{*.*?\})\)~img_path~nmc_fore_t639_hgt</value> </entry>
转载于:https://www.cnblogs.com/tiandi/p/6145957.html
相关文章推荐
- 使用java jsoup抓取页面中的数据
- java Jsoup 抓取页面数据
- Jsoup简介——使用Java抓取网页数据
- 使用Jsoup 抓取页面的数据
- Java - 抓取优酷网视频播放页面(使用jsoup解析html,正则表达式处理字符串)
- Java抓取网页数据(原来的页面+Javascript返回数据)
- Java Jsoup Spider抓取数据入库
- 工作总结:java url 简单抓取页面数据例子
- jsoup抓取页面与页面解析提取数据
- java抓取HTML页面的数据(淘宝页面),
- Jsoup简介——使用Java抓取网页数据
- 使用Jsoup抓取页面的数据
- java 动态加载的页面数据的抓取
- 使用Jsoup 简单抓取页面的数据
- Java中用Jsoup抓取网页上的数据
- java使用jsoup抓取中国知网数据思路与测试记录
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据