网站的轮播图的获取
2016-05-29 11:19
627 查看
获取某网站的轮播图
/** * 获取轮播图 * * @author Michael * @param newsUrl * @return */ public List<Map<String, String>> crawler4Pic(String newsUrl) { List<Map<String, String>> picList = new ArrayList<Map<String, String>>(); try { Document newsPageDoc = Jsoup.connect(newsUrl) .header("Content-Type", "text/html; charset=GB2312") .header("Accept-Language", "zh-CN,zh;q=0.8").timeout(3000) .get(); // 获得当前页面的Dom String picString = newsPageDoc.select("script").eq(5).toString() .split("var data = ")[1].split(";")[0]; JSONArray picArray = JSONArray.fromObject(picString); for (int i = 0; i < picArray.size(); i++) { Map<String, String> picMap = new HashMap<String, String>(); String picUrl = picArray.getString(i).split("\"")[3]; String titleUrl = picArray.getString(i).split("\"")[7] + ":" + picArray.getString(i).split("\"")[11]; picMap.put("picUrl", picUrl); picMap.put("title", titleUrl); picList.add(picMap); System.out.println("picUrl: " + picUrl + " title: " + titleUrl); } } catch (Exception e) { e.printStackTrace(); } // System.out.println("picList =" + picList); return picList; } /** * @param args */ public static void main(String[] args) { BBMCCrowler bbmc = new BBMCCrowler(); bbmc.crawler4Pic("http://www.bbmc.edu.cn/"); }
相关文章推荐
- 三层架构(3-tier architecture)
- Java千百问_07JVM架构(015)_XmnXmsXmxXss有什么区别
- 客户端架构
- java实现关机、重启、打开运用程序及网站
- Java千百问_07JVM架构(014)_什么是Dump文件
- 三层架构
- 几个免费的IT技能学习视频网站
- Java千百问_07JVM架构(013)_java什么情况会内存溢出
- Java千百问_07JVM架构(012)_fullGC、minorGC、magorGC有什么区别
- 网站保存密码风险你知多少?
- Java千百问_07JVM架构(011)_java垃圾回收都有哪些方式
- Spark定制班第17课:Spark Streaming资源动态申请和动态控制消费速率原理剖析
- php远程抓取网站图片并保存
- Android MVP架构
- 大型门户网站架构分析
- Android应用架构之Retrofit使用
- 运维小白部署网站踩坑全过程
- 型网站页面静态化解决方案 freemarker
- 第二章 微服务架构搭建 + 服务启动注册
- iptables(一)详细教程:基础、架构、清空规则、追加规则、应用实例