通过jsoup解析页面html获取优酷页面视频列表
2013-03-04 11:36
459 查看
通过jsoup解析页面html获取优酷页面视频列表
作者: javaboy2012
Email:yanek@163.com
qq: 1046011462
代码如下:
作者: javaboy2012
Email:yanek@163.com
qq: 1046011462
代码如下:
package com.yanek; import java.io.IOException; import java.util.HashMap; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class Tool { /** * @param args */ public static void main(String[] args) { String url="http://www.youku.com"; //url="http://movie.youku.com"; HashMap list=new HashMap(); Document doc; try { doc = Jsoup.connect(url).get(); Elements links = doc.select("a[href]"); int s=0; for (Element link : links) { String v_url=link.attr("abs:href"); if (link.ownText().length()==0) { continue; } if (list.containsKey(v_url)) { continue; } if (v_url.startsWith("http://v.youku.com/v_show")) { System.out.println(link.attr("abs:href")+"-"+link.ownText()); list.put(v_url, v_url); s++; } } System.out.println("total:"+ s); } catch (IOException e) { e.printStackTrace(); } } }
相关文章推荐
- Java - 抓取优酷网视频播放页面(使用jsoup解析html,正则表达式处理字符串)
- Java学习笔记之网络编程基础-通过URLConnection获取HTML页面
- Jsoup—解析HTML页面数据的工具
- 使用Jsoup解析HTML页面
- 【转】通过JAVA获取优酷、土豆、酷6、6间房等视频
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- Java 解析优酷地址获取视频真实地址
- jsoup获取html页面中的内容
- html页面报错码解析列表
- java-jsoup解析html页面的内容
- Jsoup解析HTML获取数据的简单实例
- 解决Jsoup解析html页面空格( )解析为乱码(问号)
- C# 获取系统当前进程列表 浮兮 视频解析
- Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
- 【转】Java 解析优酷地址获取视频真实地址
- java-jsoup解析html页面的内容
- 使用HttpClient和jsoup获取并解析html
- 【Jave】Java解析html页面的元素Element——获取下拉框中的值和文本selected-option
- .NET解析xml字符串,通过反射给实体类对象赋值,获取实体类数据列表
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(3)