java 解析网站的标题,简介,图片等
2016-03-18 10:39
435 查看
这里用到了一个别人的jar包
jsoup-1.6.1.jar
public static void jiexi(){
System.out.println("-------------------------------------------------");
try {
URL url = new URL("http://www.baidu.com");
Document doc = Jsoup.parse(url, 5000);
// 标题
String title = doc.title();
System.out.println("title " + title);
// 简介
String description = null;
Elements elements = doc.select("meta[name=description]");
if (elements != null && elements.size() > 0) {
description = elements.get(0).attr("content");
} else {
// 取不到简介时取文字内容前100位
description = doc.text();
if (description.length() > 100) {
description = description.substring(0, 100);
}
}
// 简介没设置,文字内容也没有时设为"无简介"
System.out.print("description "+ description);
// 图片
String image = null;
elements = doc.select("meta[name=thumbnail]");
if (elements != null && elements.size() > 0) {
image = elements.get(0).attr("content");
}
System.out.print("image " + image);
} catch (Exception e1) {
System.out.print("dddf " + e1);
}
System.out.println("-------------------------------------------------");
}
jsoup-1.6.1.jar
public static void jiexi(){
System.out.println("-------------------------------------------------");
try {
URL url = new URL("http://www.baidu.com");
Document doc = Jsoup.parse(url, 5000);
// 标题
String title = doc.title();
System.out.println("title " + title);
// 简介
String description = null;
Elements elements = doc.select("meta[name=description]");
if (elements != null && elements.size() > 0) {
description = elements.get(0).attr("content");
} else {
// 取不到简介时取文字内容前100位
description = doc.text();
if (description.length() > 100) {
description = description.substring(0, 100);
}
}
// 简介没设置,文字内容也没有时设为"无简介"
System.out.print("description "+ description);
// 图片
String image = null;
elements = doc.select("meta[name=thumbnail]");
if (elements != null && elements.size() > 0) {
image = elements.get(0).attr("content");
}
System.out.print("image " + image);
} catch (Exception e1) {
System.out.print("dddf " + e1);
}
System.out.println("-------------------------------------------------");
}
相关文章推荐
- 架构师都要懂哪些知识
- ARM与X86 CPU架构对比区别
- 网站建设如何做好页面布局合理
- 配置高可用的Hadoop平台
- 搜狐网站打不开了!!提示502 Bad Gateway Fss错误信息。
- Java构建高并发高可用的电商平台架构实践
- 相关api网站
- 学习分布式架构感悟
- 一个用来获取硬盘信息工具的网站
- 发个谷歌,百度网盘,谷歌学术可用的网站
- 大型网站运维需要干的那些事
- 高性能web系统的架构和系统优化
- 推荐一款提供秀场直播程序源码搭建直播平台的网站
- 建站公司制作企业网站时动辄收费数万的原因
- 一些常用的网站
- 简单ESB的服务架构
- 人人商城PHP网站打开网页空白
- Android架构图
- KVM原理与架构系列之五 IO虚拟化篇
- 网站根目录的问题