如何将字符串转化为Jsoup的Document 对象
2017-10-29 10:22
344 查看
有些时候在java操作解析html元素的时候比较繁琐,今天螃蟹就介绍一种可将html转换为document对象的方法——jsoup
jsoup为我们解析html提供了比较全的API接口,我们通过将html转换为document对象后,在java中便可以形同写html标签一般进行元素的解析、属性的获取。
首先看一个例子:
String html="<html><header></header><body>
<div>hello world</div>
</body><html/>";
这是提供的html文本,在转换成document对象后,我们要获取a链接的地址及文本:
代码如下:
/**
* 文件名:Chapter1.java
*
* 日期:2015年7月12日
*
*/
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
*
*
*
*
*
* @version: 2015年7月12日 下午4:55:41
*/
public class Chapter1 {
/**
* @author: IT学习者
*
*
* @version: 2015年7月12日 下午4:55:42
*/
public static void main(String[] args) {
String html = "<html><head><title>IT学习者</title></head>"
+ "<body><div id=\"content\">"
+ "<a href='> IT学习者官网 </a>"
+ "<a href=''> IT学习者论坛 </a>"
+ "</div></body></html>";
Document doc = Jsoup.parse(html);
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println("linkHref:" + linkHref);
System.out.println("linkText:" + linkText);
}
}
}
jsoup为我们解析html提供了比较全的API接口,我们通过将html转换为document对象后,在java中便可以形同写html标签一般进行元素的解析、属性的获取。
首先看一个例子:
String html="<html><header></header><body>
<div>hello world</div>
</body><html/>";
这是提供的html文本,在转换成document对象后,我们要获取a链接的地址及文本:
代码如下:
/**
* 文件名:Chapter1.java
*
* 日期:2015年7月12日
*
*/
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
*
*
*
*
*
* @version: 2015年7月12日 下午4:55:41
*/
public class Chapter1 {
/**
* @author: IT学习者
*
*
* @version: 2015年7月12日 下午4:55:42
*/
public static void main(String[] args) {
String html = "<html><head><title>IT学习者</title></head>"
+ "<body><div id=\"content\">"
+ "<a href='> IT学习者官网 </a>"
+ "<a href=''> IT学习者论坛 </a>"
+ "</div></body></html>";
Document doc = Jsoup.parse(html);
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println("linkHref:" + linkHref);
System.out.println("linkText:" + linkText);
}
}
}
相关文章推荐
- JSON字符串如何转化成对象?
- JavaScript中如何将html字符串转化为Jquery对象或者Dom对象
- JavaScript中如何将html字符串转化为Jquery对象或者Dom对象
- JSON字符串如何转化成对象?
- 面试题-前端-问答题-javascript中字符串格式json如何转化成json对象
- javascript中字符串格式json如何转化成json对象
- js中如何把字符串转化为对象
- javascript中字符串格式json如何转化成json对象
- 如何将json字符串转化成json对象呢
- vb.net反射中如何将字符串转化为对象实例
- 如何将org.w3c.dom.Element xml节点对象转化成XML格式的string字符串
- 21.如何将java类对象转化为json字符串
- js 中如何把一个普通的字符串转化为数组对象呢
- js中如何把字符串转化为对象
- JSON对象如何转化为字符串?
- js中如何把字符串转化为对象、数组示例代码
- Js中如何把字符串转化为对象、数组示例代码
- 前端js如何生成一个json对象,并转化为json字符串
- js中如何把字符串转化为对象
- vb.net反射中如何将字符串转化为对象实例