【jsoup】使用DOM方法来遍历一个文档
2017-08-21 08:29
676 查看
使用DOM方法来遍历一个文档
问题
你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构。方法
将HTML解析成一个Document之后,就可以使用类似于DOM的方法进行操作。示例代码:File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
说明
Elements这个对象提供了一系列类似于DOM的方法来查找元素,抽取并处理其中的数据。具体如下:查找元素
· getElementById(Stringid)
· getElementsByTag(String
tag)
· getElementsByClass(String
className)
· getElementsByAttribute(String
key) (and related methods)
· Element siblings: siblingElements(), firstElementSibling(), lastElementSibling();nextElementSibling(), previousElementSibling()
· Graph: parent(), children(), child(int
index)
元素数据
· attr(Stringkey)获取属性attr(String
key, String value)设置属性
· attributes()获取所有属性
· id(), className() and classNames()
· text()获取文本内容text(String
value) 设置文本内容
· html()获取元素内HTMLhtml(String
value)设置元素内的HTML内容
· outerHtml()获取元素外HTML内容
· data()获取数据内容(例如:script和style标签)
· tag() and tagName()
操作HTML和文本
· append(Stringhtml), prepend(String
html)
· appendText(String
text), prependText(String
text)
· appendElement(String
tagName), prependElement(String
tagName)
· html(String value)
相关文章推荐
- 【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档
- 【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档
- 【Jsoup学习礼记】使用DOM方法来遍历一个文档
- jsoup使用DOM方法来遍历一个文档
- jsoup教程006-使用DOM方法来遍历一个文档
- 使用DOM方法来遍历一个文档
- 一个好玩的使用dom遍历xml的方法
- 【使用JSOUP实现网络爬虫】入门:解析和遍历一个HTML文档
- 【使用JSOUP实现网络爬虫】入门:解析和遍历一个HTML文档
- 处理及遍历XML文档DOM元素属性及方法整理
- 最常见的JavaScript DOM方法实战-文档遍历 | CSSrainbow.cn
- 写出3种遍历一个list的方法,(使用for循环)
- DOM中使用节点对象遍历文档
- 【Jsoup学习礼记】解析和遍历一个HTML文档
- String的Split方法简单使用和Jsoup获取url文档
- JS中使用DOM技术遍历文档
- AJAX 学习笔记(5) 处理XML文档的DOM元素属性和遍历DOM元素方法
- ML的DOM解析 Java实现 使用递归解析一个XML文档
- jsoup官方解析和遍历一个HTML文档
- 18、使用jQuery操作DOM之遍历文档树