使用xpath取得节点的text
2015-10-10 00:00
127 查看
摘要: 通过xpath的string函数取得节点的可见text,无视嵌套的多层子节点
解析html时可能会需要某个节点的可见文本,而有时该节点下会嵌套不确定的多个子/后代节点。
string(arg) 返回参数的字符串值。参数可以是数字、逻辑值或节点。
所需xpath表达式
解析html时可能会需要某个节点的可见文本,而有时该节点下会嵌套不确定的多个子/后代节点。
测试输入
<?xml version="1.0" encoding="UTF-8"?> <root> <tagA> <field>hello</field> <field><b>world</b></field> </tagA> </root>
目标
取得tagA的可见文件,即"hello world"。解决方案
1.折中方案
先取得tagA的html片段,再将片段中的标签过滤掉。2.jsoup
Document doc = Jsoup.parse(input); Elements ele = doc.getElementsByTag("tagA"); System.out.println(ele.text());
3.xpath
使用string函数string(arg) 返回参数的字符串值。参数可以是数字、逻辑值或节点。
所需xpath表达式
string(//tagA)
相关文章推荐
- C#通过xpath查找xml指定元素的方法
- xpath的数据和节点类型以及XPath中节点匹配的基本方法
- c#通过xpath读取xml示例
- JQuery 选择器 xpath 语法应用
- 深入XPath的详解以及Java示例代码分析
- htmlcleaner使用方法及xpath语法初探
- java使用xpath和dom4j解析xml
- libxml2的Xpath使用心得
- Python etree.xpath不能准确定位HTML
- C#用xpath查找某节点
- python scrapy学习踩点
- Xpath
- 利用Dom4j+xpath读取XML文档
- Schema之key、keyref
- Dom4j初步封装
- Parse XML Using Java DOM API
- XPath语法详解
- JS总结--(XML和Xpath) .
- XPath常用定位节点元素语句总结