您的位置:首页 > 其它

使用xpath取得节点的text

2015-10-10 00:00 127 查看
摘要: 通过xpath的string函数取得节点的可见text,无视嵌套的多层子节点

解析html时可能会需要某个节点的可见文本,而有时该节点下会嵌套不确定的多个子/后代节点。

测试输入

<?xml version="1.0" encoding="UTF-8"?>
<root>
<tagA>
<field>hello</field>
<field><b>world</b></field>
</tagA>
</root>

目标

取得tagA的可见文件,即"hello world"。

解决方案

1.折中方案

先取得tagA的html片段,再将片段中的标签过滤掉。

2.jsoup

Document doc = Jsoup.parse(input);
Elements ele = doc.getElementsByTag("tagA");
System.out.println(ele.text());

3.xpath

使用string函数

string(arg) 返回参数的字符串值。参数可以是数字、逻辑值或节点。

所需xpath表达式

string(//tagA)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息