您的位置:首页 > Web前端 > JavaScript

html解析利器-JSOUP

2016-06-08 09:07 330 查看
因项目需求,需要跨项目调取别的项目的接口。
尝试着用java.net包里的URLConnection获取连接,然后用io包里的BufferedReader 读取调用外部项目接口后返回的网址的内容。
代码形如:

StringBuilder ans = new StringBuilder();
URL u= new URL(url);
URLConnection con = u.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(
con.getInputStream()));
String inputLine = null;
while ( (inputLine = in.readLine()) != null) {
ans.append(inputLine);
}
in.close();

但是由于外部项目里的接口所返回的数据是直接通过response.getWriter().write()进行展示的。且该方法可能经过跳转或其它处理,故以上代码无法获得任何内容。
遂网上搜索方法,终于发现JSOUP这个工具。
百度对其的解释是:
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
看着很炫酷,实际使用一下才知道到底有没有用。遂有如下代码:
Document doc=Jsoup.connect(url).get();
String str=doc.text();
“叮”,居然读出来了!
不管URL有没有跳转,JSOUP都能够完美得读到其内容。实是令人欣喜。
因时间关系,JSOUP其它功能暂未探索,故先将此文贴出,以供日后查阅。 阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: