您的位置：首页 > Web前端 > JavaScript

Andriod使用Jsoup解析Html

2012-03-21 15:02 330 查看

想要做一个看新闻的应用，类似Cnbeta客户端的东西。大致思路如下：根据链接获取新闻列表页的html代码，然后解析，找到所有的新闻标题和新闻链接用listView显示，当点击ListView的Item再加载相应的新闻内容。

其中获取html代码，可以使用如下代码实现：

[java]
view plaincopy print ?

public String getHtmlString(String urlString) {
try {
URL url = new URL(urlString);
URLConnection ucon = url.openConnection();
InputStream instr = ucon.getInputStream();
BufferedInputStream bis = new BufferedInputStream(instr);
ByteArrayBuffer baf = new ByteArrayBuffer(500);
int current = 0;
while ((current = bis.read()) != -1) {
baf.append((byte) current);
}
return EncodingUtils.getString(baf.toByteArray(), "gbk");
} catch (Exception e) {
return "";
}
}

传入一个网页链接，将返回此链接的html代码（String）。

然后就是解析此html代码了。经过google，发现了java的一个很好用的解析html的库，Jsoup：http://jsoup.org/

很容易使用，方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象，然后就可以像使用js一个解析html了

[java]
view plaincopy print ?

String htmlString = getHtmlString("http://www.cnbeta.com");
Document document = Jsoup.parse(htmlString);

比如要获取cnbeta的html的title，只需：

[java]
view plaincopy print ?

String title = document.head().getElementsByTag("title").text();

另外构建Document的时候也可以直接使用URL，像这样：

[java]
view plaincopy print ?

Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);

其中5000是连接网络的超时时间。

有关Jsoup的下载和更多介绍，见其官网：http://jsoup.org/

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航