Android笔记—— 使用Jsoup解析Html
2015-12-30 16:40
489 查看
想要做一个看新闻的应用,类似Cnbeta客户端的东西。大致思路如下:根据链接获取新闻列表页的html代码,然后解析,找到所有的新闻标题和新闻链接用listView显示,当点击ListView的Item再加载相应的新闻内容。
其中获取html代码,可以使用如下代码实现:
[java] view
plaincopyprint?
public String getHtmlString(String urlString) {
try {
URL url = new URL(urlString);
URLConnection ucon = url.openConnection();
InputStream instr = ucon.getInputStream();
BufferedInputStream bis = new BufferedInputStream(instr);
ByteArrayBuffer baf = new ByteArrayBuffer(500);
int current = 0;
while ((current = bis.read()) != -1) {
baf.append((byte) current);
}
return EncodingUtils.getString(baf.toByteArray(), "gbk");
} catch (Exception e) {
return "";
}
}
传入一个网页链接,将返回此链接的html代码(String)。
然后就是解析此html代码了。经过google,发现了java的一个很好用的解析html的库,Jsoup:http://jsoup.org/
很容易使用,方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象,然后就可以像使用js一个解析html了
[java] view
plaincopyprint?
String htmlString = getHtmlString("http://www.cnbeta.com");
Document document = Jsoup.parse(htmlString);
比如要获取cnbeta的html的title,只需:
[java] view
plaincopyprint?
String title = document.head().getElementsByTag("title").text();
另外构建Document的时候也可以直接使用URL,像这样:
[java] view
plaincopyprint?
Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);
其中5000是连接网络的超时时间。
有关Jsoup的下载和更多介绍,见其官网:http://jsoup.org/
我写的一个demo,点击按钮后会加载然后显示cnbeta首页的所有新闻标题和链接地址,下载:http://download.csdn.net/detail/barryhappy/4151450 ,zip包里有jsoup的jar包,导入项目后可能需要手动导入此jar包。
运行效果图——
其中获取html代码,可以使用如下代码实现:
[java] view
plaincopyprint?
public String getHtmlString(String urlString) {
try {
URL url = new URL(urlString);
URLConnection ucon = url.openConnection();
InputStream instr = ucon.getInputStream();
BufferedInputStream bis = new BufferedInputStream(instr);
ByteArrayBuffer baf = new ByteArrayBuffer(500);
int current = 0;
while ((current = bis.read()) != -1) {
baf.append((byte) current);
}
return EncodingUtils.getString(baf.toByteArray(), "gbk");
} catch (Exception e) {
return "";
}
}
传入一个网页链接,将返回此链接的html代码(String)。
然后就是解析此html代码了。经过google,发现了java的一个很好用的解析html的库,Jsoup:http://jsoup.org/
很容易使用,方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象,然后就可以像使用js一个解析html了
[java] view
plaincopyprint?
String htmlString = getHtmlString("http://www.cnbeta.com");
Document document = Jsoup.parse(htmlString);
比如要获取cnbeta的html的title,只需:
[java] view
plaincopyprint?
String title = document.head().getElementsByTag("title").text();
另外构建Document的时候也可以直接使用URL,像这样:
[java] view
plaincopyprint?
Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);
其中5000是连接网络的超时时间。
有关Jsoup的下载和更多介绍,见其官网:http://jsoup.org/
我写的一个demo,点击按钮后会加载然后显示cnbeta首页的所有新闻标题和链接地址,下载:http://download.csdn.net/detail/barryhappy/4151450 ,zip包里有jsoup的jar包,导入项目后可能需要手动导入此jar包。
运行效果图——
相关文章推荐
- 2015年十大热门Android开源新项目
- android捕获ListView中每个item点击事件
- android 水纹上涨与水滴滴下效果
- android NDK环境搭建及练习
- Android属性动画完全解析(下),Interpolator和ViewPropertyAnimator的用法
- Android双击返回键退出Activity的两种方法
- 解决android sdk无法访问Google的问题
- Android Studio中如何引用图片资源
- 新东西013--Android软键盘详解
- 解决android-support-v4.jar 冲突
- AndroidStudio导入sdk中的Sample工程
- android之listView定位到指定行同一时候隐藏输入键盘
- Android项目开发 教你实现Periscope点赞效果
- Android 使用 Gradle 多渠道打包
- Android使用DialogFragment,自定义对话框
- Android——新浪微博SDK环境搭建问题
- 浅谈Android之Serializable接口
- android PullToRrefresh自定义下拉刷新动画
- Android LayoutParams详解
- android studio 百度地图 .so文件错误 完美解决