Jsoup 网页抓取数据之获取汽车时刻表 实例解析
2015-12-24 11:30
686 查看
第一步导入jsoup jar 工具包
下载链接:
http://download.csdn.net/detail/wei_chong_chong/9371825
下载链接:
http://download.csdn.net/detail/wei_chong_chong/9371825
import java.io.IOException; import java.util.List; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class jsoup3 { /** * @param args * @throws Exception */ public static void main(String[] args) throws Exception { /* * 注意传入的目的地和出发地要真实,时刻表要是真实的日期(过期的日期有时好像查不到,日期格式如下) * */ String[] timelist_string = getTime("开封", "焦作","2015-12-20"); for(int k = 0;k<timelist_string.length;k++){ System.out.println(timelist_string[k]); } } /* * 获取汽车站的时刻表 * 传入出发地和目的地和日期获取发车的时刻表 * 注意传入的目的地和出发地要有客运汽车,时刻表要是真实的日期(过期的日期 查不到) * * */ public static String[] getTime(String start,String end,String date) throws IOException{ String url = "http://bus.ctrip.com/busList.html?from="+start+"&to="+end+"&date="+date; String html= getHtmlByUrl(url); //System.out.println(html); Document doc = Jsoup.parse(html); //Elements newlist=doc.getElementsByClass("tb_railway_list"); Elements list = doc.getElementsByClass("package_line"); //System.out.println(list); String[] timelist = new String[list.size()/4]; int i = 0; int j = 1; //System.out.println(list); for (Element element :list) { String newtime = (element.getElementsByClass("railway_time").text().trim()); /* * 因为每个数据后面都有3个空白行 * 所以这里做一下处理 * * */ if(j%4==1){ timelist[i++]=newtime; } j++; //System.out.println(newtime); } return timelist; } /* * 根据url获取网页源码 * **/ public static String getHtmlByUrl(String url) throws IOException{ Document doc2 = Jsoup.connect(url).get(); return doc2.body().toString(); } }
相关文章推荐
- json 转换为 map、对象
- JavaScript 前端编程使用小技巧
- js对表单设置了readonly和disabled后的区别
- Ajax跨域、Json跨域、Socket跨域和Canvas跨域等同源策略限制的解决方法
- JavaScript的性能优化:加载和执行
- js获取当前url主机名和端口号
- 高性能Javascript:脚本的无阻塞加载策略
- 浏览器内核及JS引擎各有什么功能
- 探真无阻塞加载javascript脚本技术,我们会发现很多意想不到的秘密
- JS 字符串操作函数 往指定位置插入字符 删除指定位置字符 替换指定位置字符
- 让你分分钟学会javascript闭包
- js 无缝滚动
- js最常用 正则表达式
- js 中获取项目当前服务器路径
- Servlet和jsp对外访问路径的配置的…
- js 上传文件
- JSP两种页面转换forward()和sendRedirect()
- ManifoldJS
- Top JavaScript Frameworks, Libraries & Tools and When to Use Them
- 将数组、对象、Map、List转换成JSON数据