java动态爬虫jsoup以及正则表达式的运用
2015-06-30 14:14
597 查看
1.jsoup是java的HTML解析器,可直接解析某个URL地址,HTML文本内容。http://jsoup.org/官网
2.解析URL地址
View Code
正则表达式语法:
https://msdn.microsoft.com/zh-cn/library/ae5bf541%28v=vs.80%29.aspx
2.解析URL地址
(\\d{4})-(\\d{2})-(\\d{2})\\s+(\\d{2}):(\\d{2})发布 (\\S+过敏\\S+):\\s+(\\S+)\\s+(\\S+) \\s+(感冒\\S+):\\s+(\\S+)\\s+(\\S+) \\s*(\\S+)\\s* 首要污染物:\\s*(\\S+)\\s*"
View Code
正则表达式语法:
https://msdn.microsoft.com/zh-cn/library/ae5bf541%28v=vs.80%29.aspx
相关文章推荐
- Java 对象复制
- Java EE应用的分层模型
- struts2 文件上传下载(单文件上传与多文件上传的比较)
- java☞自增自减运算符(++)(--)
- Java 图片添加水印
- java读取properties配置文件
- 【Java Swing探索之路系列】之四:Java Swing用户界面组件(一)
- Java 接口和抽象类区别
- spring 4 整合hibernate 4的新变化
- Java程序执行时间的简单方法
- POJ 3982 序列 [解题报告] Java
- java 知识点
- [java]多态
- java☞基本数据类型
- Java用freemarker导出word
- eclipse插件genymotion运行提示Initialize Engine: failed和Virtualbox运行提示创建com对象失败
- Eclipse4.4 安装java反编译插件Eclipse Class Decompiler
- JAVA forname classnotfoundexception 错误
- spring源码初步学习-自己实现的ioc容器结构
- 【MyEclipse 2015】 逆向破解实录系列【3】(纯研究)