您的位置:首页 > 编程语言 > Java开发

java动态爬虫jsoup以及正则表达式的运用

2015-06-30 14:14 597 查看
1.jsoup是java的HTML解析器,可直接解析某个URL地址,HTML文本内容。http://jsoup.org/官网

2.解析URL地址

(\\d{4})-(\\d{2})-(\\d{2})\\s+(\\d{2}):(\\d{2})发布
(\\S+过敏\\S+):\\s+(\\S+)\\s+(\\S+)
\\s+(感冒\\S+):\\s+(\\S+)\\s+(\\S+)
\\s*(\\S+)\\s*
首要污染物:\\s*(\\S+)\\s*"


View Code
正则表达式语法:
https://msdn.microsoft.com/zh-cn/library/ae5bf541%28v=vs.80%29.aspx
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: