黑马程序员——网页爬虫(网页蜘蛛)
2015-05-29 03:21
405 查看
------- <a href="http://www.itheima.com"
target="blank">android培训</a>、<a href="http://www.itheima.com"
target="blank">java培训</a>、期待与您交流! ----------
-通过学习IO流,网络编程,正则表达式等知识编写一个用于获取电子邮箱的程序——网页爬虫
target="blank">android培训</a>、<a href="http://www.itheima.com"
target="blank">java培训</a>、期待与您交流! ----------
-通过学习IO流,网络编程,正则表达式等知识编写一个用于获取电子邮箱的程序——网页爬虫
package day25; import java.io.*; import java.net.*; import java.util.regex.Matcher; import java.util.regex.Pattern; public class GetMailDemo { public static void main(String[] args) throws Exception { getNetMails(); } //取得网络上的Email public static void getNetMails() throws Exception{ URL url= new URL("http://10.0.31.236:8080/testWeb/email.html"); URLConnection conn= url.openConnection(); BufferedReader bufIn= new BufferedReader(new InputStreamReader(conn.getInputStream())); String line= null; String mailreg= "\\w+@\\w+(\\.\\w+)+"; Pattern p= Pattern.compile(mailreg); while((line=bufIn.readLine())!=null){ //System.out.println(line); Matcher m= p.matcher(line); while(m.find()){ System.out.println(m.group()); } } } //取得本地文件中的Email public static void getMails() throws Exception{ @SuppressWarnings("resource") BufferedReader bufr= new BufferedReader(new FileReader("mail.txt")); String line= null; String mailreg= "\\w+@\\w+(\\.\\w+)+"; Pattern p= Pattern.compile(mailreg); while((line=bufr.readLine())!=null){ //System.out.println(line); Matcher m= p.matcher(line); while(m.find()){ System.out.println(m.group()); } } } }
相关文章推荐
- 黑马程序员——正则表达式
- 九章算法面试题72 翻转链表I
- 九章算法面试题71 平方根
- 黑马程序员——OC 基础:NSString的一些用法
- 黑马程序员——单例设计模式
- 黑马程序员——OC基础:类和对象
- 11个技巧:提升程序员工作效率
- 说的还真准:高效程序员的5种角色
- 程序员学习能力提升三要素
- 优秀程序员必备的23条好习惯
- 黑马程序员——多线程(三)
- 码农提高工作效率
- 《程序员开发心理学》阅读笔记一
- 黑马程序员——多线程(二)
- 黑马程序员----7K面试题银行业务调度系统
- 程序员讨厌没有价值的任务
- 黑马程序员----7K面试题交通灯
- 黑马程序员---自定义一个带行号的缓冲区对象
- 黑马程序员——多线程(一)
- 黑马程序员——明确 构造函数\构造代码块\静态代码块\ 的功能特点(图解)