利用正则表达式抓取网页上邮箱的小程序
2017-03-16 16:12
211 查看
使用方法:把自己在网上保存下来含有邮箱的网页所在硬盘的路径,拷到对应位置即可,此程序用eclipse-luna-64位测试已通过
程序最终来源为马上兵老师发布的视频及源码,本人是用来学习,并和大家分享
视频链接:http://pan.baidu.com/s/1jIE5qC2 密码:fg75
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 文件名:EmailSpider.java
* 时间:2017年2月18日下午1:24:27
* 作者:
* 功能:抓取网页上的邮箱
*/
public class EmailSpider {
public static void main(String[] args) {
try{
BufferedReader br = new BufferedReader(new FileReader("E:/Java/Eclipse/Study/src/cn/xcu/edu/regexp/tt.htm"));
String line = "";
while((line=br.readLine())!= null) {
parse(line);
}
br.close();
}catch (FileNotFoundException e) {
//TODO Auto-generated catch block
e.printStackTrace();
}catch (IOException e) {
//TODO Auto-generated catch block
e.printStackTrace();
}
}
private static void parse(String line) {
Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
Matcher m = p.matcher(line);
while(m.find()){
System.out.println(m.group());
}
}
}
程序最终来源为马上兵老师发布的视频及源码,本人是用来学习,并和大家分享
视频链接:http://pan.baidu.com/s/1jIE5qC2 密码:fg75
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 文件名:EmailSpider.java
* 时间:2017年2月18日下午1:24:27
* 作者:
* 功能:抓取网页上的邮箱
*/
public class EmailSpider {
public static void main(String[] args) {
try{
BufferedReader br = new BufferedReader(new FileReader("E:/Java/Eclipse/Study/src/cn/xcu/edu/regexp/tt.htm"));
String line = "";
while((line=br.readLine())!= null) {
parse(line);
}
br.close();
}catch (FileNotFoundException e) {
//TODO Auto-generated catch block
e.printStackTrace();
}catch (IOException e) {
//TODO Auto-generated catch block
e.printStackTrace();
}
}
private static void parse(String line) {
Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
Matcher m = p.matcher(line);
while(m.find()){
System.out.println(m.group());
}
}
}
相关文章推荐
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- java利用正则表达式获取一个网页中的所有邮箱地址
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- 浅谈正则表达式在.net的运用-C#程序抓取网页信息
- JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- 利用正则表达式统计代码中的(代码行数,注释行数,空白行数)利用正则表达式获取一个网页中所有的邮箱地址
- 正则表达式抓取网页中的邮箱地址
- JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片
- 详解JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- 利用python正则表达式抓取网页中的图片到本地
- 正则表达式抓取网页中的邮箱地址
- (转)ObjC利用正则表达式抓取网页内容(网络爬虫)
- 抓取网页并用正则表达式匹配邮箱地址
- JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片