您的位置:首页 > 编程语言 > Java开发

java正则表达式匹配网页email(email抓取)

2009-03-29 22:32 495 查看
package com.regExp;

import java.io.BufferedReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class CatchAllEmal {

/**
* @param args
*/
public static void main(String[] args) throws Exception {
// 注意以^开始及以$结束将行开始与行结束
String regEx="[a-zA-Z//d]+[a-zA-Z_//-//d]+(+)*@[a-zA-Z_//-//d]+(//.[a-zA-Z_//-//d]//.[a-zA-Z_//-//d]+)*@[a-zA-Z_//-//d]+(//.[a-zA-Z_//-//d]+)+";
Pattern p=Pattern.compile(regEx);
Matcher m=null;
URL url=new URL("http://tieba.baidu.com/f?kz=496274307");
InputStream is=url.openStream();
BufferedReader br=new BufferedReader(new InputStreamReader(is));
String line=br.readLine();
while(line!=null){
m=p.matcher(line);
while(m.find()){
System.out.println(m.group());
}
line=br.readLine();
}
br.close();
}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐