您的位置:首页 > 其它

正则表达式

2015-09-21 12:06 211 查看
正则表达式:符合一定规则的表达式。

作用:用于专门操作字符串。

特点:用于一些特定的符号来表示一些代码操作。这样就简化书写。

所以学习正则表达式,就是在学习一些特殊符号的使用。

好处:可以简化对字符串的复杂操作。

弊端:符号定义越多,正则越长,阅读性越差。

具体操作功能:

1,匹配:String matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。

2,切割:String split();

3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组。

class RegexDemo

{

public static void main(String[] args)

{

//demo();

//System.out.println((char)11);

// checkTel();

//splitDemo("zhangsan.lisi.wangwu","\\.");

//splitDemo("c:\\abc\\a.txt","\\\");

//splitDemo("erkktyqqquizzzzzo","(.)\\1+");//按照叠词完成切割。为了可以让规则的结果被重用

//可以将规则封装成一个组。用()完成。组的出现都有编号。

//从1开始。 想要使用已有的组可以通过 \n(n就是组的编号)的形式来获取。

String str = "wer1389980000ty1234564uiod234345675f";//将字符串中的数组替换成#。

//replaceAllDemo(str,"\\d{5,}","#");

String str1 = "erkktyqqquizzzzzo";//将叠词替换成$. //将重叠的字符替换成单个字母。zzzz->z

replaceAllDemo(str1,"(.)\\1+","$1");

}

public static void replaceAllDemo(String str,String reg,String newStr)

{

str = str.replaceAll(reg,newStr);

System.out.println(str);

}

public static void splitDemo(String str,String reg)

{

//String reg = " +";//按照多个空格来进行切割

String[] arr = str.split(reg);

System.out.println(arr.length);

for(String s : arr)

{

System.out.println(s);

}

}

public static void checkTel()

{

String tel = "16900001111";

String telReg = "1[358]\\d{9}";

System.out.println(tel.matches(telReg));

}

public static void demo()

{

String str = "b23a23456789";

String reg = "[a-zA-Z]\\d*";

boolean b= str.matches(reg);

System.out.println(b);

}

public static void checkQQ()

{

String qq = "123a454";

String regex = "[1-9]\\d{4,14}";

boolean flag = qq.matches(regex);

if(flag)

System.out.println(qq+"...is ok");

else

System.out.println(qq+"... 不合法");

}

public static void checkQQ_1()

{

String qq = "1882345a0";

int len = qq.length();

if(len>=5 && len<=15)

{

if(!qq.startsWith("0"))//Integer.parseInt("12a");NumberFormatException

{

try

{

long l = Long.parseLong(qq);

System.out.println("qq:"+l);

}

catch (NumberFormatException e)

{

System.out.println("出现非法字符.......");

}

}

else

{

System.out.println("不可以0开头");

}

}

else

{

System.out.println("长度错误");

}

}

}
经典案例 网页爬虫

import java.io.*;

import java.util.regex.*;

import java.net.*;

import java.util.*;

class RegexTest2

{

public static void main(String[] args) throws Exception

{

getMails_1();

}

public static void getMails_1()throws Exception

{

URL url = new URL("http://192.168.1.254:8080/myweb/mail.html");

URLConnection conn = url.openConnection();

BufferedReader bufIn = new BufferedReader(new InputStreamReader(conn.getInputStream()));

String line = null;

String mailreg = "\\w+@\\w+(\\.\\w+)+";

Pattern p = Pattern.compile(mailreg);

while((line=bufIn.readLine())!=null)

{

Matcher m = p.matcher(line);

while(m.find())

{

System.out.println(m.group());

}

}

}

public static void getMails()throws Exception

{

BufferedReader bufr =

new BufferedReader(new FileReader("mail.txt"));

String line = null;

String mailreg = "\\w+@\\w+(\\.\\w+)+";

Pattern p = Pattern.compile(mailreg);

while((line=bufr.readLine())!=null)

{

Matcher m = p.matcher(line);

while(m.find())

{

System.out.println(m.group());

}

}

}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: