正则表达式贪婪模式,单词边界 ,多行模式,子表达式(java版)
2017-11-08 16:19
597 查看
@Test public void test3(){ //参考博客:http://blog.csdn.net/gnail_oug/article/details/51260216 // 正则表达式知识详解之贪婪模式和非贪婪模式 (java版示例) //提取td元素里的内容 String str="<table><tr><td>hello world</td><td>hello regex</td></tr></table>"; //贪婪模式 * + {n,} 默认情况下是贪婪模式匹配 System.out.println("======贪婪模式======="); Pattern p=Pattern.compile("<td>.*</td>"); Matcher m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } System.out.println("======非贪婪模式======="); //非贪婪模式,?跟在 * + {n,} 等的后面时,表示非贪婪模式,注意和子表达式后面的?区分开,子表达式后的?表示匹配0次或1次 p=Pattern.compile("<td>.*?</td>"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } }
@Test public void test5(){ /** 示例功能: 1、单词两边都不设置边界 2、单词两边都设置边界 3、左边设置边界 4、右边设置边界*/ // 正则表达式知识详解之单词边界 (java版示例) //http://blog.csdn.net/gnail_oug/article/details/51260347 String str="the cat scattered his food catch mcat"; System.out.println("----不设置边界-----"); Pattern p=Pattern.compile("cat"); Matcher m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } // \b匹配单词边界,换句话说,\b是匹配一个位置,这个位置位于一个能够用来构成单词的字符 // (字母、数字和下划线,也就是\w相匹配的字符)和一个不能用来构成单词的字符(也就是与\W相匹配的字符)之间。 System.out.println("----两边都设置边界-----"); p=Pattern.compile("\\bcat\\b"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } System.out.println("----左边设置边界-----"); p=Pattern.compile("\\bcat"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } System.out.println("----右边设置边界-----"); p=Pattern.compile("cat\\b"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } }
@Test public void test6(){ /** * 多行模式 * * */ //注意里面的换行符 String str="hello world\r\nhello java\r\nhello java"; System.out.println("===========匹配字符串开头(多行模式)==========="); Pattern p=Pattern.compile("^hello",Pattern.MULTILINE);//MULTILINE 翻译出来就是多行 Matcher m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } System.out.println("===========匹配字符串结尾(多行模式)==========="); p=Pattern.compile("java$",Pattern.MULTILINE); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } /**结果: ===========匹配字符串开头(多行模式)=========== hello 位置:[0,5] hello 位置:[13,18] hello 位置:[25,30] ===========匹配字符串结尾(多行模式)=========== java 位置:[19,23] java 位置:[31,35]*/ }
@Test public void subexpression(){ //正则表达式知识详解之子表达式 (java版示例) http://blog.csdn.net/gnail_oug/article/details/51276455 ////注意里面的空格 ,假如要匹配两个 以上的空格 String str="hello world,hello java"; //两个空格 三个空格 Pattern p=Pattern.compile(" {2,}"); //一个空格 Matcher m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } //参考博客说这里应该不会匹配到东西 但是我的能........................ System.out.println("========================切割线======"); //使用子表达式,将 作为一个整体 p=Pattern.co d660 mpile("( ){2,}"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } //匹配ip地址(这里我不考虑大于255的情况,只要是1-3个数字都匹配) str="121.22.125.32,1.212.5.132"; System.out.println("==========匹配IP地址=========="); //普通方式匹配 System.out.println("----------普通方式----------"); p=Pattern.compile("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } //子表达式方式匹配 System.out.println("----------子表达式方式----------"); //由于上面的正则表达式中\\d{1,3}\\.重复了3次,所以可以用子表达式简化,匹配结果与上面相同 p=Pattern.compile("(\\d{1,3}\\.){3}\\d{1,3}"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } //上面匹配 空格和匹配IP的两个例子,都使用了子表达式,子表达式其中一个用途就是把多个元字符或字符用小括号 //括起来,作为一个整体(可以当成一个字符理解),方便使用* + {n,m}等规则 //子表达式也可以嵌套使用,下面还是通过匹配IP(不匹配大于255的IP)的例子来说明 //合法IP地址的规则: //1、任何一个1位或2为的数字,即0-99 //2、任何一个以1开头的3位数字,即100-199 //3、任何一个以2开头并且第2位数字在0-4之间的3位数字,即200-249 //4、任何一个以25开头并且第3位数字在0-5之间的3位数字,即250-255 System.out.println("----------匹配合法的IP地址----------"); str="121.22.125.32,10.212.5.132,260.33.22.44,23.45.600.4"; //这里IP两边增加了边界匹配,如果不加类似于260.33.22.44可以匹配到60.33.22.44 p=Pattern.compile("\\b((\\d{1,2}|1\\d{2}|2[0-4]\\d|25[0-5])\\.){3}(\\d{1,2}|1\\d{2}|2[0-4]\\d|25[0-5])\\b"); m=p.matcher(str); while(m.find()){ System.out.println(m.group()+" 位置:["+m.start()+","+m.end()+"]"); } }
相关文章推荐
- 正则表达式中的多行和非贪婪模式
- Java 正则表达式 非贪婪模式
- 关于java正则表达式贪婪模式和勉强模式的研究
- Java-----正则表达式匹配模式[贪婪模式、勉强模式、占有模式]
- 正则表达式知识详解之单词边界 (java版示例)
- [疯狂Java]正则表达式:Java正则表达式语法、贪婪模式/勉强模式
- JAVA 正则表达式的三种模式: 贪婪, 勉强和占有的讨论
- Java - 正则表达式的运用(Pattern模式和Matcher匹配)—— 匹配中文,英文字母和数字及_长度详解——收集资源blog
- Java中正则表达式、模式匹配与信息抽取
- C# 正则表达式贪婪模式案例
- js中正则表达式的贪婪模式和非贪婪模式
- Java正则表达式非贪婪提取字符串中的每个数字
- 正则表达式中的贪婪模式
- 正则表达式的贪婪与非贪婪模式
- 正则表达式贪婪与非贪婪模式
- 【JavaScript】正则表达式-惰性和贪婪模式
- php正则表达式中的非贪婪模式匹配
- 正则表达式的最大最小原则(就是懒惰和贪婪定理),java版本
- Qt 正则表达式的非贪婪模式
- 正则表达式的多行模式与单行模式图文分析