正则表达式学习(九)子表达的使用
2012-08-26 13:35
302 查看
PS:在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。
一、问题引入
首先来看一个例子,有的短语如Windows 2000虽然是多个单词组成,但其实是一个整体,HTML页面中可以使用非换行空格( 即non-breaking space)让它在浏览器中显示在一行上,现在来匹配多个这样的空格:
文本:Your operation systemis Windows 2000.
正则表达式:nbsp;{2,}
结果:Your operation systemis Windows 2000.
分析:这里使用模式想匹配2个或2个以上的非换行空格,但是从结果可以看出,没有匹配到任何东西,因为nbsp;{2,}这个模式只能匹配到像nbsp;;;;;;;这样以nbsp开头,2个或2个以上连续分号的文本。
因为前面说过的重复匹配都是紧挨着重复匹配元字符之前的那个字符的多次重复,但是,如果我们想对一个字符串进行多次匹配,又该怎么做呢?
二、子表达式
从上面我们引出子表达式。子表达式是一个大的表达式的一部分,把一个表达式划分为多个子表达式的目的是为了把那些子表达式当作一个独立的元素来使用。子表达式必须用(和)括起来。所以,前面的例子中正则表达式应该写成(nbsp;){2,}。
来看一个匹配有效年份的正则:
文本:1988-11-13
正则表达式:(19|20)\d{2}
结果:【1988】-11-13
分析:这个例子中,为了排除没有意义的年份,把年份的前两位数字限定为19或20,|是正则表达式里的或操作符。这里必须把19|20放到一个子表达式里,即(19|20),否则只能匹配到以20开头的年份,
三、子表达式的嵌套
子表达式允许嵌套,而且允许多层嵌套,嵌套层次在理论上没有限制。
在表达式 ((A)(B(C))) 中,存在以下几个子表达式:
1
((A)(B(C)))
2 (A)
3 (B(C))
4 (C)
共4个,第0个始终代表整个表达式。在后面的回溯引用中会介绍到通过\n(n是子表式的编号)来引用子表达式。
子表达式嵌套的例子请看下一篇匹配IPV4地址的正则表达式。
一、问题引入
首先来看一个例子,有的短语如Windows 2000虽然是多个单词组成,但其实是一个整体,HTML页面中可以使用非换行空格( 即non-breaking space)让它在浏览器中显示在一行上,现在来匹配多个这样的空格:
文本:Your operation systemis Windows 2000.
正则表达式:nbsp;{2,}
结果:Your operation systemis Windows 2000.
分析:这里使用模式想匹配2个或2个以上的非换行空格,但是从结果可以看出,没有匹配到任何东西,因为nbsp;{2,}这个模式只能匹配到像nbsp;;;;;;;这样以nbsp开头,2个或2个以上连续分号的文本。
因为前面说过的重复匹配都是紧挨着重复匹配元字符之前的那个字符的多次重复,但是,如果我们想对一个字符串进行多次匹配,又该怎么做呢?
二、子表达式
从上面我们引出子表达式。子表达式是一个大的表达式的一部分,把一个表达式划分为多个子表达式的目的是为了把那些子表达式当作一个独立的元素来使用。子表达式必须用(和)括起来。所以,前面的例子中正则表达式应该写成(nbsp;){2,}。
来看一个匹配有效年份的正则:
文本:1988-11-13
正则表达式:(19|20)\d{2}
结果:【1988】-11-13
分析:这个例子中,为了排除没有意义的年份,把年份的前两位数字限定为19或20,|是正则表达式里的或操作符。这里必须把19|20放到一个子表达式里,即(19|20),否则只能匹配到以20开头的年份,
三、子表达式的嵌套
子表达式允许嵌套,而且允许多层嵌套,嵌套层次在理论上没有限制。
在表达式 ((A)(B(C))) 中,存在以下几个子表达式:
1
((A)(B(C)))
2 (A)
3 (B(C))
4 (C)
共4个,第0个始终代表整个表达式。在后面的回溯引用中会介绍到通过\n(n是子表式的编号)来引用子表达式。
子表达式嵌套的例子请看下一篇匹配IPV4地址的正则表达式。
相关文章推荐
- Powershell学习笔记--使用正则表达式查找文件
- MYSQL入门学习之二:使用正则表达式搜索
- Java学习笔记(5)----使用正则表达式解决Google Code Jam Qualification2009赛题 Alien Language
- python 基础学习 正则表达式2(使用)
- 通过代码学习C#&.NET——委托使用(正则表达式替换)
- python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL
- [置顶] javascript正则表达式学习笔记之------正则表达式的创建和基本使用
- Android学习之使用正则表达式Pattern与Matcher来判断字符串格式
- 学习后对正则表达式使用记录(个人)
- 正则表达式学习--RegexBuddy工具的使用(一)
- accp6.0 《使用javascript增强交互效果》学习笔记ch7 正则表达式和表单辅助特效
- 正则表达式中awk的学习和使用
- 正则表达式学习--RegexBuddy工具的使用(一)
- (学习笔记)简单正则表达式的使用实例[javascript]
- python中re模块(正则表达式模块)的使用学习
- java学习-- 使用正则表达式从网页上提取网站标题
- 【推荐】使用Ultrapico Expresso学习正则表达式
- python爬虫学习---正则表达式的使用
- 正则表达式学习--RegexBuddy工具的使用
- 【转】MYSQL入门学习之二:使用正则表达式搜索