您的位置:首页 > 其它

正则表达式中"?"的扩展用法

2010-11-15 20:50 267 查看
又分三小种用法。

第一种 指明非捕捉用的括号

我们已经知道括号可以捕捉匹配上的字符串,并将它们存入变量之中,如果只想用括号将某部分进行分组?考虑这样的正则表达式:只希望其中一部分括号中所匹配的内容被存入内存变量中。在下面的例子中,我们希望“bronto”是可选择的,为了将它变成可选择的,我们需要将它用括号括起来。接着,模式使用了一个模式可以得到“steak”或者“burger”,匹配上的字符串被存入内存变量中。
if(/(bronto)?saurus (steak|burger)/)
{
print “Fred wants a $2/n”;
}
即便“bronto”没有被匹配上,此部分仍然会存入$1。Perl 统计开括号的个数,从而给这些变量命名。我们需要的部分被存入$2。当模式变复杂时,情况就变得非常复杂。

幸运的是,Perl 的正则表达式有一种方法可以使括号只进行分组,而不会引起内存变量的分配。我们将它叫做非捕捉用的括号(non-capturing parentheses),对于它,有一个特殊的写法。我们在开括号后面加上一个问号和冒号,(?:)◆,其作用是告诉Perl 括号只是分组的作用。

◆这是?号在正则表达式中的第四种用法:问号,表示0 或1 的数量词,非贪婪修饰符,现在是开头符

改变上述正则表达式,使之对“bronto”是非捕捉用的括号,我们需要的部分被存入变量$1。
if(/(?:bronto)?saurus (steak|burger)/)
{
print “Fred wants a $1/n”;
}
如果以后需要改变正则表达式,如在brontosaurs burger 上再加入barbecue,我们可以加入“BBQ ”(含有空格),并且使括号是非捕捉用的,那么我们需要的部分所对应的内存变量仍为$1。否则,可能每一次在正则表达式中加入括号时,需要改变内存变量名。
if (/(?:bronto)?saurus (?:BBQ )?(steak|burger)/)
{
print “Fred wants a $1/n”;
}

第二种 内嵌模式选项

/(?option)pattern/; 等价于 /pattern/option; 其中 option 为 i m s x.

第三种 预见匹配
简单说,就是匹配时考虑预见匹配的那一部分,不符合的不能算匹配上,但匹配的结果部分(变量$&)要除去预见匹配部分,又分两种。
1 肯定预见匹配 /pattern(?=string)/;匹配时,要考虑符合string
例如 $string="25abc8"
$string =~/abc(?=[0-9])/
此时 abc8是符合 abc[0-9]模式的,但得到的$&不含8,而是abc.
那为何不去掉预见匹配部分呢?比如
$string="25abc8"
$string=~/abc/
结果 $&也是 abc,而不是abc8
这样也是匹配的,结果似乎也"正确".其实不然,考虑
$string="25abcu"
按先前的模式/abc(?=[0-9])/,是不匹配的,但按后面"简化"后的 /abc/,就匹配了,考虑到这种情况,使用预见匹配效果是不一样的.

2 否定预见匹配 /pattern(?!string)/;匹配时,要考虑不符合string的才行,结果$&仍然只是取patern部分,不包括string
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐