您的位置:首页 > 编程语言 > Java开发

java正则表达式匹配模式[贪婪型、勉强型、占有型]

2015-04-08 21:34 351 查看
对于这三种匹配模式也有叫: “最大匹配Greedy”“最小匹配Reluctant”“完全匹配Possessive”。现在将我对这三种匹配模式的理解写出来,并提供一些例子供大家参考。

1、Greediness(贪婪型): 最大匹配

X?、X*、X+、X{n,}都是最大匹配。例如你要用“<.+>”去匹配“a<tr>aava </tr>abb”,也许你所期待的结果是想匹配“<tr>”,但是实际结果却会匹配到“<tr>aava </tr>”。这是为什么呢?下面我们跟踪下最大匹配的匹配过程。

①“<”匹配字符串的“<”。②“.+”匹配字符串的“tr>aava </tr>ab”,在进行最大匹配时,它把两个“>”都匹配了,它匹配了所有字符,直到文本的最后字符“b” ③这时,发现不能成功匹配“>”,开始按原路回退,用“a”与“>”匹配,直到“ab”前面的“>”匹配成功。

这就是最大匹配,我们匹配的时候应该看最后面能匹配到哪。

代码示例:

1
String
test =
"a<tr>aava
</tr>abb "
;
2
String
reg =
"<.+>"
;
3
System.out.println(test.replaceAll(reg,
"###"
));
输出:

a###abb

2、Reluctant(Laziness)(勉强型):最小匹配

X?、X*、X+、X{n,}都是最大匹配。好,加个?就成了Laziness匹配。例如X??、X*?、X+?、X{n,}?都是最小匹配,其实X{n,m}?和X{n }?有些多余。

最小匹配意味者,.+? 匹配一个字符后,马上试一试>的匹配可能,失败了,则.+? 再匹配一个字符,再马上试一试>的匹配可能。JDK文档中Greedy 和 Reluctant,它是以eat一口来隐喻的,所以翻译成贪吃和(勉强的)厌食最贴切了。不过我喜欢最大匹配、最小匹配的说法。

代码示例:

1
String
test =
"a<tr>aava
</tr>abb "
;
2
String
reg =
"<.+?>"
;
3
System.out.println(test.replaceAll(reg,
"###"
));
输出:

a###aava ###abb

和上面的不同是匹配了两处。

3、Possessive(占有型):完全匹配



与最大匹配不同,还有一种匹配形式:X?+、X*+、X++、X{n,}+等,成为完全匹配。它和最大匹配一样,一直匹配所有的字符,直到文本的最后,但它不由原路返回。也就是说,一口匹配,搞不定就算了,到也干脆,偶喜欢。

代码示例:

1
String
test =
"a<tr>aava
</tr>abb "
;
2
String
test2 =
"<tr>"
;
3
String
reg =
"<.++>"
;
4
String
reg2 =
"<tr>"
;
5
System.out.println(test.replaceAll(reg,
"###"
));
6
System.out.println(test2.replaceAll(reg2,
"###"
));
输出:

a<tr>aava </tr>abb

###

可见。完全匹配是最严格的,必须整个字符串匹配才行。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: