您的位置:首页 > 编程语言 > Python开发

Python字符串匹配的简单应用

2014-03-06 10:40 375 查看
在《Python 基础教程》中,作者在讲解re之前和我们来了个美式幽默:有些人面临一个问题时会想:"我知道,可以使用正则表达式来解决这个问题。”于是现在他们就有两个问题了。简单的一句玩笑话,却道出正则表达式是一个不容易的问题。这里,我浅析一下正则表达式的一个简单应用,希望能够起到抛砖引玉的作用。

在正则表达式中,一个比较常用的方法就是re.search(pattern, string, flags = 0).参数pattern是以字符串形式提供的正则表达式,string是需要匹配的字符串,如果匹配成功,则返回一个MatchObject,否则返回None。方法MatchObject.group(0)会返回匹配到的字符串。

Remark:

第一,因为暂时还不需要关心匹配结果的细节,只关心有没有结果,所以在re.search()之后添加判断返回值是否为None,如果为True,则表示匹配成功,否则返回False表示匹配失败。为节省版面,尽可能用注释表示这类匹配结果,如# => True或者 # => False,附在语句之后。

第二,目前我们关心的是整个字符串是否能由正则表达式匹配。但是,在默认情况下re.search(pattern, string)只判断string的某个子串能否由pattern匹配,即便pattern只能匹配string的一部分,也不会返回None。为了测试整个string能否由pattern匹配,在pattern两端加上^和$。^和$是正则表达式中的特殊字符,它们并不匹配任何字符,只是表示"定位到字符串的起始位置"和"定位到字符串的结束位置"(原理如图所示),这样就保证;只有在整个string都可以由pattern匹配时,才算匹配成功,不返回None,如所示。



例 使用^和$测试string由pattern完整匹配
# 只要字符串中包含数字字符,就可以匹配
re.search("[0123456789]", "2") != None          #  => True
re.search("^[0123456789]$", "12") != None       #  => False
re.search("[0123456789]", "a2") != None             #  => True

# 整个字符串就是一个数字字符,才可以匹配
re.search("[0123456789]", "2") != None          #  => True
re.search("^[0123456789]$", "12") != None       #  => False
re.search("^[0123456789]$", "a2") != None       #  => False


参考:http://book.51cto.com/art/201204/332389.htm
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: