您的位置:首页 > 编程语言 > Python开发

Python Re模块 常用函数

2017-10-10 15:18 381 查看
Python Re模块 常用函数

#返回pattern对象

re.compile(string[,flag])  
#以下为匹配所用函数

re.match(pattern,string[,flags])

re.search(pattern,string[,flags])

re.split(pattern,string[,maxsplit])

re.findall(pattern,string[,flags])

re.finditer(pattern,string[,flags])

re.sub(pattern,repl,string[,count])

re.subn(pattern,repl,string[,count])

另外大家可能注意到了另一个参数 flags,在这里解释一下这个参数的含义:

参数flag是匹配模式,取值可以使用按位或运算符’|’表示同时生效,比如re.I | re.M。

可选值有:

•re.I(全拼:IGNORECASE):忽略大小写(括号内是完整写法,下同)

•re.M(全拼:MULTILINE):多行模式,改变'^'和'$'的行为(参见上图)

•re.S(全拼:DOTALL):点任意匹配模式,改变'.'的行为

•re.L(全拼:LOCALE):使预定字符类\w\W\b\B\s\S取决于当前区域设定

•re.U(全拼:UNICODE):使预定字符类\w\W\b\B\s\S\d\D取决于unicode定义的字符属性
•re.X(全拼:VERBOSE):详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释。

(2)re.search(pattern, string[, flags])

search方法与match方法极其类似,区别在于match()函数只检测re是不是在string的开始位置匹配,search()会扫描整个string查找匹配,match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回None。同样,search方法的返回对象同样match()返回对象的方法和属性。我们用一个例子感受一下
(3)re.split(pattern, string[, maxsplit])

按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。我们通过下面的例子感受一下。
(4)re.findall(pattern, string[, flags])

搜索string,以列表形式返回全部能匹配的子串。我们通过这个例子来感受一下
(5)re.finditer(pattern, string[, flags])

搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。我们通过下面的例子来感受一下
(6)re.sub(pattern, repl, string[, count])

使用repl替换string中每一个匹配的子串后返回替换后的字符串。

当repl是一个字符串时,可以使用\id或\g、\g引用分组,但不能使用编号0。

当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。

count用于指定最多替换次数,不指定时全部替换。
(7)re.subn(pattern, repl, string[, count])

返回 (sub(repl, string[, count]), 替换次数)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  正则表达式 爬虫