基于《PythonCookbook》的学习(5)—— 查找和替换文本
2017-05-04 19:33
671 查看
对字符串中的文本做查找和替换
1、对于简单的文本模式,使用 str.replace() 即可。
In [1]: text = 'yeah, but no, but yeah, but no, but yeah' In [2]: text.replace('yeah', 'yep') Out[2]: 'yep, but no, but yep, but no, but yep'
2、对于复杂的模式,使用 re 模块中的 sub() 函数。
In [3]: text = 'Today is 11/27/2012. PyCon starts 3/13/2013.' In [4]: import re In [5]: re.sub(r'(\d+)/(\d+)/(\d+)',r'\3-\1-\2',text) Out[5]: 'Today is 2012-11-27. PyCon starts 2013-3-13.'
sub() 中的第一个参数是要匹配的模式,第2个参数是要替换上的模式。
类似“\3” 这样的是代表着模式中捕获组的数量。
如果打算执行相同的重复替换,可以先将模式编译以获得更好的性能。
In [7]: pattern = re.compile(r'(\d+)/(\d+)/(\d+)') In [8]: pattern.sub(r'\3-\1-\2',text) Out[8]: 'Today is 2012-11-27. PyCon starts 2013-3-13.'
3、对于更复杂的替换,可以传递一个回调函数来替代
In [11]: from calendar import month_abbr In [12]: def change_date(m): ...: mon_name = month_abbr[int(m.group(1))] ...: return '{} {} {}'.format(m.group(2), mon_name, m.group(3)) ...: In [13]: pattern.sub(change_date, text) Out[13]: 'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.'
calendar.month_abbr
一个数组,表示当前语言环境中一年的缩写月份。 这符合1月份的正常惯例为1号,所以它的长度为13,而
month_abbr [0]是空字符串。
替换回调函数的输入参数是一个匹配对象,由
match()或
find()返回。 用
.group()方法来提取匹配中的特定的部分。
如果还想知道替换的过程中,一共完成了多少次替换,可以使用
re.subn()。
re.subn(pattern, repl, string, count=0, flags=0)
执行与
sub()相同的操作,但返回一个元组
(new_string,number_of_subs_made)。
In [14]: nexttext, n = pattern.subn(change_date, text) In [15]: nexttext Out[15]: 'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.' In [16]: n Out[16]: 2
相关文章推荐
- 基于《PythonCookbook》的学习(6)——以不区分大小写的方式对文本做查找和替换
- 基于《PythonCookbook》的学习(4)—— 文本模式的匹配和查找
- 基于《PythonCookbook》的学习(2)——在字符串的卡头或结尾做文本匹配
- python cookbook第三版学习笔记四:文本以及字符串令牌解析
- 基于《PythonCookbook》的学习(3)——利用 Shell 通配符做字符串匹配
- 基于《PythonCookbook》的学习(1)——针对任意多的分隔符拆分字符串
- 【python cookbook】替换字符串中的子串(使用Template)
- Python Cookbook学习记录 ch1_4_2013/10/22
- python cookbook 学习笔记 -- 1.4 字符串对齐
- Python Cookbook学习记录 ch1_3_2013/10/21
- python学习笔记-- python cook book 第一章
- 【python cookbook】 替换字符串中的子串
- Python Cookbook学习记录 ch1_6_2013/10/22
- Python Cookbook学习记录 ch1_7_2013/10/22
- Python Cookbook学习记录 ch1_10_2013/10/23
- Python Cookbook学习记录 ch1_2_2013/10/21
- python cookbook 学习笔记 -- 1.2 字符与字符值间转换
- python cookbook 学习笔记 -- 1.1一次处理一个字符
- python cookbook 学习笔记 -- 1.6 合并字符串
- python cookbook 学习笔记 -- 1.7 将字符串逐字符或逐词反转