您的位置:首页 > 编程语言 > Python开发

Learning Python 008 正则表达式-001

2016-07-16 20:50 309 查看

Python 正则表达式 总结

这节课讲讲正真使用的技术 — 正真表达式。

文本爬虫

什么是正则表达式

正则表达式这个名词听起来就有一种很官方的感觉,但是它是一个很很很有用的技术。我用语言是不能形容它的。那举个例子好了。下面是一段加密的文本:

sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl


如果你知道上面这段文本的解密规律,就可以知道上面这段文本的真正内容。

* 解密规律:ooxx 真正的内容 xxoo

* 解密:I am Aobo Sir

所以,就算你知道了解密规律,你也需要花一定时间去找,这种事情是可以交个程序去做的,正则表达式做的就是这样的事情。

简单的看看下面的列表

常用符号:
*
.
?
(


符号说明
.
匹配任意字符,
\n
(换行符)除外
*
匹配前一个字符0次或无限次
?
匹配前一个字符0次或1次
.*
贪心算法。(获取所有符合需求的信息)
.*?
非贪心算法
()
括号内的数据作为结果返回
常见方法:
findall()
search()
sub()


方法说明
findall()
匹配所有符合规律的内容,返回包含结果的列表
search()
匹配并提取第一个符合规律的内容,返回一个正则表达式对象(object)
sub()
替换符合规律的内容,返回替换的值
请见下一讲:Learning Python008 正则表达式 - 002

参考网站:

http://www.jikexueyuan.com/course/777_2.html?ss=1
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息