Learning Python 008 正则表达式-001
2016-07-16 20:50
309 查看
Python 正则表达式 总结
这节课讲讲正真使用的技术 — 正真表达式。文本爬虫
什么是正则表达式
正则表达式这个名词听起来就有一种很官方的感觉,但是它是一个很很很有用的技术。我用语言是不能形容它的。那举个例子好了。下面是一段加密的文本:sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl
如果你知道上面这段文本的解密规律,就可以知道上面这段文本的真正内容。
* 解密规律:ooxx 真正的内容 xxoo
* 解密:I am Aobo Sir
所以,就算你知道了解密规律,你也需要花一定时间去找,这种事情是可以交个程序去做的,正则表达式做的就是这样的事情。
简单的看看下面的列表
常用符号:*、
.、
?、
(
符号 | 说明 |
---|---|
. | 匹配任意字符,\n(换行符)除外 |
* | 匹配前一个字符0次或无限次 |
? | 匹配前一个字符0次或1次 |
.* | 贪心算法。(获取所有符合需求的信息) |
.*? | 非贪心算法 |
() | 括号内的数据作为结果返回 |
findall()、
search()、
sub()
方法 | 说明 |
---|---|
findall() | 匹配所有符合规律的内容,返回包含结果的列表 |
search() | 匹配并提取第一个符合规律的内容,返回一个正则表达式对象(object) |
sub() | 替换符合规律的内容,返回替换的值 |
参考网站:
http://www.jikexueyuan.com/course/777_2.html?ss=1
相关文章推荐
- Python动态类型的学习---引用的理解
- Python3写爬虫(四)多线程实现数据爬取
- 垃圾邮件过滤器 python简单实现
- 下载并遍历 names.txt 文件,输出长度最长的回文人名。
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- 爬虫笔记
- Python中zip()函数用法举例
- Python中map()函数浅析
- msql 正则表达式
- 正则表达式
- Python将excel导入到mysql中
- Learning Python 008 正则表达式-001