Python3 爬虫学习笔记(三)正则表达式
2018-11-28 15:41
387 查看
单字符
. | 任意一个字符(除\n) |
[] | 列举的一个字符 |
\d | 数字(0-9) |
\D | 非数字 |
\s | 空白、空格、Tab |
\S | 非空 |
\w | 单词字符(a-z,A-Z,0-9,_) |
\W | 非单词字符 |
多字符
* | 0-∞ |
+ | 1-∞ |
? | 0或1 |
{m} | m |
{m,} | m-∞ |
{m,n} | m-n |
边界
^ |
开头 |
$ | 结尾 |
\b | 单词边界 |
\B | 非单词边界 |
分组
| | 左右任意一个 |
(ab) | 一个分组 |
\num | 引用 num 分组匹配到的字符串 |
(?P<name>) | 分组起别名 |
(?P=name) | 引用 name 分组匹配到的字符串 |
[code]import re re.match(正则,字符串) #从字符串开始位置匹配 re.searth(正则,字符串) #查找第一个 re.findall(正则,字符串) #全部 re.sub(正则,替换字符串,原字符串) #替换 re.sub(正则,函数名,原字符串) #函数返回值替换 re.split(正则,字符串) #正则分割字符串,返回列表
+? 关闭贪婪模式
例:分隔单词
[code]s = hello world ha ha re.split(r" +",s) re.findall(r"\b[a-zA-Z]+\b",s)
阅读更多
相关文章推荐
- python学习笔记之网络爬虫(六)正则表达式(2)
- python爬虫之正则表达式学习笔记一
- Python 爬虫学习笔记之正则表达式
- Python 爬虫学习笔记之正则表达式
- python学习笔记之网络爬虫(五)正则表达式
- Python学习笔记 第二部分 - 正则表达式 与 爬虫小实例(抓取豆瓣电影中评分大于等于8分的影片)
- (转)Python爬虫学习笔记(2):Python正则表达式指南
- python爬虫学习笔记6:正则表达式及re库
- Python爬虫包 BeautifulSoup 学习(九) 正则表达式与Lambda表达式
- Python学习笔记6-Python中re(正则表达式)模块学习
- 基于python的正则表达式学习笔记
- python爬虫学习实践(一):requests库和正则表达式之淘宝爬虫实战
- python 学习笔记day09-pythonz正则表达式、socket模块
- python网络爬虫学习笔记之之正则表达式
- Python学习笔记(八)爬虫基础(正则和编解码)
- Python学习笔记(十):Python正则表达式
- python学习之正则表达式笔记
- 【Python】学习笔记——-12、正则表达式
- python学习笔记正则表达式re模块
- Python学习笔记15:Python正则表达式