Python爬虫学习---5分钟掌握正则表达式
2017-11-07 15:02
501 查看
(1)数量词的贪婪模式与非贪婪模式
贪婪模式:总是尝试匹配尽可能多的字符;
非贪婪模式:总是尝试匹配尽可能少的字符。
Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪)
例如:正则表达式”ab*”如果用于查找”abbbc”,将找到”abbb”。而如果使用非贪婪的数量词”ab*?”,将找到”a”。
备注:.? 是一个固定的搭配,.和代表可以匹配任意无限多个字符,加上?表示使用非贪婪模式进行匹配,也就是我们会尽可能短地做匹配,以后我们还会大量用到 .*? 的搭配。
贪婪模式:总是尝试匹配尽可能多的字符;
非贪婪模式:总是尝试匹配尽可能少的字符。
Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪)
例如:正则表达式”ab*”如果用于查找”abbbc”,将找到”abbb”。而如果使用非贪婪的数量词”ab*?”,将找到”a”。
备注:.? 是一个固定的搭配,.和代表可以匹配任意无限多个字符,加上?表示使用非贪婪模式进行匹配,也就是我们会尽可能短地做匹配,以后我们还会大量用到 .*? 的搭配。
相关文章推荐
- python爬虫学习三:python正则表达式
- Python爬虫学习纪要(三):正则表达式
- 在学习python网络爬虫时用到的正则表达式
- 【python爬虫学习2.正则表达式】
- Python 爬虫学习笔记之正则表达式
- Python 爬虫学习笔记之正则表达式
- 【python爬虫专题】解析方法 <3> 正则表达式学习
- python——爬虫学习——正则表达式与Re库-(4)
- Python爬虫学习纪要(四):正则表达式1
- Python爬虫包 BeautifulSoup 学习(九) 正则表达式与Lambda表达式
- Python基础学习——正则表达式与第一个爬虫(requests)
- python爬虫学习(1)--关于正则表达式输入和提取中文
- python爬虫学习之re正则表达式
- [Python] 网络爬虫和正则表达式学习总结
- [置顶] Python爬虫学习(四)正则表达式
- (转)Python爬虫学习笔记(2):Python正则表达式指南
- python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。
- python爬虫学习---正则表达式的使用
- Python爬虫学习纪要(五):正则表达式2
- python爬虫学习实践(一):requests库和正则表达式之淘宝爬虫实战