[置顶] Python爬虫学习(四)正则表达式
2017-11-26 09:32
501 查看
正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。
贪婪模式与非贪婪模式
正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字 符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式”ab*”如果用于查找”abbbc”,将找到”abbb”。而如果使用非贪婪的数量 词”ab*?”,将找到”a”。
注:我们一般使用非贪婪模式来提取。
贪婪模式与非贪婪模式
正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字 符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式”ab*”如果用于查找”abbbc”,将找到”abbb”。而如果使用非贪婪的数量 词”ab*?”,将找到”a”。
注:我们一般使用非贪婪模式来提取。
相关文章推荐
- Python 爬虫学习笔记之正则表达式
- 【python爬虫专题】解析方法 <3> 正则表达式学习
- python爬虫之正则表达式学习笔记一
- Python爬虫学习纪要(四):正则表达式1
- python——爬虫学习——正则表达式与Re库-(4)
- [Python] 网络爬虫和正则表达式学习总结
- python爬虫学习实践(一):requests库和正则表达式之淘宝爬虫实战
- python爬虫学习---正则表达式的使用
- 【python爬虫学习2.正则表达式】
- Python爬虫学习纪要(五):正则表达式2
- 在学习python网络爬虫时用到的正则表达式
- python爬虫学习(1)--关于正则表达式输入和提取中文
- Python爬虫学习---5分钟掌握正则表达式
- Python基础学习——正则表达式与第一个爬虫(requests)
- Python学习笔记 第二部分 - 正则表达式 与 爬虫小实例(抓取豆瓣电影中评分大于等于8分的影片)
- Python爬虫包 BeautifulSoup 学习(九) 正则表达式与Lambda表达式
- Python爬虫学习纪要(三):正则表达式
- Python 爬虫学习笔记之正则表达式
- python爬虫学习之re正则表达式
- (转)Python爬虫学习笔记(2):Python正则表达式指南