爬虫笔记(9/25)------正则表达式
2017-09-25 19:20
92 查看
1.正则表达式常用函数
1)re.match(pattern,string,flag)#(正则表达式,源字符,可选参数对应的标志位)
2)全局匹配函数
实例:
正则表达式常用内容:
a.不能出现空格[^\s]*
b.以.com或者.cn结尾[.com|.cn]
c.任意的字母组合包括大小写[a-zA-Z]
d.匹配电子邮件\w+([.+-]\w+)*@\w+([.-]\w+)*\.\w+([.-]\w+)*
1)re.match(pattern,string,flag)#(正则表达式,源字符,可选参数对应的标志位)
2)全局匹配函数
import re string="apythonhellomypythonhispythonourpythonend" pattern=re.compile(".python.")#预编译 result=pattern.findall(string)#找出符合模式的所有结果 print(result)3)re.sub(pattern,rep,string,max)#(正则表达式,源字符,替换字符,最多替换次数)
实例:
正则表达式常用内容:
a.不能出现空格[^\s]*
b.以.com或者.cn结尾[.com|.cn]
c.任意的字母组合包括大小写[a-zA-Z]
d.匹配电子邮件\w+([.+-]\w+)*@\w+([.-]\w+)*\.\w+([.-]\w+)*
相关文章推荐
- (转)Python爬虫学习笔记(2):Python正则表达式指南
- 黑马程序员_JAVA笔记25——正则表达式
- Python爬虫urllib2笔记(三)之使用正则表达式提取百度贴吧网页中的楼主发的图片
- [python自学笔记]正则表达式和爬虫案例
- Python笔记2--正则表达式与爬虫案例
- Python 爬虫学习笔记之正则表达式
- 黑马程序员_温习 正则表达式 (个人笔记)摘要(正则表达式-----网页爬虫)
- java 爬虫中的正则表达式(笔记)
- 爬虫笔记1-正则表达式
- day25正则表达式,匹配,切割,替换。获取。网页爬虫
- python爬虫之正则表达式学习笔记一
- 【iOS开发笔记25/50】:正则表达式
- Python学习笔记 第二部分 - 正则表达式 与 爬虫小实例(抓取豆瓣电影中评分大于等于8分的影片)
- Scrapy爬虫系列笔记之三:正则表达式,url去重策略以及遍历算法_by_书訢
- Python 爬虫学习笔记之正则表达式
- 【转】【Python学习笔记】正则表达式
- 正则表达式 学习笔记
- 芝麻HTTP: Python爬虫入门之正则表达式
- JavaScript 学习笔记 六 正则表达式《一》
- Python爬虫入门七之正则表达式