Python采集网页时正则表达式匹配换行符的问题
2017-10-11 16:26
483 查看
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下: p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思
[\s\S]
\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
相关文章推荐
- Python从文件中读取字符串,用正则表达式匹配中文字符的问题
- Python 匹配任意字符(包括换行符)的正则表达式写法
- Python:正则表达式匹配任意字符(包括换行符)的写法
- Python中正则表达式对中文的匹配问题
- Python中的正则表达式匹配中文问题
- Python:正则表达式匹配任意字符(包括换行符)的写法
- python正则表达式中的括号匹配问题
- python入门—2常见问题_1_正则表达式匹配中文
- Python中正则表达式对中文的匹配问题
- Python网络爬虫中的网页中文正则表达式匹配小心得
- Python 匹配任意字符(包括换行符)的正则表达式写法
- python正则表达式中的括号匹配问题
- Python 匹配任意字符(包括换行符)的正则表达式写法
- Python中正则表达式对中文的匹配问题
- Python中正则表达式对中文的匹配问题
- python里使用正则表达式来替换匹配成功的组名
- Python 正则表达式匹配字符串替换、格式修改
- PHP采集天猫商品列表,正则表达式匹配店铺名称和商品ID
- Python正则表达式匹配ip地址实例
- 关于正则表达式匹配任意字符(包括换行符)的写法