python爬虫:正则表达式
2016-04-29 00:48
387 查看
符号:
. : 匹配任意字符(类似占位符,多少个.就表示多少个字符),换行符除外(与re.S相反)
*:匹配前面一个字符0次或无限次
?:匹配前面一个字符0次或1次
组合:
.* : 贪心算法 一次匹配尽多
.*? :非贪心算法 匹配少量多次
() :括号内的数据作为返回结果
(.*?) :需要查找的内容 最常用
方法:
findall : 匹配所有符合规律的内容,返回包含结果的列表;
Search: 匹配并提取第一个符合规律的内容,返回一个正则表达式的对象(object)
Sub:替换复合规律的内容返回替换后的值
import re
text='''adsAlandadf
1123sdsdaasds'''
d = re.findall('ads(.*?)dadf',text,re.S) #re.S代表匹配换行符后的下一行
. : 匹配任意字符(类似占位符,多少个.就表示多少个字符),换行符除外(与re.S相反)
*:匹配前面一个字符0次或无限次
?:匹配前面一个字符0次或1次
组合:
.* : 贪心算法 一次匹配尽多
.*? :非贪心算法 匹配少量多次
() :括号内的数据作为返回结果
(.*?) :需要查找的内容 最常用
方法:
findall : 匹配所有符合规律的内容,返回包含结果的列表;
Search: 匹配并提取第一个符合规律的内容,返回一个正则表达式的对象(object)
Sub:替换复合规律的内容返回替换后的值
import re
text='''adsAlandadf
1123sdsdaasds'''
d = re.findall('ads(.*?)dadf',text,re.S) #re.S代表匹配换行符后的下一行
相关文章推荐
- python字符串,元组,列表,集合的基础总结
- Python time模块学习
- python实现的一个简单web应用
- wxPython安装
- python基础学习04(死循环)
- Python处理海量手机号码
- 简单学习Python time模块
- python中私有函数调用方法解密
- Python松散正则表达式用法分析
- Python过滤列表用法实例分析
- Python中绑定与未绑定的类方法用法分析
- Python中操作符重载用法分析
- Python实现简单字典树的方法
- Python二叉搜索树与双向链表转换实现方法
- Python实现包含min函数的栈
- Python+Opencv识别两张相似图片
- Python批量修改文本文件内容的方法
- python通过thrift方式连接hive
- python中的Queue与多进程(multiprocessing)
- 利用Python的PIL库进行简单的图像处理