您的位置:首页 > 编程语言 > Python开发

python 用正则方法下载图片流程

2018-08-05 17:52 295 查看

1.正则

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子 串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
列目录时,dir .txt或ls .txt中的.txt就不是一个正则表达式,因为这里与正则式的*的含义是不同的。
构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表 达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。
正则表达式是由普通字符(例如字符a到z)以及特殊字符(称为”元字符”)组成的文字模式。模式描
述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配

①导入re模块:import re

②从urllib模块中导入Request,urlopen函数:from urllib.request import Request, urlopen

③正则请求、响应、获取数据:

<1>:Request请求self.url 并设置请求头self.headers
<2>:代码调用urllib库中的urlopen函数打开超链接
<3>:将响应后得到的数据进行解码,使网页源码中的中文显示出来 decode()里面为空时 默认为‘utf-8’

获取的数据结果如下图:

④从数据中获取想要的内容:

⑤控制台输出的结果:

⑥下载的图片保存到本地:

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: