爬虫代码,正则表达,下载图片
2017-10-23 17:25
162 查看
#coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("http://tieba.baidu.com/p/2460150866") print getImg(html)
re.compile() 可以把正则表达式编译成一个正则表达式对象.
re.findall() 方法读取html 中包含 imgre(正则表达式)的数据。
这里的核心是用到了urllib.urlretrieve()方法,直接将远程数据下载到本地。
相关文章推荐
- PHP通过正则表达式下载图片到本地的实现代码
- 第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)补充: Java正则表达式Matcher.group(int group)相关类解析
- php中通过正则表达式下载内容中的远程图片的函数代码
- 【教程】记录:python基础爬虫代码(下载妹子福利图片)
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)补充正则:java Pattern和Matcher详解
- Flask实现图片的上传、下载及展示示例代码
- 爬虫实践---电影排行榜和图片批量下载
- 纯代码系列:Python实现验证码图片(PIL库经典用法用法,爬虫12306思路)
- 简单爬虫源码,下载指定网页所有图片
- python网络爬虫爬取图片代码
- 爬虫代码实现三:打通爬虫项目的下载、解析、存储流程
- [置顶] Android开发之java代码工具类。判断当前网络是否连接并请求下载图片
- 【实例】爬虫:下载图片
- python爬虫(1)下载任意网页图片
- 响应鼠标点击的代码实现了在单独线程中下载图片并在ImageView显示
- java网页正则表达式爬虫(用纯java代码在相应的网页中查看自己想要的内容)