Python3 爬虫下载指定页面图片
2016-09-05 11:57
567 查看
Python3.X
Python2.X
#coding=utf8 import re import urllib.request def getHtml(url): page = urllib.request.urlopen(url) html = page.read().decode('latin-1').encode('utf-8').decode('utf-8') #html = page.read() #html = html.decode('gbk') page.close() return html def getImg(html): reg = r'src="(.*?\.jpg)" width' imgre = re.compile(reg) imglist = re.findall(imgre, html) n = 0 for imgurl in imglist: if 'http' in imgurl: print(imgurl) urllib.request.urlretrieve(imgurl, '%s.jpg' % n) n += 1 html = getHtml('http://www.123.com/index.html') getImg(html)
Python2.X
#coding=utf8 import re import urllib def getHtml(url): page = urllib.urlopen(url) #获取的是一个页面对象 html = page.read() #读取出来的是html代码 return html def getImg(html): reg = r'src="(.*?\.jpg)" width' imgre = re.compile(reg) #编译是为了让正则执行得更快 imglist = re.findall(imgre,html) n = 0 for imgurl in imglist: if 'http' in imgurl: print(imgurl) urllib.urlretrieve(imgurl,'%s.jpg' % n) n += 1 html = getHtml('http://www.efeihu.com/sale/index_new.html') getImg(html)
相关文章推荐
- 使用python进行爬虫下载指定网站的图片
- Python下载指定页面上图片的方法
- Python简单知乎爬虫--爬取页面的图片并下载到本地
- python爬虫:从页面下载图片以及编译错误解决。
- python脚本编程:批量下载指定页面图片
- Python 爬虫5——爬取并下载网页指定规格的图片
- 用python下载指定页面静态图片
- Python 爬虫5——爬取并下载网页指定规格的图片
- Python下载指定页面上图片的方法
- Python简单知乎爬虫--爬取页面的图片并下载到本地
- Python爬虫学习记录(1)——百度贴吧图片下载
- python 下载指定网页上得图片
- PHP写的爬虫,爬指定网站页面上的各种图片
- python实现下载指定网址所有图片的方法
- python实现下载指定网址所有图片的方法
- Python爬虫_自动下载图片
- 每天一篇python:简单爬虫下载图片篇
- python实现爬虫下载美女图片
- python 百度贴吧爬虫(下载图片)
- python爬虫图片下载