python 爬虫下载网站图片
2015-05-20 16:27
841 查看
#coding:utf-8 import os import urllib import re #正则表达式模块 def getHtml(url): page = urllib.urlopen(url) #打开一个URL地址 html = page.read() #读取URL上的数据 return html def getImgs(html): reg = r'src="(.+?\.jpg)" pic_ext' #写一个正则表达式 imgre = re.compile(reg) #编译正则表达式 imglist = re.findall(imgre,html) #读取html中所有包含正则表达式的数据,返回一个list return imglist def download(urllist): x = 1 filepath = "/home/swz/imgdownload/" #if os.path.exists(filepath) is True: #filepath = filepath + "2" os.mkdir(filepath) for imgurl in urllist: #print filepath+'%s.jpg' % x urllib.urlretrieve(imgurl,filepath+'%s.jpg' % x) #将远程数据下载到本地,并对图片进行重命名 x = x + 1 return if __name__ == "__main__": html = getHtml("http://tieba.baidu.com/p/2460150866") urllist = getImgs(html) #print urllist download(urllist)
相关文章推荐
- python自学笔记(8)--Python简单爬虫从网站上下载图片和用第三方库request实现百度翻译
- Python爬虫下载网站上的图片到本地
- Python爬虫小实践:下载妹子图www.mzitu.com网站上所有的妹子图片,并按相册名字建立文件夹分好文件名
- 使用python进行爬虫下载指定网站的图片
- Python爬虫(02)从网站下载图片
- Python爬虫——利用PhantomJS下载动态加载图片
- python爬虫(1)下载任意网页图片
- Python 爬虫5——爬取并下载网页指定规格的图片
- python小爬虫—抓取pixabay网站的图片资源
- python 爬虫 网络小说下载(静态网站)
- python实现爬虫下载美女图片
- Python爬虫(二)图片下载爬虫
- 网络爬虫之网站图片爬取-python实现
- python爬虫:从页面下载图片以及编译错误解决。
- python利用urllib实现爬取京东网站商品图片的爬虫实例
- python爬虫框架scrapy学习图片下载
- python爬虫学习--下载图片
- python学习笔记(8)--爬虫下载占位图片
- Python入门-编写抓取网站图片的爬虫-正则表达式
- python爬取并下载一个俄语植物网站上的图片