python 抓取网上的图片。
2014-08-04 06:24
169 查看
最近由于个和的兴趣,开始学习python 昨天看了百度教育关于python抓取网上图片的教程,自己仿写了一段。记录下来,作为自己第一python程序 。也是自己的写的第一个程序 。
import urllib2
import urllib
mmurl="http://mm.taobao.com/json/request_top_list.htm?type=0&page=" #淘宝网上的地址,page后面不同的数字,代表不同的页面。
i=1
while i<5:#抓取范围,第一页到第五页
url=mmurl+str(i)#组装地址
con=urllib2.urlopen(url).read()#打开地址,把目录页面的所有内容取回本地。
ca=con.find('a href=')
ce=con.find('.htm')
pic= con[ca+8:ce+4]#在目录页面中查找出每个位置的单独地址。
picpage=urllib2.urlopen(pic).read() #取回单独地址的所有内容。
#print picpage
imge=".jpg"
pica=picpage.find("<img style")
pice=picpage.find(imge)
mpic= picpage[pica:]
#print mpic
print'----'*10
ips = mpic.find("src=")
ipe =mpic.find(".jpg")
urlpic=mpic[ips+5:ipe+4]#查询出图片的地址。
print urlpic
urllib.urlretrieve(urlpic,"pic\\aa"+str(i)+".jpg")#把图片保存到本地。
i+=1
教程上,第一个图片和第二个图片内容是一样的,因为是淘宝页面中,第0页和第1页是同一内容。
教程上,都只抓取了第一个页面的第一个图片,那时因为find 只是查询第一个符合条件的内容。要查询全部,需要用re.findall,需要使用正则表达式。
import urllib2
import urllib
mmurl="http://mm.taobao.com/json/request_top_list.htm?type=0&page=" #淘宝网上的地址,page后面不同的数字,代表不同的页面。
i=1
while i<5:#抓取范围,第一页到第五页
url=mmurl+str(i)#组装地址
con=urllib2.urlopen(url).read()#打开地址,把目录页面的所有内容取回本地。
ca=con.find('a href=')
ce=con.find('.htm')
pic= con[ca+8:ce+4]#在目录页面中查找出每个位置的单独地址。
picpage=urllib2.urlopen(pic).read() #取回单独地址的所有内容。
#print picpage
imge=".jpg"
pica=picpage.find("<img style")
pice=picpage.find(imge)
mpic= picpage[pica:]
#print mpic
print'----'*10
ips = mpic.find("src=")
ipe =mpic.find(".jpg")
urlpic=mpic[ips+5:ipe+4]#查询出图片的地址。
print urlpic
urllib.urlretrieve(urlpic,"pic\\aa"+str(i)+".jpg")#把图片保存到本地。
i+=1
教程上,第一个图片和第二个图片内容是一样的,因为是淘宝页面中,第0页和第1页是同一内容。
教程上,都只抓取了第一个页面的第一个图片,那时因为find 只是查询第一个符合条件的内容。要查询全部,需要用re.findall,需要使用正则表达式。
相关文章推荐
- Python程序员闲暇时的写的网上抓取美女图片,真是缺女票!
- Python程序员闲暇时的写的网上抓取美女图片,真是缺女票!
- 抓取bing图片的Python代码
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- python网络爬虫抓取图片
- python抓取百度贴吧高清图片
- java网上抓取图片
- 线程池练习——网上图片抓取
- python抓取豆瓣妹子图片并上传到七牛
- Python通过代理多线程抓取图片
- python爬虫抓取图片
- 百度贴吧图片抓取工具(Python)
- python实现美空图片抓取机器人
- Python抓取图片
- Python数据抓取(抓图片)
- python抓取网页图片
- Python 抓取图片
- python抓取网页图片
- Python urllib2递归抓取某个网站下图片
- python抓取网页图片