您的位置：首页 > 编程语言 > Python开发

python 抓取网上的图片。

2014-08-04 06:24 169 查看

最近由于个和的兴趣，开始学习python 昨天看了百度教育关于python抓取网上图片的教程，自己仿写了一段。记录下来，作为自己第一python程序。也是自己的写的第一个程序。

import urllib2
import urllib
mmurl="http://mm.taobao.com/json/request_top_list.htm?type=0&page=" #淘宝网上的地址，page后面不同的数字，代表不同的页面。
i=1
while i<5:#抓取范围，第一页到第五页
url=mmurl+str(i)#组装地址
con=urllib2.urlopen(url).read()#打开地址，把目录页面的所有内容取回本地。
ca=con.find('a href=')
ce=con.find('.htm')
pic= con[ca+8:ce+4]#在目录页面中查找出每个位置的单独地址。
picpage=urllib2.urlopen(pic).read() #取回单独地址的所有内容。
#print picpage
imge=".jpg"
pica=picpage.find("<img style")
pice=picpage.find(imge)
mpic= picpage[pica:]
#print mpic
print'----'*10
ips = mpic.find("src=")
ipe =mpic.find(".jpg")
urlpic=mpic[ips+5:ipe+4]#查询出图片的地址。
print urlpic
urllib.urlretrieve(urlpic,"pic\\aa"+str(i)+".jpg")#把图片保存到本地。
i+=1

教程上，第一个图片和第二个图片内容是一样的，因为是淘宝页面中，第0页和第1页是同一内容。
教程上，都只抓取了第一个页面的第一个图片，那时因为find 只是查询第一个符合条件的内容。要查询全部，需要用re.findall，需要使用正则表达式。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python 图片

相关文章推荐

新的分享

章节导航