您的位置:首页 > 编程语言 > Python开发

python 抓取网上的图片。

2014-08-04 06:24 169 查看
最近由于个和的兴趣,开始学习python 昨天看了百度教育关于python抓取网上图片的教程,自己仿写了一段。记录下来,作为自己第一python程序 。也是自己的写的第一个程序 。

import urllib2
import urllib
mmurl="http://mm.taobao.com/json/request_top_list.htm?type=0&page=" #淘宝网上的地址,page后面不同的数字,代表不同的页面。
i=1
while i<5:#抓取范围,第一页到第五页
url=mmurl+str(i)#组装地址
con=urllib2.urlopen(url).read()#打开地址,把目录页面的所有内容取回本地。
ca=con.find('a href=')
ce=con.find('.htm')
pic= con[ca+8:ce+4]#在目录页面中查找出每个位置的单独地址。
picpage=urllib2.urlopen(pic).read() #取回单独地址的所有内容。
#print picpage
imge=".jpg"
pica=picpage.find("<img style")
pice=picpage.find(imge)
mpic= picpage[pica:]
#print mpic
print'----'*10
ips = mpic.find("src=")
ipe =mpic.find(".jpg")
urlpic=mpic[ips+5:ipe+4]#查询出图片的地址。
print urlpic
urllib.urlretrieve(urlpic,"pic\\aa"+str(i)+".jpg")#把图片保存到本地。
i+=1


教程上,第一个图片和第二个图片内容是一样的,因为是淘宝页面中,第0页和第1页是同一内容。
教程上,都只抓取了第一个页面的第一个图片,那时因为find 只是查询第一个符合条件的内容。要查询全部,需要用re.findall,需要使用正则表达式。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 图片