您的位置:首页 > 编程语言 > Python开发

python写个图片爬虫

2016-03-25 08:50 483 查看
[root@MGServer pythonscript]# vim getimg.py
#!/usr/bin/python
#encoding:utf8
import requests,sys,re
#定义一个方法,获取网站图片,并下载
def getimg(url):
#请求url内容
page=requests.get(url)
#获取内容
pagetext=page.content
#定义正则表达式。
reg=r'src=.*?\.jpg'
#对获取的内容进行匹配
imglist=re.findall(reg,pagetext)
#为保存的图片文件命名
imgname=1
#循环获取带有src的url地址列表
for x in imglist:
#删除url中的前面src=字段
x=x.lstrip('src="')
try:
#下载图片
img=requests.get(x)
#打开文件,由于imgname是用int递增,所以要使用str把imgname变成str。
of=open('/root/'+str(imgname)+".jpg",'wb')
#保存文件
of.write(img.content)
#关闭文件打开操作
of.close()
#文件名递增
imgname+=1
except IOError,e:
print "url is error:"+str(e)
#sys.exit(1)
#发生错误忽略
pass
#执行定义的函数
getimg(sys.argv[1])
执行方法:
python getimg.py http://www.163.com
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  爬虫 requests pthon