您的位置:首页 > 编程语言 > Python开发

python3抓取Bing主页背景图片

2017-03-26 22:30 519 查看
前不久才接触python语言,随着学习的加深,才接触到爬虫这个东西。以前就听过实用工具就可以下载bing首页的背景图片,然后设置成墙纸,但一直不清楚是怎么实现的,现在才知道用python语言很容易据可以实现。网上找了很多,大多都是python2的,有些模块用不了,所以就用python3试了下,结果很满意。

通过观察,首页图片都是通过一个js加载的,http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1&nc=1490537646012&pid=hp&video=1

idx=0表示第一站,可以更改数字,n必须等于1,否则就加载不了,后面的值就随便了。



打开这个链接就可以看到图片的真正地址





#!/usr/bin/python3
# coding:utf-8
# python3抓取bing主页所有背景图片


import urllib.request,re,sys,os

def get_bing_backphoto():
if (os.path.exists('pictures')== False):
os.mkdir('pictures')        #设置图片下载路径,默认是文件的当前路径

for i in range(0,10):
url = 'http://cn.bing.com/HPImageArchive.aspx?format=js&idx='+str(i)+'&n=1&nc=1361089515117&FORM=HYLH1'
html = urllib.request.urlopen(url).read()

if html == 'null':
print( 'open & read bing error!')
sys.exit(-1)

html = html.decode('utf-8')
html = html.replace('/az/','http://cn.bing.com/az/')
reg = re.compile('"url":"(.*?)","urlbase"',re.S)
text = re.findall(reg,html)

for imgurl in text :
right = imgurl.rindex('/')
print(imgurl)
name = imgurl.replace(imgurl[:right+1],'')
savepath = 'pictures/'+ name
urllib.request.urlretrieve(imgurl, savepath)
print (name + ' save success!')

get_bing_backphoto()


下面有图有真相!

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: