您的位置:首页 > 编程语言 > Python开发

python学习记录19--给自己:python爬虫阶段爬取图片文章

2019-04-01 22:31 537 查看

1.平时我们在网上浏览下载东西的时候通常有这几个步骤:

用户收到信息后:提取有用数据--->保存数据

  • 那么爬虫在这里都做了什么工作呢?

A: 她代替了浏览器和服务器的工作,用户只要输入关键信息通过爬虫就可完成:浏览器与服务器的交互---->解码数据---->提取数据---->储存数据

2.使用爬虫在互联网上爬取图片和文章

  • 首先需要一个自己的浏览器安装一个requests模板:打开dos命令输入(pip install requests)

若出现版本不对应问题需要更新的报错问题:可使用管理员权限打开dos输入pip install requests可解

①爬取图片

[code]import requests

res = requests.get('http://b-ssl.duitang.com/uploads/item/201809/14/20180914140434_tyswq.jpg')
#requests.get()函数获取想要下载的图片地址
photo = res.content
#res.content()函数将获取到的图片数据转换成二进制
img = open('zyl.jpg','wb')
#将获取到的图片以‘zyl.jpg’这个名字保存,以‘wb’方式读写(打开文件)
img.write(photo)
#将photo得到的数据写入img(写文件)
img.close()
#关闭文件

②爬取文章

[code]import requests
res = requests.get('https://www.qisuu.la/du/24/24704/9220420.html')
res.encoding='utf-8'
#解码方式自定义为utf-8
novel = res.text
book = open('白夜行.txt','a+')
#将文件命名为'白夜行.txt',保存方式‘a+’追加方式
book.write(text)
book.close()

 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐