python学习记录19--给自己:python爬虫阶段爬取图片文章
2019-04-01 22:31
537 查看
1.平时我们在网上浏览下载东西的时候通常有这几个步骤:
用户收到信息后:提取有用数据--->保存数据
- 那么爬虫在这里都做了什么工作呢?
A: 她代替了浏览器和服务器的工作,用户只要输入关键信息通过爬虫就可完成:浏览器与服务器的交互---->解码数据---->提取数据---->储存数据
2.使用爬虫在互联网上爬取图片和文章
- 首先需要一个自己的浏览器安装一个requests模板:打开dos命令输入(pip install requests)
若出现版本不对应问题需要更新的报错问题:可使用管理员权限打开dos输入pip install requests可解
①爬取图片
[code]import requests res = requests.get('http://b-ssl.duitang.com/uploads/item/201809/14/20180914140434_tyswq.jpg') #requests.get()函数获取想要下载的图片地址 photo = res.content #res.content()函数将获取到的图片数据转换成二进制 img = open('zyl.jpg','wb') #将获取到的图片以‘zyl.jpg’这个名字保存,以‘wb’方式读写(打开文件) img.write(photo) #将photo得到的数据写入img(写文件) img.close() #关闭文件
②爬取文章
[code]import requests res = requests.get('https://www.qisuu.la/du/24/24704/9220420.html') res.encoding='utf-8' #解码方式自定义为utf-8 novel = res.text book = open('白夜行.txt','a+') #将文件命名为'白夜行.txt',保存方式‘a+’追加方式 book.write(text) book.close()
相关文章推荐
- Python爬虫学习记录(1)——百度贴吧图片下载
- 【Python3.6爬虫学习记录】(四)爬取百度贴吧某帖子内容及图片
- 记录自己python爬虫的学习
- 【Python3.6爬虫学习记录】(二)使用BeautifulSoup爬取简单静态网页文章
- 【Python3.6爬虫学习记录】(一)爬取简单的静态网页图片
- 【Python3.6爬虫学习记录】(三)简单的爬虫实践-豆瓣《河神》演员图片及姓名
- Python爬虫学习记录(1)——Xiami全站播放数
- python学习笔记(一)爬虫实战:图片自动下载器
- [Python学习] 简单网络爬虫抓取博客文章及思想介绍
- 准备开始写文章来记录自己的学习过程
- 【Python3.6爬虫学习记录】(十三)在阿里云服务器上运行爬虫
- 萌新的Python学习日记 - 爬虫无影 - 使用BeautifulSoup + urlretrieve 抓取并保存图片:weheartit
- Python爬虫学习记录(3)——用Python获取虾米加心歌曲,并获取MP3下载地址
- Python 爬虫学习 糗事百科 纯属敦促自己学习
- 知道csdn 的存在,开通博客,记录自己学习python经历的小发现及历程
- caffe学习系列:制作自己的图片的leveldb(python,windows环境下)
- 关于Python爬虫自己学习进步2(通用爬虫,聚焦爬虫)
- python爬虫 学习 京东页面、亚马逊访问|、百度搜索、网上爬取图片 DAY2
- 【Python3.6爬虫学习记录】(六)urllib详细使用方法(header,代理,超时,认证,异常处理)
- python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息,抓取政府网新闻内容