初学python爬虫,记录一下学习过程,requests xpath提取图片地址并保存图片
2020-03-06 15:27
1271 查看
系统练习requests xpath提取图片并保存本地
''' requests库请求目标网址 xpath提取网页的图片地址 面向函数编程 ''' #导入第三方库 import requests from lxml import etree #定制请求头 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763'} def get_html(url): #目标网页如果以 .text()方式输出文本,则出现乱码,故采用UTF-8方式输出网页文本 html = requests.get(url,headers = headers).content.decode('utf-8') return html def paser_html(html): #新建空列表,用于存放提取图片的url地址 images_url = [] #xpath库解析网页,提取图片地址 e = etree.HTML(html) #xpath解析语法 images_list = e.xpath('//li[@class="image-box"]/a/img/@data-echo') #遍历输出图片地址 for image in images_list: images_url.append(image) return images_url #定义保存图片函数 def save_image(images_url): #循环遍历图片地址 for image_url in images_url: #请求每一个url r = requests.get(image_url,headers = headers) #定义每一个图片的名称 file_name = image_url.split('/')[-1] #保存图片 with open(file_name,'wb') as f: f.write(r.content) #定义主函数 def main(): url = 'https://www.yeitu.com/meinv/xinggan/' html = get_html(url) images_url = paser_html(html) save_image(images_url) main()
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- 初学python爬虫,记录一下学习过程,requests xpath 提取图片并保存02
- 初学python爬虫,记录一下学习过程,requests xpath os 提取MM图片并保存本地 03
- Python爬虫学习记录(1)——百度贴吧图片下载
- python爬虫学习过程中遇到的问题记录
- 【Python3.6爬虫学习记录】(四)爬取百度贴吧某帖子内容及图片
- 萌新的Python学习日记 - 爬虫无影 - 使用BeautifulSoup + urlretrieve 抓取并保存图片:weheartit
- Python爬虫学习记录(3)——用Python获取虾米加心歌曲,并获取MP3下载地址
- python学习过程中的知识点,记录一下
- 《零基础入门学习Python》学习过程笔记【54用python保存一张网站上的图片】
- 【Python3.6爬虫学习记录】(三)简单的爬虫实践-豆瓣《河神》演员图片及姓名
- 【Python3.6爬虫学习记录】(一)爬取简单的静态网页图片
- python学习记录19--给自己:python爬虫阶段爬取图片文章
- python爬虫:下载百度贴吧图片(多页)学习笔记
- 学习Erlang过程中碰到的错误,记录一下
- Python爬虫学习记录(4)——传说中的足彩倍投法。。好像也不是那么靠谱
- Python之BeautifulSoup学习之三 读取本地html文件,并将其中图片保存下来
- python学习(4):python爬虫入门案例-爬取图片
- python 爬虫的学习记录--《crifan大神的教程》
- python学习:urllib库学习:制作简易爬虫下载图片