Python初级爬虫(利用多任务协程爬取虎牙MM图片)
2019-04-16 00:17
417 查看
Python多任务协程下载虎牙直播MM图片
# coding = utf-8 import re import gevent from gevent import monkey, pool import time, random import urllib.request monkey.patch_all() def downloader_img(img_url, img_name): """下载图片""" req = urllib.request.urlopen(img_url) img_content = req.read() # 下载图片保存 with open(r"/home/python/Desktop/01_Python基础/day03/正则表达式/photo/mm%s" % img_name, "wb") as f: f.write(img_content) time.sleep(random.random()) def main(): p1 = pool.Pool(10) # 加入协程 # 读取文件 locals_addr = r"/home/python/Desktop/01_Python基础/day03/正则表达式/1.txt" url_txt = open(locals_addr, "r", encoding=" utf-8") url_content = url_txt.read() jpg_lists = re.findall(r"https://.*?\.jpg", url_content) # 正则匹配网页的有效地址 num = 0 list1 = [] # 定义一个列表用来存网址 # 遍历图片列表 for j in jpg_lists: list1.append(gevent.spawn(downloader_img, j, "%d.jpg" % num)) num += 1 gevent.joinall(list1) if __name__ == '__main__': main()
方法
主函数
效果
相关文章推荐
- python初级实战系列教程《一、爬虫之爬取网页、图片、音视频》
- 利用flask构造爬虫接口(python初级)
- python利用urllib实现爬取京东网站商品图片的爬虫实例
- python 爬虫 多任务方式 协程 爬取虎牙美女小姐姐
- 利用Python爬虫批量下载百度图库图片
- 利用Python爬虫实现网页图片批量下载
- Python爬虫——利用PhantomJS下载动态加载图片
- Python爬虫(三)爬淘宝MM图片
- python爬虫:利用Requests和BeautifulSoup爬取百度贴吧多页图片
- 利用python脚本(re)抓取美空mm图片
- python爬虫--利用xpath爬取图片(虚拟机ubuntu16.04)
- 学习小记 - Python爬虫 (3) 利用Python爬取wanimal所有图片
- [Python爬虫] 之二十六:Selenium +phantomjs 利用 pyquery抓取智能电视网站图片信息
- 利用python抓取网页图片
- Python爬虫_自动下载图片
- Python实现基于协程的异步爬虫(一)
- python学习(十七) 爬取MM图片
- python爬虫 抓取图片入门
- Python爬虫抓取网页图片
- python利用urlib2进行简单爬虫实例