【教程】记录:python基础爬虫代码(下载妹子福利图片)
2017-06-16 17:49
1091 查看
废话不多说,直接代码复制进去自己观察。
前面import的,就是要安装
re
os
beautifulsoup
注意在本代码同级下创建一个mm文件夹准备放福利
至于网站,是大神给我的网站,我可是纯洁的好孩子。
感觉身体被掏空
前面import的,就是要安装
re
os
beautifulsoup
注意在本代码同级下创建一个mm文件夹准备放福利
至于网站,是大神给我的网站,我可是纯洁的好孩子。
感觉身体被掏空
import requests,re,os from bs4 import BeautifulSoup base_url='http://www.mmjpg.com/home/{page}' def get_url(page): PicSet=set() for i in range(1,page+1,1): print("正在收集第"+ str(i) +"页数据.") url=base_url.format(page=i) resp=requests.get(url) resp.encoding='utf-8' href_pattern=re.compile(r'href="http://www.mmjpg.com/mm/(.*?)"') name_pattern=re.compile(r'alt="(.*?)"') bsObj=BeautifulSoup(resp.text,'lxml') PicUrlList=bsObj.find_all('li',{}) for Pic in PicUrlList: String=str(Pic) page_url=re.findall(href_pattern,String)[0] name=re.findall(name_pattern,String)[0] print("正在收集"+ page_url +"数据") info=(page_url,name) PicSet.add(info) return PicSet def download(picname,picurl): b_url='http://www.mmjpg.com/mm/' url=b_url+picurl resp=requests.get(url) resp.encoding='utf-8' strFind ='class="content"(.*)/></a></div>' StrUrl=re.findall(strFind,resp.text)[0] url=re.findall('src="(.*)1.jpg"',StrUrl)[0] strFind ='class="page"(.*)</a><em ' StrNum=re.findall(strFind,resp.text)[0] num=StrNum[-2:] num=int(num) for n in range(1,num+1,1): img_src=url+str(n)+".jpg" img = requests.get(img_src).content DirPath=os.getcwd()+"\\mm\\" path=DirPath+picname+str(n)+'.jpg' print('正在下载: '+str(n)+'...') with open(path,'wb') as f: f.write(img) page=5 PicPool=get_url(page) print("收集数据完毕,准备下载-----------") sum=1 try: for Pic in PicPool: picurl=Pic[0] picname=Pic[1] print("正在操作第"+ str(sum) +"板块数据=========") download(picname,picurl) sum=sum+1 finally: print('下载停止')
相关文章推荐
- Python爬虫小实践:下载妹子图www.mzitu.com网站上所有的妹子图片,并按相册名字建立文件夹分好文件名
- python爬虫入门教程之糗百图片爬虫代码分享
- python在多玩图片上下载妹子图的实现代码
- python——图片爬虫:爬取爱女神网站(www.znzhi.net)上的妹子图 基础篇
- Python爬虫学习记录(1)——百度贴吧图片下载
- Python练手爬虫系列No.1 知乎福利收藏夹图片批量下载
- python在多玩图片上下载妹子图的实现代码
- python基础===【爬虫】爬虫糗事百科首页图片代码
- python在多玩图片上下载妹子图的实现代码
- python爬虫入门教程之点点美女图片爬虫代码分享
- python爬虫入门教程之点点美女图片爬虫代码分享
- 零基础Python爬虫下载图片 10分钟搞定
- python爬虫入门教程之糗百图片爬虫代码分享
- 【Heritrix基础教程之4】开始一个爬虫抓取的全流程代码分析
- 零基础写python爬虫之抓取糗事百科代码分享
- 【Heritrix基础教程之4】开始一个爬虫抓取的全流程代码分析
- 使用Python下载Bing图片(代码)
- python shell 爬虫 妹子图片
- 零基础写python爬虫之抓取百度贴吧代码分享
- python中使用网络爬虫下载图片