python爬虫之猫眼视频Top100
2018-08-28 20:47
393 查看
版权声明:如有使用转载,请附加出处 https://blog.csdn.net/jia666666/article/details/82154313
猫眼视频Top100
import requests import re,json from multiprocessing import Pool def get_one_page(url,head): #异常处理 try: #发送请求 response=requests.get(url,headers=head) #判断网页状态码是否成功获取网页 if response.status_code==200: return response.text return None except Exception: #其他返回None return None def parse_one_page(html): #利用正则表达式进行信息过滤 pattern = re.compile('<dd>.*?board-index board-index.*?>(.*?)</i>.*?<a.*?title="(.*?)".*?<img.*?' 'lt.*?src="(.*?)".*?star">(.*?)</p>.*?releasetime">(.*?)' '</p>.*?integer">(.*?)</i>.*?fraction">(.*?)</i>',re.S) #获取筛选后的信息并返回 items=re.findall(pattern,html) return items def write_to_file(items): #写入信息 with open("猫眼电影Top100.txt", 'a+') as f: for item in items: #格式整理 item= "排名"+":"+item[0]+'\n'+\ "电影名称"+':'+item[1]+'\n'+\ "电影封面"+':'+item[2]+'\n'+\ item[3].strip()+'\n'+\ "上映时间"+':'+item[4]+'\n'+\ "评分"+':'+item[5]+item[6]+'\n\n' #写入 f.write(str(item)+'\n') #关闭 f.close() def main(i): #设置UA,模拟浏览器 head = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'} #生成url url = 'http://maoyan.com/board/4?offset=%d'%(i*10) #获取返回的网页 html=get_one_page(url,head) #解析网页,进行信息筛选 items=parse_one_page(html) #信息写入 write_to_file(items) if __name__ == '__main__': print("开始抓取猫眼TOP100电影榜单................") #实例化进程池 pool=Pool() #进程开始 pool.map(main,[i for i in range(10)]) print("抓取完成,已写入文件............")
效果如下
相关文章推荐
- python 爬虫项目-爬取猫眼top100电影
- Python 爬取 猫眼 top100 电影例子
- python 爬虫抓取猫眼电影 top100 源码
- Python爬虫之抓取猫眼电影TOP100
- python爬虫爬取猫眼电影top100
- 【Python简单爬虫设计】对豆瓣TOP100的电影名及简要的爬取
- python 爬虫 正则表达式爬取猫眼电影top100榜
- [原创] Python3.6+request+beautiful 半次元Top100 爬虫实战,将小姐姐的cos美图获得
- python爬虫实战:抓取猫眼电影TOP100存放到MongoDB中
- python3 爬取猫眼榜单top100(requests+beautifulsoup)
- python实战---猫眼榜单:TOP100榜
- Python爬虫之三:抓取猫眼电影TOP100
- 猫眼爬虫Top100
- Python爬取猫眼top100排行榜数据【含多线程】
- 一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
- Python爬虫-爬取猫眼电影Top100榜单
- Python爬虫,用于抓取豆瓣电影Top前100的电影的名称
- python爬虫8——下载视频:you-get工具
- 小白学爬虫——爬取半次元热门榜top100
- python第一只爬虫:爬豆瓣top250