Python爬取中国票房网所有电影片名和演员名字,爬取齐鲁网大陆所有电视剧名称
2017-08-21 16:39
786 查看
爬取CBO中国票房网所有电影片名和演员名字
爬取电视剧名称
如有错误,还请大侠指教一二!
# -*- coding: utf-8 -*- # 爬取CBO中国票房网所有电影片名 import json import requests import time with open("moviename.txt", 'a') as fh: for pn in range(1,320): url = 'http://www.cbooo.cn/Mdata/getMdata_movie?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn) print(url) time.sleep(2) try: result = requests.get(url).text jresult = json.loads(result) movices = jresult.get('pData') for movie in movices: moviename = movie.get('MovieName') print(moviename) fh.write(moviename + "\n") except: print('第'+ str(pn) + '失败!') # 爬取CBO中国票房网所有演员 import json import requests import time with open("moviestar.txt", 'a') as fh: for pn in range(1,2665): url = 'http://www.cbooo.cn/Mdata/getMdate_pList?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn) print(url) time.sleep(2) try: result = requests.get(url).text jresult = json.loads(result) movices = jresult.get('pData') for movie in movices: moviename = movie.get('cnName') print(moviename) fh.write(moviename + "\n") except: print('第'+ str(pn) + '失败!')
爬取电视剧名称
# -*- coding: utf-8 -*- # 爬取所有电视剧名称 # 来源:齐鲁电影网 from bs4 import BeautifulSoup import urllib url = "http://www.qilumovie.com/filmclass-txt/9.html" html = urllib.request.urlopen(url).read() htmldecode = html.decode("gbk") #重点关注 soup = BeautifulSoup(htmldecode,"lxml") body = soup.body maplist = body.find_all("li") with open("tvplay.txt",'a') as fh: for tvl in maplist: tv = tvl.a.text print(tv) fh.write(tv + '\n')
如有错误,还请大侠指教一二!
相关文章推荐
- python抓取几大票房统计系统数据的之艺恩电影数据
- 中国内地最高电影票房收入列表
- 中国电影金融化:一个被杠杆翘高的票房门槛
- Python爬虫-爬取xixizhan.com站点的所有电影列表并写入文件和数据库mysql
- Python-修改文件夹下所有文件的名字
- 基于python实现的抓取腾讯视频所有电影的爬虫
- 基于python实现的抓取腾讯视频所有电影的爬虫
- 从xlrd到csv,提取中国所有大学名称
- 对电影导演、演员、名称几个重要字段建立lucene(线程)及使用
- python 内置的os模块将文件夹下所有图片名称加上指定字符
- python实现去除下载电影和电视剧文件名中的多余字符的方法
- 根据电影名称(支持电视剧名称),获取下载链接。
- Python读取Excel文件统计演员参演电影
- python实现根据主机名字获得所有ip地址的方法
- python自动化,读取文件夹内所有文件名字,并做简单的后缀名匹配
- Python爬虫-爬取 ygdy8.com 站点的所有电影并写入文件和数据库
- 讨厌下载电影和电视剧文件名中的多余字符(如网址和广告字样),搞得文件名好长,可以使用下面的Python代码
- 去除下载电影和电视剧文件名中的多余字符[python实现]
- Python爬取电影天堂指定电视剧或者电影
- python 获取指定文件夹下所有文件名称并写入列表