十分钟学会十几行代码爬取豆瓣top250电影并且写入csv文件(非常简单)
2020-03-25 19:03
239 查看
方法与库
所用的库是request_html,用过request_html库都知道这个库是真的好用,比beautifulsoup+request的组合好用多了,第二是csv,因为我们要写入嘛,话不多说上代码!
from requests_html import HTMLSession import csv session = HTMLSession() kv={'user-agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36', } csv_file = open('豆瓣top250.csv','w',newline='') csv_writer = csv.writer(csv_file) csv_writer.writerow(['名称','评分','简短介绍']) #print("{:^10}{:^15}\t{:^20}\t{:^20}".format("排名","电影名称","豆瓣评分","简短介绍")) for j in range(0,245,25): r = session.get('https://movie.douban.com/top250?start={}&filter='.format(j),headers = kv) for i in range(1,26): film_name = r.html.find('#content > div > div.article > ol > li:nth-child({}) > div > div.info > div.hd > a > span.title'.format(i),first = True).text film_score = r.html.find('#content > div > div.article > ol > li:nth-child({}) > div > div.info > div.bd > div > span.rating_num'.format(i),first = True).text film_interest_words = r.html.find('#content > div > div.article > ol > li:nth-child({}) > div > div.info > div.bd > p.quote > span'.format(i),first = True).text #print["{:^10}\t{:^15}\t{:^20}\t{:^20}".format(str(a),film_name,film_score,film_interest_words)for a in range(1,245)] csv_writer.writerow([film_name,film_score,film_interest_words]) print('爬取成功!')
这里的选择器是css选择器,request_html还提供xpath选择,看你习惯用哪一种咯
效果如下:
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- 爬取豆瓣电影信息,再将豆瓣信息写入csv文件和mongodb数据库,再进行数据分析
- java读取文件和写入文件的简单代码
- golang 简单爬虫,245行代码爬取豆瓣电影电视剧等信息并保存到excel
- Python 插值代码实现并将数据多列写入csv文件
- JAVA 一个简单的文件写入代码(遍历文件夹获取所有文件、写入缓冲池、获取文件绝对路径、按后缀名过滤文件)
- C#使用读写锁三行代码简单解决多线程并发写入文件时线程同步的问题
- 爬虫豆瓣电影top250代码和收获
- C#使用读写锁三行代码简单解决多线程并发写入文件时线程同步的问题
- python爬虫|爬取豆瓣电影TOP250并写入txt中
- NanShan 一段非常简单的文件查询代码
- FindFirstFile FindNextFile FindFiles 文件查找非常简单的代码
- Python3爬虫豆瓣电影TOP250将电影名写入到EXCEL
- Java-流的简单使用:读取文件、写入文件(面试题:删除注释代码)
- C# 解析 Excel 并且生成 Csv 文件代码分析
- 80 行代码爬取豆瓣 Top250 电影信息并导出到 CSV 及数据库
- python3将csv文件中的两列数据读取出来,并且按行写入txt文本之中
- 练习---将爬取的豆瓣TOP250书籍存储到csv文件中
- 简单代码生成csv文件(excel)
- python读取与写入csv格式文件的示例代码
- Python爬虫学习笔记(2) _豆瓣电影TOP250(2)爬取详细数据,保存为CSV文件【urllib、request、bs4、error、CSV】