python爬虫练习
2020-03-06 21:12
846 查看
抓取
requests.get()
r.text()
解析
re模块
抓取豆瓣读书《你当像鸟飞往你的山》评论第一页并计算平均评分
import requests from bs4 import BeautifulSoup import re headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'} r=requests.get('https://book.douban.com/subject/33440205/comments/',headers=headers) comment=BeautifulSoup(r.text,'lxml') pattern=comment.find_all('span','short') for item in pattern: print(item.string) points = re.compile('<span class="user-stars allstar(.*?) rating"') p = re.findall(points, r.text) s = 0 count=0 for star in p: s += int(star) count+=1 average=s/count print(s,count,average)
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- Python爬虫练习
- python爬虫有道翻译简单练习
- python爬虫雪球练习
- Python计算机视觉编程练习15:pyspider爬虫--json语法篇
- 练习python爬虫快速初步入门脚本
- python爬虫练习1
- python新手爬虫练习(一)-编写前的准备工作
- Python爬虫练习笔记二
- Python爬虫练习第一章【每60s刷新…
- 学习笔记(01):Python爬虫开发-综合练习之药监总局02
- python爬虫练习--爬上海法院开庭公告信息
- Python爬虫练习第二章【对一个不是…
- Python爬虫练习之二:抓取游民星空搞笑动态图文章链接
- python练习1(简单爬虫)
- Python小爬虫练习
- Getting Started Spidering a Site使用Chilkat(python)练习的一个爬虫(from :http://www.example-code.com)
- python--爬虫入门(八)体验HTMLParser解析网页,网页抓取解析整合练习
- python3-爬虫练习-爬取豆瓣网电影排行
- Python爬虫练习之一:抓取美团数据
- Python爬虫练习第三章【百度URL采…