用python+selenium获取北上广深成五地PM2.5数据信息并按空气质量排序
2016-12-18 22:33
686 查看
从http://www.pm25.com/shenzhen.html抓取北京,深圳,上海,广州,成都的pm2.5指数,并按照空气质量从优到差排序,保存在txt文档里
代码如下:
生成txt如下:
代码如下:
#coding=utf-8 from selenium import webdriver from time import sleep class PM: def __init__(self): self.dr = webdriver.Chrome() self.pm25_info = self.get_pm25_info() def get_pm25_info(self): city_list = ['beijing','shenzhen','shanghai','guangzhou','chengdu'] pm_info_list = [] i = 0 while i < len(city_list): self.dr.get('http://www.pm25.com/'+city_list[i]+'.html') sleep(3) city_name = self.dr.find_element_by_css_selector('.bi_loaction_city').text #定位城市名字 pm_exp = self.dr.find_element_by_css_selector('.pm25_span').text #定位PM2.5指数 air_num = self.dr.find_element_by_css_selector('.bi_aqiarea_num').text #定位AQI指数 air_quality = self.dr.find_element_by_css_selector('.bi_aqiarea_right span').text #定位空气质量描述 pm_info_list.append((city_name, pm_exp, air_num, air_quality)) i += 1 pm_info_list.sort(key=lambda x:float(x[2])) #按AQI指数排序(AQI指数决定了空气质量的优良) return pm_info_list def get_pm_info_file(self): self.file_title = '北上广深成五地PM2.5数据信息' self.file = open(self.file_title + '.txt', 'wb') self.floor = 1 for item in self.pm25_info: separate_line = '**********' + 'TOP' + str(self.floor) + '**********\n' self.file.write(separate_line.encode('utf-8')) self.file.write(('城市:' + item[0] + '\n' 'PM2.5指数:' + item[1] + ' '+ '微克/立方米' + '\n' 'AQI指数:' + item[2] + '\n' '空气质量:' + item[3]+ '\n').encode('utf-8')) self.floor += 1 self.file.close() def quit(self): self.dr.quit() if __name__ == '__main__': pm_info = PM() pm_info.get_pm_info_file() pm_info.quit()网页如下:
生成txt如下:
相关文章推荐
- 用python+selenium获取北上广深成五地PM2.5数据信息并按空气质量排序
- [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
- python项目:获取微信好友信息(一)抓取微信好友数据
- selenium + python 获取table数据
- 在python使用selenium获取动态网页信息并用BeautifulSoup进行解析--动态网页爬虫
- python获取动态网站上面的动态加载的数据(selenium+Firefox)
- python数据分析1:获取双色球历史信息
- python下利用Selenium获取动态页面数据
- python list排序(正倒)以及获取重复数据
- Android-聚合数据-获取天气状况、空气质量、温度等信息
- python selenium爬虫实践:获取自如租房数据保存到文件
- python结合selenium获取XX省交通违章数据的实现思路及代码
- 获取博客积分排名,存入数据库,读取数据进行绘图(python,selenium,matplotlib)
- Python数据分析练习:北京、广州PM2.5空气质量分析(2)
- [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
- Python爬虫实践:获取空气质量历史数据
- 用python+selenium从百度获取本地明日的天气信息并根据温度情况设置提醒
- python基于selenium+PhantomJS实现用提交表单,并点击按钮功能,获取返回的页面源码和ur等信息l。
- python3实现爬取淘宝页面的商品的数据信息(selenium+pyquery+mongodb)
- python数据分析(1)——获取微信好友的统计信息