北京雾霾数据分析
2017-01-10 19:39
381 查看
2016年北京雾霾数据初步分析
最近拿到了美国人收集的北京PM2.5指数数据,数据是从2008年到2016年每小时的pm2.5浓度值。这学期零零散散学习了一些python下pandas的数据分析,正好可以用来试试手,试着分析一下雾霾数据,在试着做做预测。首先,先将数据怼进来,然后做一下简单处理,除去异常值(小于0)的数值。
import pandas as pd
DataSet2016 = pd.read_csv('G:/数据集/北京雾霾数据08-16/Beijing_2016_HourlyPM25_created20170103.csv')
DataSet2016_clear = DataSet2016[DataSet2016['Value']>=0]
ValueList = DataSet2016_clear['Value']
ValueList.index = DataSet2016_clear['Date (LST)']
ValueList.plot()
DataSet2016_clear['Date (LST)'] = pd.to_datetime(DataSet2016_clear['Date (LST)'])
DataSet2016_clear = DataSet2016_clear.set_index(['Date (LST)'])
可以看到,除了个别天爆表,其他的还都在可控范围内嘛。。。
下面是按月,天,小时,星期平均分析
#按月分析
Data_Monthly = DataSet2016_clear.groupby(['Month']).mean()
Value_Monthly = Data_Monthly['Value']
Value_Monthly.plot(kind = 'bar')
#按天分析
Data_Daily = DataSet2016_clear.groupby(['Day']).mean()
Value_Daily = Data_Daily['Value']
Value_Daily.plot(kind = 'bar')
#按小时分析
Data_Hourly = DataSet2016_clear.groupby(['Hour']).mean()
Value_Hour = Data_Hourly['Value']
Value_Hour.plot(kind = 'bar')
#按星期分析
DataSet2016_clear['Week'] = DataSet2016_clear.index.weekday
Data_WeekDay = DataSet2016_clear.groupby(['Week']).mean()
Value_weekday = Data_WeekDay['Value']
Value_weekday.plot(kind = 'bar')
可见,雾霾指数还是跟星期几有较强关系
相关文章推荐
- 自制数据挖掘工具分析北京房价 (二) 数据清洗
- 十张数据图回顾雾霾,北京污染从南向北加深趋势明显
- 【分享】舆情事件分析(北京雾霾事件985篇)
- 北京汉传佛寺游人评价数据的抓取与分析(1)
- 如何用Python爬取分析北京二手房数据?
- Python数据分析练习:北京、广州PM2.5空气质量分析(2)
- Android项目-智慧北京:02(三种技术设计主页面及源码分析点击事件传递的机制及Json数据传递的使用)
- 数据挖掘工具分析北京房价 (一) 数据爬取采集(转)
- 北京数据分析师行业数据分析
- 数据挖掘工具分析北京房价 (一) 数据爬取采集
- 北京汉传佛寺游人评价数据的抓取与分析(2)
- 【MOOC】Python数据分析与展示-北京理工大学-【第二周】数据分析之展示
- 大数据分析中国冬季重度雾霾的成因(三)
- 网站流量的数据统计和分析
- 国内开展PHS数据与增值业务特点分析
- 数据挖掘的价值:寿险行业数据挖掘应用分析
- Linux中数据结构的分析——原创 转载请通知
- GIF LZW数据分析
- 寿险行业数据挖掘应用分析
- 网站流量的数据统计和分析