Pandas DataFrames筛选数据
2015-11-28 20:43
489 查看
</pre><span style="font-size:18px">最近突然发现了pandas真实特别好用,实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型(二维)或者Series类型(一维)。今天在百度经验里看到了DataFrame的数据筛选,自己也尝试了下,顺便记录下来。</span><p></p><p><span style="font-size:18px">1.先加载os包,打开一个csv文件,读出其中内容</span></p><p></p><pre name="code" class="python">import os import pandas as pd aqicsv = pd.read_csv("D:\\aqifit_numsum10\\newaqifit.csv")
2.此时的aqicsv为DataFrame格式,可进行describe操作,获得一些统计上的指标
aqicsv["predictaqi_norm1"].describe()
3.可筛选出predictaqi_norm1这一列大于100的行
aqicsv[aqicsv["predictaqi_norm1"]>100]
<span style="font-family: Arial, Helvetica, sans-serif;"></span><pre name="code" class="python"><span style="font-family: Arial, Helvetica, sans-serif;">aqicsv[aqicsv.predictaqi_norm1>100]</span><span style="font-family: Arial, Helvetica, sans-serif;"> </span>
4.可使用&(并)与| (或)实现多条件筛选
aqicsv[(aqicsv["FID"]>37898) & (aqicsv["FID"]<38766) ]
aqicsv[(aqicsv.predictaqi_norm1>150) |(aqicsv.predictaqi_norm1<100) ]
5.如果只需要其中两列数据,而同时利用另外两列进行筛选时可以这样.如果只需要其中的某几列可以写为aqicsv[['FID','x','y']]
aqicsv[['x','y']][(aqicsv.FID >10000) | (aqicsv.predictaqi_norm1 >150)]
6.可用isin方法筛选一些特定值,但要将其写入某一列中
testlist = aqicsv.predictaqi_norm1[:50]
aqicsv['predictaqi_norm1'].isin(testlist)
相关文章推荐
- KVO,NSNotification,delegete及block区别
- Merge Two Sorted Lists
- (第八周项目2)建立链串的算法库
- 南大软院大神养成计划第五天
- 应试教育的死穴,恰在于堵死了孩子“犯错”的空间后感
- Mac环境Android 6.0虚拟机启动黑屏解决办法
- Python解析json
- 制作能够显示数学公式以及进行交互式图形绘制的静态页面
- Backbone事件Events
- html基础代码使用
- 126.Oracle数据库SQL开发之 数据库对象——PLSQL中使用对象
- Android Studio编译大工程报错:java.exe'' finished with non-zero exit value 1 or exit value 2
- PRML 课后题答案 第一章 1.1
- JAVA中的容器
- ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务
- 简单JNI编程实现
- Jira和confluence关联
- 125.Oracle数据库SQL开发之 数据库对象——数据库中使用对象类型
- Oracle数据库基础
- JVM内存区域划分Eden Space、Survivor Space、Tenured Gen,Perm Gen解释