pandas做数据的清洗
2017-05-05 19:29
204 查看
转换之后的经纬度的数据出现很多的问题,重复,特殊值,,,所以我就是做了一个简单的清洗使用 Python里面的pandas。
#coding:utf8 import pandas as pd import numpy as np # import csv df = pd.read_csv(r'D:\MobileFile\fangjia2.csv', encoding='gbk')#读取房价文件 df2 = pd.DataFrame(df)#数据传入 df3 = df2.replace(df2[df2['jiage']<2000],np.nan)#找出jiage里面2000以下的数据替换为空 df4 = df3.dropna(how='any')#删除为空值的行 df5 = df4.drop_duplicates()#去重 print df5.duplicated()#显示是否重复 df5.to_csv(r'D:\MobileFile\fangjia5.csv',encoding='utf-8')#存储新的csv文件
相关文章推荐
- 利用pandas对数据进行基本清洗
- 【转载】使用pandas进行数据清洗
- 用pandas清洗数据具体步骤(基础篇一)
- pandas数据清洗,排序,索引设置,数据选取方法
- Python数据分析汇总:numpy与pandas,数据清洗
- python中的pandas包的数据清洗能力
- 使用pandas清洗数据(中文字符串的正则使用)
- [数据清洗]- Pandas 清洗“脏”数据(三)
- 数据预处理(1) ——数据清洗 使用python(sklearn,pandas,numpy)实现
- pandas 学习笔记-- 数据清洗和转换
- pandas数据清洗,排序,索引设置,数据选取
- Pandas数据基本操作:清洗,排序
- 小项目-数据处理篇:pandas进行工作相关数据清洗
- Python Pandas、Spark数据清洗
- Pandas 数据处理,数据清洗
- 利用Python Pandas进行数据预处理-数据清洗
- pandas数据清洗,排序,索引设置,数据选取
- [数据清洗]- Pandas 清洗“脏”数据(二)
- 用pandas清洗数据具体步骤(基础篇二)
- 【Pandas-Cookbook】07:数据清洗