您的位置:首页 > 编程语言 > Python开发

pandas做数据的清洗

2017-05-05 19:29 204 查看
    转换之后的经纬度的数据出现很多的问题,重复,特殊值,,,所以我就是做了一个简单的清洗使用 Python里面的pandas。

#coding:utf8
import pandas as pd
import numpy as np
# import csv
df = pd.read_csv(r'D:\MobileFile\fangjia2.csv', encoding='gbk')#读取房价文件
df2 = pd.DataFrame(df)#数据传入
df3 = df2.replace(df2[df2['jiage']<2000],np.nan)#找出jiage里面2000以下的数据替换为空
df4 = df3.dropna(how='any')#删除为空值的行
df5 = df4.drop_duplicates()#去重
print df5.duplicated()#显示是否重复
df5.to_csv(r'D:\MobileFile\fangjia5.csv',encoding='utf-8')#存储新的csv文件
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息