Python对多属性的重复数据去重实例
2018-04-18 15:26
1086 查看
1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;
2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。
注释:
如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。
具体实例如下:
>>> import pandas as pd >>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} >>> frame=pd.DataFrame(data) >>> frame pop state 0 a 1 1 b 1 2 c 2 3 d 2 >>> IsDuplicated=frame.duplicated() >>> print IsDuplicated 0 False 1 False 2 False 3 False dtype: bool >>> frame=frame.drop_duplicates(['state']) >>> frame pop state 0 a 1 2 c 2 >>> IsDuplicated=frame.duplicated(['state']) >>> print IsDuplicated 0 False 2 False dtype: bool >>>
以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
您可能感兴趣的文章:
相关文章推荐
- 【python】详解类class的属性:类数据属性、实例数据属性、特殊的类属性、属性隐藏(二)
- python 类属性 、实例属性,可变数据结构作为类属性需要注意的地方
- Python对多属性的重复数据去重
- 【再回首Python之美】【类】类数据属性和实例数据属性的基本使用
- Python对多属性的重复数据去重
- python 详解类class的属性:类数据属性、实例数据属性、特殊的类属性、属性隐藏(二)
- python之类属性和实例对象属性
- Python:类属性,实例属性,私有属性与静态方法,类方法,实例方法
- python从ftp下载数据保存实例
- Python 处理数据的实例详解
- objective-C学习笔记(三)数据成员:属性与实例变量
- 第六种方式,python使用cached_property缓存装饰器和自定义cached_class_property装饰器,动态添加类属性(三),selnium webdriver类无限实例化控制成单浏览器。
- Python——类属性/实例属性
- python中的类属性与实例属性
- Python:类属性,实例属性,私有属性与静态方法,类方法,实例方法
- python类:class创建、数据方法属性及访问控制详解
- 注册或者点击按钮时,怎么防止用户重复提交数据(实例讲解)
- 【python】详解类class的通过__slots__限制类实例对象的属性(七)
- 在pandas中,使用frame.drop_duplicates(['state'])去掉多属性数据中重复行
- Python利用pandas计算多个CSV文件数据值的实例