您的位置：首页 > 运维架构

Pandas之drop_duplicates：去除重复项

2017-11-17 11:15 330 查看

方法

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数

这个drop_duplicate方法是对DataFrame格式的数据，去除特定列下面的重复行。返回DataFrame格式的数据。

subset : column label or sequence of labels, optional

用来指定特定的列，默认所有列

keep : {‘first’, ‘last’, False}, default ‘first’

删除重复项并保留第一次出现的项

inplace : boolean, default False

是直接在原来数据上修改还是保留一个副本

实验

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： pandas numpy

相关文章推荐

Pandas之drop_duplicates:去除重复项方法
在pandas中，使用frame.drop_duplicates(['state'])去掉多属性数据中重复行
Pandas之drop_duplicates：去除重复项
remove-duplicates-from-sorted-list I&II——去除链表中重复项
remove-duplicates-from-sorted-array-ii——去除重复
删除重复元素 drop_duplicates()
pandas库中drop_duplicates的小问题
pandas.DataFrame.drop_duplicates后面inplace=True与inplace=False的区别
pandas drop_duplicates
pandas.DataFrame.drop_duplicates后面inplace=True与inplace=False的区别
mysql中distinct去除重复值方法
java练习2:去除容器（ArrayList）中重复的元素
Java去除集合List内重复记录
去除postfix群组重复邮件
java小算法—去除字符串重复字符
SQL 去除表中的重复列
JAVA HashSet 去除重复值原理
自我整理：去除List<String[]>中String[x]中重复的记录
sql 去除重复记录
ArrayList去除集合中自定义对象元素的重复值

新的分享

新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
民生银行日接入量15T的ELK日志平台（Apollo+ES源码改造） - 运维
邱盛昌：OPPO商业化数据体系建设实战
一篇吃透监控系统：常用组合方案和主流工具选型 - 运维
DevOps落地成不成，关键不在持续集成？ - 运维
mlops的一些记录
用Prometheus监控K8S，目前最实用的部署方式都说全了（有彩蛋） - 运维
asio 使用 openssl 示例
Netty源码研究笔记（4）——EventLoop系列
许北林：我为什么加入OpenHarmony生态？又为什么要做“启航KP”开发套件？
【直播回顾】OpenHarmony知识赋能五期第五课——多媒体子系统之视频解读
【直播回顾】如何成为一名优秀的OpenHamrony贡献者？

章节导航