gpt4 book ai didi

pandas DataFrame 删除重复的行的实现方法

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 41 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章pandas DataFrame 删除重复的行的实现方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

1. 建立一个dataframe 。

?
1
c = pd.dataframe({ 'a' :[ 'dog' ] * 3 + [ 'fish' ] * 3 + [ 'dog' ], 'b' :[ 10 , 10 , 12 , 12 , 14 , 14 , 10 ]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项 。

用duplicated( )函数判断   。

?
1
c.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项 。

?
1
c.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现).

我们也可以对特定的列进行重复项判断.

?
1
2
3
c.duplicated([ 'a' ])   c.drop_duplicates([ 'a' ])
 
c.duplicated([ 'b' ])   c.drop_duplicates([ 'b' ])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['a_id', 'b_id'], keep='first') 。

#上面的命令去掉unit_id和kpi_id列中重复的行,并保留重复出现的行中第一次出现的行 。

补充:  。

  • 当keep=false时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!) 。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.

原文链接:https://blog.csdn.net/qq_40981268/article/details/86498762 。

最后此篇关于pandas DataFrame 删除重复的行的实现方法的文章就讲到这里了,如果你想了解更多关于pandas DataFrame 删除重复的行的实现方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

41 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com