gpt4 book ai didi

python - 删除列中的重复值,保留行

转载 作者:行者123 更新时间:2023-12-01 09:28:25 24 4
gpt4 key购买 nike

我遇到了类似于删除重复项的问题,但我需要保留具有重复值的行。所以本质上,我需要保留第一个值,然后用 '' 替换它的每个重复值。

Col1    Col2
a 1
b 1
c 1
d 2

我需要的是:

Col1     Col2 
a 1
b
c
d 2

谢谢。

最佳答案

使用duplicated将值替换为空字符串 - 但获得混合值 - 数字与字符串,因此某些函数应该失败。更好的方法是替换为 NaN,尽管整数会转换为浮点型。

df.loc[df['Col2'].duplicated(), 'Col2'] = '' 
#if want numeric column
#df.loc[df['Col2'].duplicated(), 'Col2'] = np.nan

更快的替代方案:

df['Col2'] = np.where(df['Col2'].duplicated(), '', df['Col2'])
<小时/>
print (df)
Col1 Col2
0 a 1
1 b
2 c
3 d 2

关于python - 删除列中的重复值,保留行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50154213/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com