gpt4 book ai didi

python - Pandas 系列删除重复问题

转载 作者:太空宇宙 更新时间:2023-11-03 16:32:01 25 4
gpt4 key购买 nike

我有一个包含重复项的系列,我正在尝试删除它

0     RWAY001
1 RWAY001
2 RWAY002
3 RWAY002
...
112 RWAY057
113 RWAY057
114 RWAY058
115 RWAY058
Length: 116

Drop.duplicates() 似乎将长度削减到 58,但索引似乎仍然从 0 到 116,但只是跳过重复项:

0      RWAY001
2 RWAY002
...
112 RWAY057
114 RWAY058
Length: 58

所以看起来中间的行仍然存在且具有 NaN 值。我尝试了 dropna() 但它对数据没有任何影响。

这是我的代码:

  df = pd.read_csv(path + flnm)
fields = df.file
fields = fields.drop_duplicates()
print fields

非常感谢任何帮助。谢谢。

最佳答案

我认为你需要reset_index带参数drop=True:

fields.reset_index(inplace=True, drop=True)

或者:

fields = fields.reset_index(drop=True)

示例:

import pandas as pd

df = pd.DataFrame({'file': {0: 'RWAY001', 1: 'RWAY001', 2: 'RWAY002', 3: 'RWAY002', 115: 'RWAY058', 113: 'RWAY057', 112: 'RWAY057', 114: 'RWAY058'}})
print (df)
file
0 RWAY001
1 RWAY001
2 RWAY002
3 RWAY002
112 RWAY057
113 RWAY057
114 RWAY058
115 RWAY058

print (df.file.drop_duplicates())
0 RWAY001
2 RWAY002
112 RWAY057
114 RWAY058
Name: file, dtype: object

print (df.file.drop_duplicates().reset_index(drop=True))
0 RWAY001
1 RWAY002
2 RWAY057
3 RWAY058
Name: file, dtype: object

关于python - Pandas 系列删除重复问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37521354/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com