gpt4 book ai didi

python - pandas 将标题与行进行比较并删除重复的行

转载 作者:行者123 更新时间:2023-12-03 08:36:36 25 4
gpt4 key购买 nike

我有一个数据框,其中行中有重复的列标题。我只需要删除重复的 header 名称而不是重复的值。请注意,在这种情况下, header 为“无”

输入:

0. Gender age occu name 
1. F 21 A B
2. Gender age occu name
3. M 22 C D
4. Gender age occu name
5. M 23 F E
6. M 23 F E

所需输出:

0. Gender age occu name 
1. F 21 A B
2. M 22 C D
3. M 23 F E
5. M 23 F E

为此我正在尝试:

for i in range(0,len(a)-1):
print(a.iloc[i])
if(a.loc[0] == a.loc[i+1]).all() == True:
print('yes')
a.drop(i)

请注意,我无法直接获取行名称(第 0 行,因为它可能会发生变化,这就是为什么我必须使用循环将所有其他行与第 0 行进行比较,并且必须在匹配的地方删除该行) 。将第 0 行视为主行。

最佳答案

如果需要所有行(如果第一列名称与第一列不匹配),请使用 boolean indexingDataFrame.iloc :

print (df)
Gender age occu name
0 F 21 A B
1 Gender age occu name
2 M 22 C D
3 Gender age occu name
4 M 23 F E
5 M 23 F E

df1 = df[df.iloc[:, 0] != df.columns[0]]
#alternative
#df1 = df[df.iloc[:, 0].ne(df.columns[0])]
print (df1)
Gender age occu name
0 F 21 A B
2 M 22 C D
4 M 23 F E
5 M 23 F E

关于python - pandas 将标题与行进行比较并删除重复的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63705446/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com