gpt4 book ai didi

python - 删除 Pandas 记录中的重复值

转载 作者:行者123 更新时间:2023-11-28 20:12:36 26 4
gpt4 key购买 nike

我想删除列 animals 的每一行中的重复项。

我需要像这篇文章这样的东西,但在 python 中。由于某种原因,我现在无法解决这个问题,我遇到了障碍。

Remove duplicate records in dataframe

我尝试过使用 drop duplicates、unique、nunique 等。没有成功。

df.drop_duplicates(subset=None, keep="first", inplace=False)df


df = pd.DataFrame ({'animals':['pink pig, pink pig, pink pig','brown cow, brown cow','pink pig, black cow','brown horse, pink pig, brown cow, black cow, brown cow']})

#input:
animals
0 pink pig, pink pig, pink pig
1 brown cow, brown cow
2 pink pig, black cow
3 brown horse, pink pig, brown cow, black cow, brown cow

#I would like the output to look like this:
animals
0 pink pig
1 brown cow
2 pink pig, black cow
3 brown horse, pink pig, brown cow, black cow

最佳答案

这样做:

df = pd.DataFrame ({'animals':['pink pig, pink pig, pink pig','brown cow, brown cow','pink pig, black cow','brown horse, pink pig, brown cow, black cow, brown cow']})


df['animals2'] = df.animals.apply(lambda x: ', '.join(list(set(x.split(', ')))))

输出:

0                                       pink pig
1 brown cow
2 pink pig, black cow
3 brown cow, brown horse, pink pig, black cow

解释:

我把你的字符串变成了一个列表。然后我把列表变成一个集合来删除重复项。然后我把这个集合变成一个列表,然后我把列表拆分成一个字符串。如果有什么不清楚的地方请告诉我!

关于python - 删除 Pandas 记录中的重复值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57274623/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com