gpt4 book ai didi

python - 删除 Pandas 中的重复项,不包括一列

转载 作者:太空狗 更新时间:2023-10-29 19:33:35 26 4
gpt4 key购买 nike

这看起来很简单,但我在互联网上找不到任何相关信息。

我有一个如下所示的数据框:

City    State Zip           Date        Description       
Earlham IA 50072-1036 2014-10-10 Postmarket Assurance: Devices
Earlham IA 50072-1036 2014-10-10 Compliance: Devices
Madrid IA 50156-1748 2014-09-10 Drug Quality Assurance

如何消除与 5 列中的 4 列匹配的重复项?与 Description 不匹配的列。

结果是

City    State Zip           Date        Description       
Earlham IA 50072-1036 2014-10-10 Postmarket Assurance: Devices
Madrid IA 50156-1748 2014-09-10 Drug Quality Assurance

我在网上发现带有 subset 参数的 drop_duplicates 可以工作,但我不确定如何将它应用于多个列。

最佳答案

您实际上已经找到了解决方案。对于多列,子集将是一个列表。

df.drop_duplicates(subset=['City', 'State', 'Zip', 'Date']) 

或者,只需声明要忽略的列:

df.drop_duplicates(subset=df.columns.difference(['Description']))

关于python - 删除 Pandas 中的重复项,不包括一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38445416/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com