gpt4 book ai didi

python - “子集”不适用于 drop_duplicates pandas 数据框

转载 作者:太空狗 更新时间:2023-10-30 00:31:24 25 4
gpt4 key购买 nike

我有一个看起来像这样的 df:

    A                B    C               D     NEW
0 1 Adhoc_Task WID WI_DTL []
1 1 Arun_adhoc_load ATT IXN_1 (IXN,)
2 1 Arun_adhoc_load ATT IXN_10 (IXN,)
3 1 Arun_adhoc_load ATT IXN_100 (IXN,)
4 1 Arun_adhoc_load ATT IXN_101 (IXN,)
5 2 Batch_Support ATT CDS_STATUS []
6 2 Batch_Support ATT CDS_CONTROL []
7 2 Batch_Support ATT CDS_ORA_STATUS []
8 2 Batch_Support ATT REP_FILTER []
9 1 online_load ATT TAX_3 (TAX,)
10 1 online_load ATT TAX_4 (TAX,)
11 1 online_load ATT TAX_8 (TAX,)
12 1 online_load ATT TAX_11 (TAX,)

期望的输出看起来像这样:

    A                B    C               D     NEW
0 1 Adhoc_Task WID WI_DTL []
1 1 Arun_adhoc_load ATT IXN_1 (IXN,)
5 2 Batch_Support ATT CDS_STATUS []
9 1 online_load ATT TAX_3 (TAX,)

我正在尝试删除基于 B 列的重复行。但是,当我运行时

df.drop_duplicates(subset = ['B'], keep='first', inplace=True)

我收到以下错误:

TypeError: drop_duplicates() got an unexpected keyword argument 'subset'

我从 python 3 运行 pandas 0.19.1,所以我查看了这里的文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html

我对 subset 做错了一点也不清楚。我如何根据一列中的值从 DataFrame 中删除重复项?

最佳答案

无论出于何种原因,df 都变成了 Series 对象。在失败的 drop_duplicates 调用之前检查 type(df)。该函数没有用于系列的 subset 参数。

关于python - “子集”不适用于 drop_duplicates pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40670438/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com