gpt4 book ai didi

python - 将计数添加到新列 pandas python 3

转载 作者:行者123 更新时间:2023-12-01 01:46:44 24 4
gpt4 key购买 nike

我正在尝试删除重复行并使用 pandas 写入出现次数。以下声明是我尝试过的:

createModel['count'] = createModel.groupby(createModel.columns.tolist(),as_index=False).size()
createModel.to_csv(r"test1.csv",index=False,header =True,sep="\t",encoding="utf-16")
createModel.head(10)

但我收到错误:TypeError:插入列的索引与框架索引不兼容

我知道这是因为我添加了count。如果我删除它然后尝试保存文件,我只能保护 count

请告诉我如何保存完整的数据帧而不重复,并添加一列作为 count 表示该行出现的次数。

最佳答案

使用transform对于新列,但必须在 [] 中的 groupby 之后添加一列值:

cols = createModel.columns.tolist()
#another solution, thanks @jpp
#cols = list(createModel)
createModel['count'] = createModel.groupby(cols)[cols[0]].transform('size')

如果需要删除重复值,则需要聚合值并添加 reset_index :

createModel = createModel.groupby(cols).size().reset_index(name='count')

关于python - 将计数添加到新列 pandas python 3,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51242277/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com