gpt4 book ai didi

python - 重复属性的 Pandas 总和

转载 作者:太空狗 更新时间:2023-10-29 20:34:44 25 4
gpt4 key购买 nike

我正在使用 Pandas 操作一个包含多行和多列的 csv 文件,如下所示

Fullname     Amount     Date           Zip    State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 . . .
Betty White 25 . . .

我想创建一个名为 Total 的新列,其中包含每个人的总金额。 (由 FullnameZip 标识)。我很难找到正确的解决方案。

让我们调用我的 csv import csvfile。这是我的。

import Pandas
df = pandas.read_csv('csvfile.csv', header = 0)
df.sort(['fullname'])

我想我必须使用 iterrows 来做我想做的事情。删除重复的问题是我会丢失金额或金额可能不同。

最佳答案

我想你想要这个:

df['Total'] = df.groupby(['Fullname', 'Zip'])['Amount'].transform('sum')

所以 groupby 将根据 Fullnamezip 列进行分组,如您所述,然后我们调用 transformAmount 列上并通过传入字符串 sum 计算总金额,这将返回一个索引与原始 df 对齐的系列,然后您可以删除重复项。例如

new_df = df.drop_duplicates(subset=['Fullname', 'Zip'])

关于python - 重复属性的 Pandas 总和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29583312/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com