Campaign ID Revenue Total
601 $2,690
601 $817
601 $0
649 $4,339
10901 $7,273
我上面有一张 table 。想要对数据应用 groupby 函数并应用总和(超过 Revenue_total)。 Pandas 给出 NA 值,因为 Revenue_total 是对象数据类型。任何帮助
import pandas as pd
path = r"C:\Users\roy\Google Drive\Work\Backlog\test.csv"
df = pd.read_csv(path)
df[['Campaign ID','Revenue Total']].head()
df.groupby(['Campaign ID'])[['Revenue Total']].sum()
您的数据文件有问题。
如果您执行以下操作
- 从美元数字中删除“,”和“$”
- 使用“,”作为分隔符
然后运行你的代码...
import pandas as pd
path = r"C:\Users\roy\Google Drive\Work\Backlog\test.csv"
df = pd.read_csv(path)
df[['Campaign ID','Revenue Total']].head()
print df.groupby(['Campaign ID'])[['Revenue Total']].sum()
将给出这个结果
Revenue Total
Campaign ID
601 3507
649 4339
10901 7273
我是一名优秀的程序员,十分优秀!