gpt4 book ai didi

python - 在数据集上应用内置和自定义创建的函数

转载 作者:行者123 更新时间:2023-12-04 15:31:18 25 4
gpt4 key购买 nike

我有不同列的销售数据。数据采用 Pandas DataFrame 类型。对我的数据应用自定义函数,并按相同类别组合所有数据。不幸的是,我不能在这里发布数据集,但我有如下示例数据:

     item  value
0 Item A 59
1 Item B 95
2 Item B 82
3 Item C 40
4 Item A 11

现在我想要的是创建一个函数并将该函数应用于数据。这是我的代码

sum_all = {}
def verify(items , col):
for i,v in items,col:
if i == 'item A':
sum_all[i] += v
# and so on
# At the end of this function
return sum_all

我想对我的数据进行处理,一个是内置求和函数,另一个是同时验证。结果将如下所示:

item    sum   verify

Item A 70 70
Item B 177 177
Item C 40 40

考虑到这不是我的真实数据,这是与我的非常相似的虚拟数据。我还在 stack overflow 上搜索了它,我发现很少有好的解决方案,但它们并没有完全按照我想要的方式工作。我也评论了那些帖子,但还没有得到回复。如果您能提供帮助,我将不胜感激

最佳答案

我认为您在谈论 groupby 和 agg 函数。据我所知,您可以试试这段代码。

df = pd.DataFrame([['Item A',59],['Item B',95],['Item B',82],['Item C',40],['Item A',11]], columns=['item','value'])

# If using Python3
from functools import reduce

def verify(series):
return reduce(lambda x, y: x + y, series)

df.groupby('item').agg({'value': ['sum', verify]})

关于python - 在数据集上应用内置和自定义创建的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61227617/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com