gpt4 book ai didi

python-3.x - 计算来自多个数据框列的唯一值

转载 作者:行者123 更新时间:2023-12-01 02:39:27 24 4
gpt4 key购买 nike

我有一个包含 ID、日期和状态(获胜、失败、未完成)的销售报价数据框。

Quotes = pd.DataFrame({
'Quote_ID': [1105, 1106, 1107, 1108, 1109, 1110, 1111, 1112],
'Quote_Date': ['2018-11-15', '2018-11-15', '2018-11-15', '2018-11-15',
'2018-11-15', '2018-11-16', '2018-11-16', '2018-11-16'],
'Status': ['won', 'open', 'won', 'lost', 'won', 'lost', 'lost', 'won']
})

print(Quotes)

Quote_ID Quote_Date Status
0 1105 2018-11-15 won
1 1106 2018-11-15 open
2 1107 2018-11-15 won
3 1108 2018-11-15 lost
4 1109 2018-11-15 won
5 1110 2018-11-16 lost
6 1111 2018-11-16 lost
7 1112 2018-11-16 won

我想要一个新的数据框来计算每天的报价和每天赢得的报价数量:

         Date  Quotes  Won
0 2018-11-15 5 3
1 2018-11-16 3 1

我可以使用以下方法计算每天的报价数量:

Quotes_Per_Day = Quotes['Quote_Date'].value_counts().sort_index()

但我不确定如何计算当天“获胜”的次数。

最佳答案

创建一个 bool 序列,然后将其求和到 groupby

(Quotes.assign(Won = Quotes.Status.eq('won'))
.groupby("Quote_Date").agg({'Won': 'sum', 'Quote_ID': 'nunique'})
.rename(columns={'Quote_ID': 'Quotes'}))

Won Quotes
Quote_Date
2018-11-15 3.0 5
2018-11-16 1.0 3

关于python-3.x - 计算来自多个数据框列的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55106218/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com