gpt4 book ai didi

python-3.x - 如何根据 Python 中另一列中的日期查找最频繁的值

转载 作者:行者123 更新时间:2023-12-02 18:24:23 24 4
gpt4 key购买 nike

我想找出哪个值在给定的一天中出现 50% 或更多的时间。例如,在下面的数据集中,A 在 06/21 出现最频繁,但出现的次数不超过 50% 或更多。在 06/22,B 出现的概率为 50% 或更多,因此我需要输出显示“B”和日期“06/22”

import pandas as pd

# initialise data of lists.
data = {'Name':['A', 'B', 'A', 'C', 'C', 'A', 'B', 'A', 'B','B','B', 'C', 'C'], 'Date':
['06/21', '06/21', '06/21', '06/21', '06/21', '06/21', '06/21', '06/22' , '06/22', '06/22', '06/22', '06/22', '06/22']}

# Create DataFrame
df = pd.DataFrame(data)

# Print the output.
print(df)
<表类=“s-表”><标题>姓名日期 <正文>一个06/21B06/21一个06/21C06/21C06/21一个06/21B06/21一个06/22B06/22B06/22B06/22C06/22C06/22

最佳答案

您可以将 value_counts 与标准化一起使用来计算相对值,然后进行过滤:

s = df.groupby('Date')['Name'].value_counts(normalize=True).reset_index(name='freq')
s.query('freq >= 0.5')

输出:

    Date Name  freq
3 06/22 B 0.5

关于python-3.x - 如何根据 Python 中另一列中的日期查找最频繁的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70424228/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com