gpt4 book ai didi

python - 如何从具有频率计数的值创建数据框列?

转载 作者:行者123 更新时间:2023-12-03 20:03:33 24 4
gpt4 key购买 nike

给定一个问题集,带有值及其相关频率,sample 怎么可能?在数据框中创建?

Find the mean of this dataset
Value: 1 | 2 | 3
Freq: 3 | 4 | 2
其中代表 sample , [1, 1, 1, 2, 2, 2, 2, 3, 3] .
我将其输入到 Python 中:
>>> import pandas as pd
>>> df = pd.DataFrame({'value':[1, 2, 3], 'freq':[4, 5, 2]})
>>> df
value freq
0 1 3
1 2 4
2 3 2
用这种格式不难找到解决基本统计数据。例如,这个数据集的平均值是 (df['value'] * df['freq']).sum() / df['freq'].sum() .但是,最好使用内置函数/属性,例如 .mean() .为此,我需要将值/频率数据作为原始值数据输入到数据框中。我的最终目标是这样的:
    data
0 1
1 1
2 1
3 2
4 2
5 2
6 2
7 3
8 3
有人知道如何输入以值/频率形式给出的数据集并创建原始数据的数据框吗?谢谢你。

最佳答案

一个选项是使用 np.repeat

import numpy as np

values = [1,2,3]

frequency = [3,4,2]

df = pd.DataFrame(np.repeat(values, frequency), columns=['data'])

df.mean()

关于python - 如何从具有频率计数的值创建数据框列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64162812/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com