gpt4 book ai didi

python - 将 6 个随机生成的数字与 csv 中的数据重复相乘

转载 作者:太空宇宙 更新时间:2023-11-03 21:05:36 26 4
gpt4 key购买 nike

我想生成 6 个随机数(权重),它们始终等于 1000000 倍,并将其乘以我从 csv 文件导入的数据列。将总和存储在另一列(加权平均值)中,并找到新列(范围)的最大值和最小值之间的差。我想重复这个过程 1000000 次并获得最小范围和生成的一组随机数(权重)来找到它。

这是我到目前为止所做的:1.生成6个随机数2.从csv导入数据3. 将数据随机数与csv文件中的数据相乘,求平均值(加权平均值)4. 将加权平均值保存在新列 F(x) 中5. 找到范围6. 重复此操作 1000000 次,获取范围最小的随机数。

这是文件中的一些数据

     A    B      C    D      E    F    F(x)
0 4.9 3.9 6.3 3.4 7.3 3.4 0.0
1 4.1 3.7 7.7 2.8 5.5 3.9 0.0
2 6.0 6.0 4.0 3.1 3.7 4.3 0.0
3 5.6 6.3 6.6 4.6 8.3 4.6 0.0

目前所有 F(x) 的值为 0.0,但事实并非如此。

arr = np.array(np.random.dirichlet(np.ones(6), size=1))

arr=pd.DataFrame(arr)

ar=(arr.iloc[0])

df = pd.read_csv('weit.csv')

df['F(x)']=df.mul(ar).sum(1)
df

df['F(x)'].max() - df['F(x)'].min()

我的所有加权平均值均为 0。我需要得到加权平均值

我无法循环代码运行 1000000 次并获得最小范围。

最佳答案

如果正确理解您的需要:

#data from file
print (df)
A B C D E F
0 4.9 3.9 6.3 3.4 7.3 3.4
1 4.1 3.7 7.7 2.8 5.5 3.9
2 6.0 6.0 4.0 3.1 3.7 4.3
3 5.6 6.3 6.6 4.6 8.3 4.6

np.random.seed(3434)

生成具有 6 个“列”和 N 个“行”的二维数组,其中填充了唯一的随机数 this :

N = 10
#in real data
#N = 1000000
N = 10
arr = np.array(np.random.dirichlet(np.ones(6), size=N))
print (arr)
[[0.07077773 0.08042978 0.02589592 0.03457833 0.53804634 0.25027191]
[0.22174594 0.22673581 0.26136526 0.04820957 0.00976747 0.23217594]
[0.01202493 0.14247592 0.3411326 0.0239181 0.08448841 0.39596005]
[0.09354759 0.54989312 0.08893737 0.22051801 0.03850101 0.00860291]
[0.09418778 0.33345217 0.11721214 0.33480462 0.11894247 0.00140081]
[0.04285476 0.04531546 0.38105815 0.04316535 0.46902838 0.0185779 ]
[0.00441747 0.08044848 0.33383453 0.09476135 0.37568431 0.11085386]
[0.14613552 0.11260451 0.10421495 0.27880266 0.28994218 0.06830019]
[0.50747802 0.15704797 0.04410511 0.07552837 0.18744306 0.02839746]
[0.00203448 0.13225783 0.43042505 0.33410145 0.08385366 0.01732753]]

然后将值从 DataFrame 转换为 2d numpy 数组:

b = df.values
#pandas 0.24+
#b = df.to_numpy()
print (b)
[[4.9 3.9 6.3 3.4 7.3 3.4]
[4.1 3.7 7.7 2.8 5.5 3.9]
[6. 6. 4. 3.1 3.7 4.3]
[5.6 6.3 6.6 4.6 8.3 4.6]]

最后将两个数组合并为 3d 数组并按轴求和 2,最后用最小用量减去最大值 numpy.ptp :

c = np.ptp((arr * b[:, None]).sum(axis=2), axis=1)
print (c)

[2.19787892 2.08476765 1.2654273 1.45134533]

另一个解决方案 numpy.einsum :

c = np.ptp(np.einsum('ik,jk->jik', arr, b).sum(axis=2), axis=1)
print (c)
[2.19787892 2.08476765 1.2654273 1.45134533]

用于比较的循环解决方案,但 N 较大时速度较慢:

out = []
for row in df.values:
# print (row)
a = np.ptp((row * arr).sum(axis=1))
out.append(a)
print (out)
[2.197878921892329, 2.0847676512823052, 1.2654272959079576, 1.4513453259898297]

关于python - 将 6 个随机生成的数字与 csv 中的数据重复相乘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55428592/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com