gpt4 book ai didi

python - Python 中 numpy.random 和 random.random 的性能差异

转载 作者:行者123 更新时间:2023-11-28 22:09:49 29 4
gpt4 key购买 nike

我想看看哪个随机数生成器包在我的神经网络中速度更快。

我目前正在从github上修改一段代码,其中numpy.random和random包都用于生成随机整数、随机选择、随机样本等。

我更改此代码的原因是,出于研究目的,我想设置一个全局种子,以便能够比较不同超参数设置的准确度性能。问题是此时我必须为随机包和 numpy 包设置 2 个全局种子。理想情况下,我只想设置一个种子,因为来自两个随机数生成器序列的绘图可能会更快地变得相关。

但是,我不知道哪个包会表现更好(在速度方面):numpy 还是 random。所以我想为两个包找到与完全相同的 Mersenne Twister 序列相对应的种子。这样,两个模型的绘图是相同的,因此每个梯度下降步骤中的迭代次数也相同,导致速度差异仅由我使用的包引起。

我找不到任何关于两个包以相同随机数序列结束的种子对的文档,而且尝试所有类型的组合似乎有点麻烦。

我尝试了以下方法:

np.random.seed(1)
numpy_1=np.random.randint(0,101)
numpy_2=np.random.randint(0,101)
numpy_3=np.random.randint(0,101)
numpy_4=np.random.randint(0,101)
for i in range(20000000):
random.seed(i)
random_1=random.randint(0,101)
if random_1==numpy_1:
random_2=random.randint(0,101)
if random_2==numpy_2:
random_3=random.randint(0,101)
if random_3==numpy_3:
random_4=random.randint(0,101)
if random_4==numpy_4:
break
print(np.random.randint(0,101))
print(random.randint(0,101))

但这并没有像预期的那样真正起作用。

最佳答案

numpy.random 和 python random 以不同的方式工作,尽管如您所说,它们使用相同的算法。

在种子方面:您可以使用 numpy.random 中的 set_stateget_state 函数(在python random 调用了 getstatesetstate) 并将状态从一个传递到另一个。结构略有不同(在 python 中,pos 整数附加到状态元组中的最后一个元素)。请参阅 numpy.random.get_state() 的文档和 random.getstate() :

import random
import numpy as np
random.seed(10)
s1 = list(np.random.get_state())
s2 = list(random.getstate())

s1[1] = np.array(s2[1][:-1]).astype('int32')
s1[2] = s2[1][-1]

np.random.set_state(tuple(s1))

print(np.random.random())
print(random.random())
>> 0.5714025946899135
0.5714025946899135

在效率方面:这取决于你想做什么,但 numpy 通常更好,因为你可以创建元素数组而不需要循环:

%timeit np.random.random(10000)
142 µs ± 391 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit [random.random() for i in range(10000)]
1.48 ms ± 2.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

就“随机性”而言,numpy(根据他们的 docs )也更好:

Notes: The Python stdlib module "random" also contains a Mersenne Twister pseudo-random number generator with a number of methods that are similar to the ones available in RandomState. RandomState, besides being NumPy-aware, has the advantage that it provides a much larger number of probability distributions to choose from.

关于python - Python 中 numpy.random 和 random.random 的性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57220804/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com