python - 我应该使用 `random.seed` 还是 `numpy.random.seed` 来控制 `scikit-learn` 中的随机数生成？-6ren

python - 我应该使用 `random.seed` 还是 `numpy.random.seed` 来控制 `scikit-learn` 中的随机数生成？

转载作者：IT老高更新时间：2023-10-28 22:00:56

30

4

我正在使用 scikit-learn 和 numpy，我想设置全局种子，以便我的工作可重现。

我应该使用 numpy.random.seed 还是 random.seed？

从评论中的链接，我了解到它们是不同的，并且 numpy 版本不是线程安全的。我想具体了解使用哪一个来创建 IPython 笔记本以进行数据分析。 scikit-learn 的一些算法涉及生成随机数，我想确保 notebook 在每次运行时显示相同的结果。

最佳答案

Should I use np.random.seed or random.seed?

这取决于您在代码中使用的是 numpy 的随机数生成器还是 random 中的随机数生成器。

numpy.random 和 random 中的随机数生成器具有完全独立的内部状态，因此 numpy.random.seed() 不会影响random.random()产生的随机序列，同样random.seed()不会影响numpy.random.randn()等等。如果您在代码中同时使用 random 和 numpy.random，那么您需要分别为两者设置种子。

更新

您的问题似乎专门针对 scikit-learn 的随机数生成器。据我所知，scikit-learn 始终使用 numpy.random，所以你应该使用 np.random.seed() 而不是 random.seed( ).

一个重要的警告是 np.random 不是线程安全的 - 如果您设置全局种子，然后启动几个子进程并使用 np.random 在其中生成随机数，每个子进程将从其父进程继承 RNG 状态，这意味着您将在每个子进程中获得相同的随机变量。解决这个问题的常用方法是将不同的种子(或 numpy.random.Random 实例)传递给每个子进程，这样每个子进程都有一个单独的本地 RNG 状态。

由于 scikit-learn 的某些部分可以使用 joblib 并行运行，您会看到某些类和函数可以选择传递种子或 np.random.RandomState 实例(例如random_state= 参数为 sklearn.decomposition.MiniBatchSparsePCA )。我倾向于对脚本使用单个全局种子，然后根据全局种子为任何并行函数生成新的随机种子。

关于python - 我应该使用 `random.seed` 还是 `numpy.random.seed` 来控制 `scikit-learn` 中的随机数生成？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31057197/

30

4

0

文章推荐： python - 以追加模式保存numpy数组

文章推荐： c++ - 获取当前时间作为 YYYY-MM-DD-HH-MM-SS 字符串

文章推荐： C++。错误 : void is not a pointer-to-object type

文章推荐： python - Python 的最佳视频处理库？

python - np.random.rand() 或 random.random()
在分析代码时，我偶然发现了以下代码段: msk = np.random.rand(len(df)) < 0.8 变量“msk”和“df”与我的问题无关。经过一些研究，我认为这种用法也与“随机”类有关。
random - random() 似乎不会绘制范围极值
出于几个合理的原因，我必须使用 BSD 的 random() 来生成非常大量的随机数，并且由于它的周期很短(~2^69，如果我没记错的话)，这些数字的质量会降低对于我的用例来说很快。我可以使用我可以访
random - random() 实际上是如何工作的？
每种语言都有一个 random() 函数或类似的东西来生成伪随机数。我想知道下面会发生什么来生成这些数字？我没有编写任何需要这些知识的东西，只是想满足我自己的好奇心。最佳答案唐纳德·克努斯开创性的
python - 为什么 random.random() 占用两个 random.randint() 值？
我开发了一个简单的应用程序来生成测试数据系列，并且我使用随机种子将其构建为能够重复。我注意到以下情况并想知道为什么会这样: >>> random.seed(1) >>> [random.randint
python - 为什么 random() * random() 与 random() ** 2 不同？
random() * random() 和 random() ** 2 有区别吗？ random() 从均匀分布中返回一个介于 0 和 1 之间的值。在测试两个版本的随机平方数时，我注意到了一点不同
python - np.random.rand 与 np.random.random
我发现 Python(及其生态系统)充满了奇怪的约定和不一致，这是另一个例子: np.random.rand Create an array of the given shape and popula
python - Python 中 numpy.random 和 random.random 的性能差异
我想看看哪个随机数生成器包在我的神经网络中速度更快。我目前正在从github上修改一段代码，其中numpy.random和random包都用于生成随机整数、随机选择、随机样本等。我更改此代码的原因
python - Python 中 numpy.random 和 random.random 的区别
我有一个 Python 大脚本。我在其他人的代码中启发了自己，所以我最终使用 numpy.random 模块来做一些事情(例如创建一个从二项分布中获取的随机数数组)，在其他地方我使用模块 random
random - 为什么 JDK 既有 Math.random() 又有 Random 类？
仅仅是因为“大型 API 综合症”还是生成在某些情况下更偏向的随机数？如果是……我认为控制偏见很重要。最佳答案他们是一样的，真的。只是一个方便的方法。检查 javadoc here .此外，您
python - 在 Python3 中使用 `random.shuffle` 作为关键字参数时 `random.random` 的运行时间更短
我只是观察到，当使用 Python3 时，使用 random.shuffle 对列表进行洗牌需要大约一半的运行时间，而当为显式提交函数 random.random >random 关键字参数。我检查
python - 在 python 中，random.uniform() 和 random.random() 有什么区别？
在python中随机模块，random.uniform()和random.random()有什么区别？它们都生成伪随机数，random.uniform() 生成均匀分布的数字，random.rando
random - 在JMeter中生成 'Random number'变量
是否可以在JMeter中生成“随机数”变量？我已经记录了用户旅程我已将旅程导入JMeter 我必须在用户旅程测试用例中输入一个唯一的4位数ID 在jmeter的当前默认值为2323 有没有一种方法
random - FFMpeg random 是否会为连续执行生成相同的伪随机数序列？
例如，如果我执行命令两次:ffmpeg -i input.mp4 -vf geq=r='random(1)*255':g='random(1)*255':b='random(1)*255' -stri
random - System.Random 产生相同的随机数
尽管随机生成器只创建一次，但输出始终是相同的随机结果(对于所有三个测试输出)。来自稍大脚本的测试片段: let myRandGen = System.Random() let getRa
random - IntRange.random()如何在Kotlin中引入熵
我正计划使用IntRange.random()(即(0..9999).random())在 Kotlin 中生成一个随机的5位代码。重要的是，恶意人员不能预测将要生成的数字的顺序。 IntRange.
random - 将随机数生成器种子设置为 "random"数字
您能否告诉我如何将 KDB 中的随机数生成器种子设置为或多或少的“随机”数？我正在尝试执行以下操作: \S .z.i 但不知何故它不起作用。\S 似乎需要一个显式整数，而不是一个变量。非常感谢!
random - 在内核模块中获取/dev/random
我需要同时获得 /dev/random和 /dev/urandom在内核模块中。 get_random_bytes提供获取 /dev/urandom 的 API . 但是/dev/random 没有A
python - random.random 到底在做什么
random.shuffle(lst_shuffle, random.random) 我知道后一部分是可选参数。但它究竟做了什么。我不明白这是什么意思。这是来自文档。 random.random()
python - random.random() 在不同的机器上生成不同的数字
在树莓派 3 上: >>> import random >>> random.seed(0.9849899567458751) >>> random.random() 0.47871160253065
Python:random.random()植入哪里？
说我有一些python代码: import random r=random.random() r的值通常从哪里来？如果我的操作系统没有随机数，那么它将在何处播种呢？为什么不建议将其用于加密？有什么

首页

博学

6Ren·AI

商城

python - 我应该使用 `random.seed` 还是 `numpy.random.seed` 来控制 `scikit-learn` 中的随机数生成？

更新