python - 线性同余生成器——如何选择种子和统计检验-6ren

python - 线性同余生成器——如何选择种子和统计检验

转载作者：太空宇宙更新时间：2023-11-04 04:07:32

33

4

我需要做一个线性同余生成器，它将成功通过选定的统计测试。

我的问题是:如何正确选择生成器的数字以及我应该选择哪些统计检验？

我想过:

均匀性的卡方频率检验
- 每种生成方法收集 10,000 个数字
- 将[0.1) 分成10等分
Kolmogorov-Smirnov 均匀性检验
- 由于 K-S 检验对较小的数字集效果更好，您可以使用为卡方频率检验生成的 10,000 个中的前 100 个

代码示例如下:

def seedLCG(initVal):
    global rand
    rand = initVal

def lcg():
    a = 1664525
    c = 1013904223
    m = 2**32
    global rand
    rand = (a*rand + c) % m
    return rand

seedLCG(1)

for i in range(1000):
    print (lcg())

在选择种子时，我考虑的是纳秒级，但我不知道如何实现它，它是否有意义？这个想法是为了表明所选择的种子是随机选择的，而不是从上限中选择的。

最佳答案

关于如何正确地为生成器选择数字，在 Wiki 页面中有 Hull–Dobell 定理的描述，它告诉您如何选择 a 和 c 来获得全周期发生器。您从 Numerical Recipes 中获得了数字，据我所知，您将获得完整周期 [0...2³²) 生成器。或者您可以查看 this paper 的品质因数，有 (a,c) 对可用于任意大小的周期。

关于测试，看看@pjs 提供的论文。

在选择种子时，我考虑的是纳秒级，但我不知道如何实现它，它是否有意义？这个想法是为了表明所选种子是随机选择的，而不是从上限中选择的。我认为这不是一个好主意，因为你不能保证你从 time/ceil/... 中挑选的种子不会重叠。 LCG 基本上是双射 [0...2³²)<->[0...2³²) 映射，并且相对容易重叠随机数流所以你的结果是相关的。

相反，我会建议使用 LCG 的另一个不错的属性 - 向前(和向后)对数跳跃。因此，为了模拟 N 核心，您可以只选择单个种子并在第一个代码上运行，相同的种子但跳过(N/2 ³²)第二个核心，种子和跳过( N/2³² * 2) 依此类推。

具有显式状态和跳过的 LCG 代码如下，Win10 x64，Python 3.7 Anaconda

import numpy as np

class LCG(object):

    UZERO: np.uint32 = np.uint32(0)
    UONE : np.uint32 = np.uint32(1)

    def __init__(self, seed: np.uint32, a: np.uint32, c: np.uint32) -> None:
        self._seed: np.uint32 = np.uint32(seed)
        self._a   : np.uint32 = np.uint32(a)
        self._c   : np.uint32 = np.uint32(c)

    def next(self) -> np.uint32:
        self._seed = self._a * self._seed + self._c
        return self._seed

    def seed(self) -> np.uint32:
        return self._seed

    def set_seed(self, seed: np.uint32) -> np.uint32:
        self._seed = seed

    def skip(self, ns: np.int32) -> None:
        """
        Signed argument - skip forward as well as backward

        The algorithm here to determine the parameters used to skip ahead is
        described in the paper F. Brown, "Random Number Generation with Arbitrary Stride,"
        Trans. Am. Nucl. Soc. (Nov. 1994). This algorithm is able to skip ahead in
        O(log2(N)) operations instead of O(N). It computes parameters
        A and C which can then be used to find x_N = A*x_0 + C mod 2^M.
        """

        nskip: np.uint32 = np.uint32(ns)

        a: np.uint32 = self._a
        c: np.uint32 = self._c

        a_next: np.uint32 = LCG.UONE
        c_next: np.uint32 = LCG.UZERO

        while nskip > LCG.UZERO:
            if (nskip & LCG.UONE) != LCG.UZERO:
                a_next = a_next * a
                c_next = c_next * a + c

            c = (a + LCG.UONE) * c
            a = a * a

            nskip = nskip >> LCG.UONE

        self._seed = a_next * self._seed + c_next


#%%
np.seterr(over='ignore')

a = np.uint32(1664525)
c = np.uint32(1013904223)
seed = np.uint32(1)

rng = LCG(seed, a, c)

print(rng.next())
print(rng.next())
print(rng.next())

rng.skip(-3) # back by 3
print(rng.next())
print(rng.next())
print(rng.next())

rng.skip(-3) # back by 3
rng.skip(2) # forward by 2
print(rng.next())

更新

生成 10k 个数字

np.seterr(over='ignore')

a = np.uint32(1664525)
c = np.uint32(1013904223)
seed = np.uint32(1)

rng = LCG(seed, a, c)
q = [rng.next() for _ in range(0, 10000)]

关于python - 线性同余生成器——如何选择种子和统计检验，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56985271/

33

4

0

文章推荐： python - 通过删除背景音乐来隔离人声

文章推荐： html - 导航栏填充和边框不在栏的 100% 高度

文章推荐： javascript - 使用 Javascript 的等高列

文章推荐： c++ - gethostbyaddr() 返回 null

python - 单例 python 生成器？或者，pickle 一个 python 生成器？
我使用以下代码和嵌套生成器迭代文本文档并使用 get_train_minibatch() 返回训练示例。我想保留( pickle )生成器，这样我就可以回到文本文档中的相同位置。但是，您不能 pick
JavaScript 生成器
在本教程中，您将借助示例了解 JavaScript 生成器。在 JavaScript 中，生成器提供了一种使用函数和迭代器的新方法。使用生成器，您可以从函数内部的任何位置停止执行函数并从
HTML 生成器？
LESS is very cool .我一直想知道是否有任何好的 html 生成器可以让我更轻松地编写表单或做其他事情。除了 html，是否有一些类似的东西？最佳答案已尝试 Haml ？从它的网
PHP中你可能忽略的性能优化利器：生成器
前言如果是做python或者其他语言的小伙伴，对于生成器应该不陌生。但很多php开发者或许都不知道生成器这个功能，可能是因为生成器是php 5.5.0才引入的功能，也可以是生成器作用不是很明显。
日期范围的 F# 生成器？
我正在尝试编写一个使用生成器语法生成日期时间列表的函数: let dateRange = let endDate = System.DateTime.Parse("6/1/2010")
python - 一个类轮通过一个可迭代的(生成器)
我遇到了一些看起来像的代码: [func(val) for val in iterable] 有一个可迭代对象(在我的例子中是一个生成器)，用户想要为其副作用调用每个值的函数(例如 func 可以只是
德尔福 UUID 生成器
Delphi 有内置的东西来生成 UUID 吗？最佳答案 program Guid; {$APPTYPE CONSOLE} uses SysUtils; var Uid: TGuid; Result
JavaScript ES6 生成器
我正在深入研究 javascript 生成器，但我真的很困惑。我使用 node@0.11.x 运行此示例: function find() { process.nextTick(functi
hibernate ID 生成器
有人知道一些关于如何为 hibernate 创建自定义 ID 生成器的好教程吗？最佳答案在 Google 上粗略搜索“hibernate 自定义 id 生成器教程”发现了以下可能性。我排除了那些看
用于并发的 python 生成器
我正在关注 Python 大师 David Beazley 的幻灯片。它指出“生成器也用于并发。这是一个示例: from collections import deque def countdown(
python - 生成器:以固定偏移量预处理事件
我有一个生成事件的生成器，我想用可以从 API 获取的附加元数据来丰富它。某些事件具有与其链接的对象 ID，而其他事件则具有对象的哈希值，但不能同时具有两者。我无法根据哈希获取对象 id，我只能执行
java - 自定义类项列表的循环迭代器/生成器
假设我有一个自定义类: public class CustomClass { private String name; private String data; public
php - MySql "WHERE"生成器
我正在考虑实现一个函数来在 SQL 请求中“构建”WHERE 子句，如下所示: "SELECT * FROM table $where" 使用如下所示的循环构建 $where: $arr=array(
永远返回相同内容的 Python 生成器
我正在寻找执行此操作的标准函数: def Forever(v): while True: yield v 这看起来太琐碎了，我不敢相信没有标准版本。就此而言，有人知道指向所有标准生成器函
支持多浏览器的 CSS 生成器
我知道这个网站上有几个非常相似的相关问题，但是在看了这部剧之后，我相信这个问题本身就是独一无二的。如果有人能找到并提供证据证明我的问题完全被骗了，我会自己撤回它(所以请不要否决这个!)。我是 Jav
C++ 生成器 TtcpClient
void __fastcall TForm1::Button1Click(TObject *Sender) { int size = MemoEnter->GetTextLen() + 1;
Python ctypes 生成器
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
Python 生成器 - 改变最后的结果？
我试图在我的生成器的以下两个定义之间做出决定。哪个更好？哪个“更像 python ”？无论如何，有没有办法减轻每一个的缺点？ def myGenerator1(howMany): result
要列出的 Python 生成器
我有一个 Python 生成器 lexg，它在每次迭代时生成一个列表。该代码似乎在传统的 for 循环意义上工作，即 for i in lexg(2,2): print(i) 产生: [2, 0] [
返回一系列时间的 Python 生成器
我希望这不会超出 Python 生成器的能力，但我想构建一个这样，每次调用该函数时，它都会返回下一分钟直到结束时间。因此该函数读取开始时间和结束时间，并以分钟为单位返回时间，直到涵盖其间的所有时间。

首页

博学

6Ren·AI

商城

python - 线性同余生成器——如何选择种子和统计检验