python - 非常大范围的高效随机生成器(在 python 中)

转载作者：太空狗更新时间：2023-10-29 18:02:44

26

4

我正在尝试创建一个生成器，该生成器返回给定范围内的数字，这些数字通过函数给出的特定测试 foo .但是我希望以随机顺序测试这些数字。以下代码将实现这一点:

from random import shuffle

def MyGenerator(foo, num):
    order = list(range(num))
    shuffle(order)
    for i in order:
        if foo(i):
            yield i

问题

此解决方案的问题在于，有时范围会非常大(num 的顺序可能是 10**8 或更高)。这个函数可能会变慢，因为内存中有这么大的列表。我已尝试使用以下代码避免此问题:

from random import randint    

def MyGenerator(foo, num):
    tried = set()
    while len(tried) <= num - 1:
        i = randint(0, num-1)
        if i in tried:
            continue
        tried.add(i)
        if foo(i):
            yield i

这在大多数情况下都很有效，因为在大多数情况下 num会很大，foo将传递合理数量的数字和总次数 __next__将被调用的方法将相对较小(例如，最多 200 个通常要小得多)。因此，我们很可能偶然发现一个通过 foo 的值。测试和大小 tried永远不会变大。 (即使它只有 10% 的时间通过，我们也不会期望 tried 大致大于 2000。)

然而，当num很小(接近 __next__ 方法被调用的次数，或者 foo 大部分时间失败，上述解决方案变得非常低效 - 随机猜测数字，直到它猜到一个不在 tried 中的数字。 .

我尝试的解决方案...

我希望使用某种映射数字 0,1,2,..., n 的函数以一种大致随机的方式在自己身上。 (这不用于任何安全目的，因此如果它不是世界上最“随机”的功能也没关系)。这里的函数 ( Create a random bijective function which has same domain and range ) 将带符号的 32 位整数映射到自身，但我不确定如何将映射调整到更小的范围。鉴于 num我什至不需要 0,1,..num 上的双射只是一个值 n大于并“接近”num (使用您认为合适的任何关闭定义)。然后我可以执行以下操作:

def mix_function_factory(num):
    # something here???
    def foo(index):
        # something else here??
    return foo

def MyGenerator(foo, num):
    mix_function = mix_function_factory(num):
    for i in range(num):
        index = mix_function(i)
        if index <= num:
            if foo(index):
                yield index

(只要双射不是在一组大大大于 num 的数字上，index <= num 不为真的次数就会很小)。

我的问题

你能想到以下其中一项吗:

mix_function_factory 的潜在解决方案甚至是 mix_function 的一些其他潜在功能我可以尝试概括 num 的不同值？
解决原始问题的更好方法？

提前致谢....

最佳答案

问题基本上是生成 0..n-1 范围内整数的随机排列。

对我们来说幸运的是，这些数字有一个非常有用的属性:它们都有一个不同的值模 n。如果我们可以对这些数字应用一些数学运算，同时注意保持每个数字不同模 n，就很容易生成一个看起来随机的排列。最好的部分是我们不需要任何内存来跟踪我们已经生成的数字，因为每个数字都是用一个简单的公式计算的。

我们可以对范围内的每个数字 x 执行的操作示例包括:

加法:我们可以将任何整数c加到x上。
乘法:我们可以将 x 与任何与 n 没有质因数的数 m 相乘。

仅在 0..n-1 范围内应用这两个操作已经给出了非常令人满意的结果:

>>> n = 7
>>> c = 1
>>> m = 3
>>> [((x+c) * m) % n for x in range(n)]
[3, 6, 2, 5, 1, 4, 0]

看起来很随意，不是吗？

如果我们从随机数生成 c 和 m，它实际上也是随机的。但请记住，不能保证此算法会生成所有可能的排列，或者每个排列都有相同的生成概率。

实现

实现的困难部分实际上只是生成一个合适的随机 m。我使用了 this answer 中的质因数分解代码这样做。

import random

# credit for prime factorization code goes
# to https://stackoverflow.com/a/17000452/1222951
def prime_factors(n):
    gaps = [1,2,2,4,2,4,2,4,6,2,6]
    length, cycle = 11, 3
    f, fs, next_ = 2, [], 0
    while f * f <= n:
        while n % f == 0:
            fs.append(f)
            n /= f
        f += gaps[next_]
        next_ += 1
        if next_ == length:
            next_ = cycle
    if n > 1: fs.append(n)
    return fs

def generate_c_and_m(n, seed=None):
    # we need to know n's prime factors to find a suitable multiplier m
    p_factors = set(prime_factors(n))

    def is_valid_multiplier(m):
        # m must not share any prime factors with n
        factors = prime_factors(m)
        return not p_factors.intersection(factors)

    # if no seed was given, generate random values for c and m
    if seed is None:
        c = random.randint(n)
        m = random.randint(1, 2*n)
    else:
        c = seed
        m = seed

    # make sure m is valid
    while not is_valid_multiplier(m):
        m += 1

    return c, m

现在我们可以为 c 和 m 生成合适的值，创建排列很简单:

def random_range(n, seed=None):
    c, m = generate_c_and_m(n, seed)

    for x in range(n):
        yield ((x + c) * m) % n

你的生成器函数可以实现为

def MyGenerator(foo, num):
    for x in random_range(num):
        if foo(x):
            yield x

关于python - 非常大范围的高效随机生成器(在 python 中)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49956883/

26

4

0

文章推荐： python - 从另一个笔记本运行 Jupyter 笔记本

文章推荐： Angular 2 : Can't bind to 'ngModel' even though FormsModule is imported

文章推荐： python - pandas groupby 聚合元素列表加法

Python 随机随机
我让随机数低于之前的随机数。 if Airplane==1: while icounter0: print "You have enoph fuel to get to New
随机 BigFloats Julia
是否可以生成 BigFloat 的随机数？类型均匀分布在区间 [0,1)? 我的意思是，因为 rand(BigFloat)不可用，看来我们必须使用 BigFloat(rand())为了那个结局。然而，
random - 无法创建抽象类的实例(随机)
我正在尝试学习 Kotlin，所以我正在学习互联网上的教程，其中讲师编写了一个与他们配合良好的代码，但它给我带来了错误。这是错误 Error:(26, 17) Kotlin: Cannot crea
java - 随机/随机比较器
是否有任何方法可以模拟 Collections.shuffle 的行为，而不使比较器容易受到排序算法实现的影响，从而保证结果的安全？我的意思是不违反类似的契约(Contract)等.. 最佳答案在
Lua:随机:百分比
我正在创建一个游戏，目前必须处理一些math.random问题。我的Lua能力不是那么强，你觉得怎么样您能制定一个使用 math.random 和给定百分比的算法吗？我的意思是这样的函数: fu
java - 如何在JavaFX场景中定位按钮？ (随机)
我想以某种方式让按钮在按下按钮时随机改变位置。我有一个想法如何解决这个问题，其中一个我在下面突出显示，但我已经认为这不是我需要的。 import javafx.application.Applicat
java - 随机#猜谜游戏无限循环
对于我的 Java 类(class)，我应该制作一个随机猜数字游戏。我一直陷入过去几天创建的循环中。程序的输出总是无限循环，我不明白为什么。非常感谢任何帮助。 /* This program wi
java - 随机(？)ElementNotVisibleException
我已经查看了涉及该主题的一些其他问题，但我没有在任何地方看到这个特定问题。我有一个点击 Web 元素的测试。我尝试通过 ID 和 XPath 引用它，并使用 wait.until() 等待它变得可见。
c# - 随机 InvalidCastException
我在具有自定义类的字典和列表中遇到了该异常。示例: List dsa = (List)Session["Display"]; 当我使用 Session 时，转换工作了 10-20 次..然后它开始抛
javascript - 数字游戏 - 随机
需要帮助以了解如何执行以下操作: 每隔 2 秒，这两个数字将生成包含从 1 到 3 的整数值的随机数。按下“匹配”按钮后，如果两个数字相同，则绿色标签上的数字增加 1。按下“匹配”按钮后，如果两个
C 随机，有问题
void getS(char *fileName){ FILE *src; if((src = fopen(fileName, "r")) == NULL){ prin
PHP MySQL 随机
如果我有 2 个具有以下字段的 MySQL 数据库... RequestDB: - Username - Category DisplayDB: - Username - Category
postgresql 随机()错误？
我有以下语句 select random() * 999 + 111 from generate_series(1,10) 结果是: 690,046183290426 983,732229881454
php - 随机标签不会消失
我有一个使用 3x4 CSS 网格构建的简单网站。但出于某种原因，当我在 chrome“检查”中检查页面时，有一个奇怪的空白显然不在我的代码中的标签。它会导致网站上出现额外的一行，从而导致出现
javascript动画后不透明度有时会(随机)改变
我有两个动画，一个是“过渡”，它在悬停时缩小图像，另一个是 animation2，其中图像的不透明度以周期性间隔重复变化。我有 animation2 在图像上进行，当我将鼠标悬停在它上面时，anim
c++ - 解释这个c++随机
如图所示post在 C++ 中有几种生成随机 float 的方法。但是我不完全理解答案的第三个选项: float r3 = LO + static_cast (rand()) /( static_c
javascript - 随机.addClass到多个div而不重复
我正在尝试将类添加到具有相同类的三个 div，但我不希望任何被添加的类重复。我有一个脚本可以将一个类添加到同时显示的 1、2 或 3 个 div。期望的效果是将图像显示为背景图像，并且在我的样式表中
python - 嵌套列表中的唯一值 - 随机
我有一个基本上可以工作的程序，它创建由用户设置的大小的嵌套列表，并根据用户输入重复。但是，我希望各个集合仅包含唯一值，目前这是我的输出。 > python3 testv.py Size of you
C# 随机(长)
我正在尝试基于 C# 中的种子生成一个数字。唯一的问题是种子太大而不能成为 int32。有什么方法可以像种子一样使用 long 吗？是的，种子必须很长。最佳答案这是我移植的 Java.Util.
c - 随机 float
我写这个函数是为了得到一个介于 0 .. 1 之间的伪随机 float : float randomFloat() { float r = (float)rand()/(float)RAN

首页

博学

6Ren·AI

商城

python - 非常大范围的高效随机生成器(在 python 中)

实现