- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
假设我有一个这样的列表:['a','b','c']
.我需要从这个列表中得到一个随机组合,例如 ['a','c']
.但是,我需要所有组合具有相同的概率,以便获得 ['a']
的机会应该与获得 ['b','c']
的机会完全相同.我的真实列表有 22 个元素,因此不可能枚举每个组合。我的第一个想法是使用 random.sample 但是这需要您指定元素的数量,这些元素必须随机选择但概率必须是(此组合中的元素数量)/(所有组合中的元素数量) 这是巨大的数字。有没有更好的办法?这将运行数千次,因此非常感谢高效的解决方案。
最佳答案
有一种非常有效的方法可以做到这一点。给定集合的所有组合的集合称为 power set ,给定集合的所有子集的集合。如果集合 S 包含 m 项,则总共有 2**m
种可能的组合,包括空集和 S 本身。
所以要从 S 的幂集中随机选择一个组合,我们只需要从 range(2**m)
中选择一个随机数 n 作为幂集中的索引,然后生成n对应的组合。
我们可以通过查看 n 的二进制展开将索引号 n 转换为组合。 n中有m位。我们将这些位与 S 中的项目配对。如果给定位为 1,则该项目被选择用于我们的组合,如果为 0,则我们拒绝该项目。
这是一个简短的演示。
from random import seed, randrange
seed(42)
def indexed_combination(seq, n):
result = []
for u in seq:
if n & 1:
result.append(u)
n >>= 1
if not n:
break
return result
print('Testing indexed_combination')
seq = 'abc'
for i in range(1 << len(seq)):
print(i, ''.join(indexed_combination(seq, i)))
print()
def random_combination(seq):
n = randrange(1 << len(seq))
return indexed_combination(seq, n)
print('Testing random_combination')
seq = 'abcdefghij'
for i in range(20):
print(i, random_combination(seq))
输出
Testing indexed_combination
0
1 a
2 b
3 ab
4 c
5 ac
6 bc
7 abc
Testing random_combination
0 ['c', 'f', 'g', 'h']
1 ['a', 'b', 'e', 'f']
2 ['a', 'b', 'e', 'f', 'j']
3 ['a', 'c', 'e', 'f', 'g', 'h', 'i']
4 ['a', 'd', 'g', 'h', 'i']
5 ['a', 'c', 'd', 'e', 'i']
6 ['a', 'e', 'g', 'h']
7 ['b', 'e', 'f', 'h']
8 ['f', 'g', 'i', 'j']
9 ['a', 'g']
10 ['a', 'c', 'd', 'e', 'f']
11 ['a', 'b', 'c', 'd', 'e', 'f', 'h']
12 ['a', 'b', 'c', 'd', 'e', 'f', 'h', 'i']
13 ['c', 'd', 'e', 'g', 'h', 'i']
14 ['b', 'c', 'e', 'f']
15 ['a', 'b', 'c', 'e', 'h', 'i']
16 ['a', 'b', 'd', 'e', 'g', 'i', 'j']
17 ['a', 'b', 'g', 'h', 'i']
18 ['a', 'b', 'c', 'e', 'h', 'i', 'j']
19 ['a', 'd', 'e', 'f', 'j']
我在脚本的开头使用固定的种子编号调用随机 seed
函数。我发现在开发使用伪随机数的代码时这样做很方便,因为当随机数可重现时,它可以更轻松地测试和调试代码。在实际应用中,您应该使用系统熵源为 radomizer 播种。您可以通过消除 seed
调用或执行 seed(None)
轻松地做到这一点。如果你想要比标准 Mersenee Twister 生成器提供的更多的随机性,你可以通过 random.SystemRandom
连接到系统的随机源。类。
关于python - 从 python 中的列表生成一个随机的、等概率的组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47234958/
接下来是我的代码: with open("test.txt") as f_in: for line in f_in: for char in line:
我们有一个六面骰子,面编号为 1 到 6。随着 n 的增加,在第 n 卷中第一次看到 1 的概率降低。我想找到最小的卷数,使得这个概率小于某个给定的限制。 def probTest(limit):
我只是想知道为什么运行下面的代码时出现错误。我正在尝试使用 numpy 为基于文本的游戏计算概率。下面的代码不是游戏本身的代码。这仅用于测试目的和学习。感谢您提前的答复,请对我宽容一点。 from n
我目前正在创建一个与多个arduino板通信的服务器软件。由于硬件原因,我使用UDP协议(protocol)。我有一个非常简单的机制,在大多数情况下,当包裹丢失时,它会重新发送包裹。我现在有两个问题:
我想在 LinearLayout 上添加一个 fling Action 。为此,我使用了以下代码。 public class NewsActivity extends Activity { .
下面是其中一个 facebook 谜题:我无法理解如何进行此操作。 你有 C 个容器、B 个黑球和无限数量的白球。您希望以一种方式在容器之间分配球,即每个容器至少包含一个球,并且选择白球的概率大于或等
我有一个希伯来语文本,就像 "×گض¸×¨ض´×™×،ض°×کוض¹×ں",我想将它转换为可读的 unicode 希伯来语字符。 我试过这段代码: const string Str = "×گض¸×
我正在尝试使用 Random.nextDouble() 获取 1.0 和 10.0 之间的随机双数: double number = 1.0 + (10.0-1.0) * Random.nextDou
我目前已经为二进制类实现了概率(至少我这么认为)。现在我想扩展这种回归方法,并尝试将其用于波士顿数据集。不幸的是,我的算法似乎被卡住了,我当前运行的代码如下所示: from sklearn impor
我在 2D 空间中有一小组数据点(大约 10 个),每个数据点都有一个类别标签。我希望根据现有数据点标签对新数据点进行分类,并关联属于任何特定标签类别的“概率”。 基于最近邻的标签来标记新点是否合适(
我正在做我的第一个 tensorflow 项目。 我需要获得给定输入和预期序列的 ctc 概率(不是 ctc 损失)。 在 python 或 c++ 中是否有任何 api 或方法可以做到这一点? 我更
我正在尝试通过 assignment 1斯坦福 cs244n 类(class)。问题 1b 强烈建议对 Softmax 函数进行优化。我设法得到了N维向量的Softmax。我还得到了 MxN 维矩阵的
我有一个预测算法的想法,该算法可以根据所选项目先前出现的顺序准确预测随机值,并分析模式以提高准确性。 基本上是一种接受两个参数的算法,一个是一组可能的选择;另一个是这些数字的历史,分析该模式并预测序列
自 HOURS 以来,我一直在努力思考这个 TopCoder 问题,但无法找到一个完美的解决方案,并找到了下面给出的一个使用得非常漂亮的解决方案! 我想弄清楚这个解决方案如何适用于给定的问题?而我当初
我只知道如何生成随机 boolean 值(真/假)。默认概率为 50:50 但是我怎样才能用我自己的概率生成真假值呢?假设它以 40:60 或 20:80 等的概率返回 true... 最佳答案 一种
对于以下示例,我如何计算 julia 中的百分位数/概率值/尾部区域 Example : N(1100, 200) #Normally distributed with mean 1100 & st
我正在尝试修改标准 kNN 算法来获取属于某个类别的概率,而不仅仅是通常的分类。我还没有找到太多关于概率 kNN 的信息,但据我了解,它的工作原理与 kNN 类似,不同之处在于它计算给定半径内每个类的
我正在使用 PostgreSQL 为我所有数据中的变量对计算经验概率密度函数。我试图确定在计算 PDF 之前索引是否/何时更有效。我像这样运行 EXPLAIN CREATE INDEX, EXPLAI
有谁知道当查询有偏移时如何在 MySql 中请求“实时结果集”(例如:select * from table limit 10 offset 20;)。它正在经历类似 的错误 'invalid use
unsigned long long int first( int b , int c){ int h=b; //int k; for(int k=b-1;k>c;k--){ b=b*k;
我是一名优秀的程序员,十分优秀!