- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在 JavaScript 中获取 [0, n) 范围内的随机整数的标准方法——或任何其他仅提供返回 [0,1) 范围内的 float 的 random() 函数的语言——是使用Math.floor(Math.random() * n)
。
假设我们对有理数集进行运算,那么这背后的数学就很简单了。问题是:由于 IEEE-754 float 的所有复杂性,最终的分布真的是均匀的吗?
考虑到一个 float 和下一个更高的 float 之间的差距随着它们变大而增加,我认为这应该引入某种偏向于较小数字的偏差。
最佳答案
不,对于 n
的大多数值,结果分布不会完全均匀。对于较小的值,它会非常接近均匀,以至于您很难从均匀分布中检测出任何差异,但随着 n
变大,偏差会变得很明显。
为了说明,这里有一些 Python 代码(不是 JavaScript,抱歉,但原理是一样的):
from collections import Counter
from random import random
def badrand(n):
return int(random() * n)
print(Counter(badrand(6755399441055744) % 3 for _ in range(10000000)))
这将生成 [0, 6755399441055744)
范围内的 1000 万个随机整数,将这些整数中的每一个减去模 3,并计算余数为 0、1 或 2 的次数。如果我们均匀地生成这些整数,我们希望余数模 3 大致均匀分布,因此我们希望计数相似。
这是在我的机器上运行它的示例结果:
Counter({1: 3751915, 0: 3334643, 2: 2913442})
也就是说,1
的余数 显着 比 0
更有可能出现,而 0
又比 更有可能出现2
的余数。这里的差异方式太大,无法用随机变化来解释。
那么到底出了什么问题呢? Python 的random()
函数质量比较高,基于Mersenne Twister。 ,所以我们不太可能看到由基本随机数生成器引起的统计问题。发生的事情是 random()
生成 2^53(大致)等可能结果之一 - 每个结果都是 x/2^53
形式的数字,表示某个整数x
在 [0, 2^53)
范围内。现在在 badrand
调用中,我们有效地将这些结果映射到 6755399441055744
可能的输出。现在这个值不是随机选择的(哈!);它正好是 2^53 的 3/4。这意味着在可能的最均匀分布下,2/3 可能的 badrand
输出值恰好被 2^53 个可能的 random()
输出值之一击中,而另外 1/3 被 2^53 个可能的 random()
输出值中的 两个 击中。也就是说,某些潜在输出的发生概率是其他输出的两倍。所以我们离制服还有很长的路要走。
您将在 JavaScript 中看到相同的效果。对于 Chrome,似乎 there are only 2^32 distinct results来自 Math.random()
,因此您应该能够找到类似上面的 n
小于(但接近)2^32 的效果。
当然,同样的效果也适用于小的n
:如果n = 5
,那么因为5
不是2^32
我们无法将所有 2^32
可能的 Math.random()
结果完美均匀地分布在 5 个期望结果之间:我们最好希望的是 5 个结果中的 4 个出现在 858993459 个可能的 random()
结果中,而第五个出现在 858993460 个 random()
结果中.但这种分布将非常接近均匀,以至于几乎不可能找到任何统计测试来告诉你不同的结果。因此,出于实际目的,使用较小的 n
应该是安全的。
http://bugs.python.org/issue9025 上有一个相关的 Python 错误可能很有趣.通过放弃计算这些数字的 int(random() * n)
方法,Python 3 解决了该错误。错误依旧remains不过在 Python 2 中。
关于javascript - 使用浮点源均匀分布整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32360671/
我正在尝试学习 Fortran,并且看到了很多不同的定义,我想知道他们是否正在尝试完成同样的事情。以下有什么区别? 整数*4 整数(4) 整数(kind=4) 最佳答案 在 Fortran >=90
我以前从未编程过,最近(1 周前)才开始学习!第一门类(class)是函数式编程,使用 Haskell。 我有一项学校作业,我想通过删除一两个步骤来改进它,但我遇到了一个讨厌的错误。 基本上,我创建了
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
我已经搜索了 StackOverflow,但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案,该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数,例
类似于我上一篇致歉的文章,但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时,优化重绘到 JFrame/JPanel 的最佳选择是什么。 此外,除了重绘重载之外,我并不是 100%
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能,我的教科书
我有一个数据结构,例如表达式树或图形。我想添加一些“测量”功能,例如depth和 size . 如何最好地键入这些函数? 我认为以下三个变体的用处大致相同: depth :: Expr -> Int
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
我是 Java 8 新手,想根据键对 Map 进行排序,然后在值内对每个列表进行排序。 我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小,y 是对内 vector 的大小。
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
我们可以使用 C++ STL 做这样的事情吗?如果是,我将如何初始化元素?我试图这样做,但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
您好,我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%,这个数字在哪个范围内居住?我可以使用这段
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我已经坚持了一段时间,我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同 如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是,我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
C++:vector>v(size);当我试图打印出值时显示 0 作为值,但是当未声明 vector 大小时它显示正确的输出?为什么这样?例如: int x; cin>>x; vector>v(x);
我是一名优秀的程序员,十分优秀!