r - 计算错误 R，与大数字的组合偶尔会产生错误的数字-6ren

r - 计算错误 R，与大数字的组合偶尔会产生错误的数字

转载作者：行者123 更新时间：2023-12-04 17:44:40

25

4

我在 R 中创建了一个组合公式来计算大数的组合。

  combination_1 <- function(n,r){
  n_0 <- n
  num <- 1
  denom <- factorial(r)
  for(i in 1:(r)){
    num <- num * n_0
    n_0 <- n_0-1
  }
  num/denom
}

然后，当两个量相等时，我将这个组合公式应用到 for 循环测试中，然后打印出各自的 n、m 和 r 值。

 both_large <- function(n,m,r){m*combination_1(n,r)}
 both_small <- function(n,m,r){factorial(m)*combination_1(n,(r-1))} 

 for(m in 3:8){
 for(n in 20:20000){
    for(r in 1:20){
      if(both_large(n,m,r) - both_small(n,m,r) == 0){
       cat('r = ', r, ', n = ', n,', m= ',m, '\n')
      }
    }
   }
}

然而，此代码仅在某些时候有效。下面显示了以下输出，其中跳过了 r = 9 处的值。

r =  6 , n =  149 , m=  5 
r =  7 , n =  174 , m=  5 
r =  8 , n =  199 , m=  5 
r =  10 , n =  249 , m=  5 
r =  11 , n =  274 , m=  5

在 r = 9, n = 224, m = 5 处肯定有一个值；但是，当我对这些特定值进行减法运算时，R 计算出的值为 -2。当我通过 Wolfram Alpha 运行它时，它计算出的值为 0。我还找到了一种方法来进一步简化我的公式，简化版本的结果也为 0。

为什么 R 不计算 r = 9 时的值，而是在 r = 10 和 r = 11 时正确计算更大的值？它是某种舍入误差吗？如果是，为什么它会计算更大的值？它也不会计算其他值。这只是第一个没有发生的案例。

谢谢!

最佳答案

这是 double precision 的问题。在文章中，我们看到 double 数据类型以 64 位存储，分割如下:

符号位:1位
指数:11位
有效位数精度:53 位(显式存储 52 位)

将其转换为以 10 为底数，我们看到我们保证至少获得 15 位十进制数字的精度。

log10(2^53 - 1)
[1] 15.95459

我们可以通过使用简单的算术观察奇怪的行为来看到这一点:

options(scipen = 999)

1e16
[1] 10000000000000000

1e16 + 5
[1] 10000000000000004  ## incorrect.. should be 10000000000000005

以您的 r = 9、n = 224 和 m = 5 以及一些 print 为例> 您的 combination_1 函数中的语句，我们发现了罪魁祸首:

combination_1_Verbose <- function(n,r,verbose = FALSE){
    n_0 <- n
    num <- 1
    denom <- factorial(r)
    for(i in 1:(r)){
        num <- num * n_0
        n_0 <- n_0-1
    }

    if (verbose) {
        print(num)
        print(log10(num))
    }

    num/denom
}

combination_1_Verbose(n, r - 1, TRUE)
[1] 5585745606995474432
[1] 18.74708
[1] 138535357316356

我们正在对超过 18 位数字进行算术运算……超出了 double 据类型提供给我们的精度范围。

同样不明显的是，返回值并不完全是 138535357316356。使用 print 的 digits 参数，我们实际上看到返回值不是整数。

print(combination_1_Verbose(n, r - 1), digits = 22)
[1] 138535357316356.015625

这最终成为您错误的根源。如果我们取 .015625 并乘以 factorial(m) = 120，我们得到:

.015625 * 120
[1] 1.875

这会四舍五入到 2，这是我们检查中的差值。

我们可以使用多精度库 gmp 纠正这种行为:

library(gmp)
combination_1_GMP <- function(n,r,verbose = FALSE){
    n_0 <- as.bigz(n)
    num <- as.bigz(1)
    denom <- factorialZ(r)
    for(i in 1:(r)){
        num <- mul.bigz(num, n_0)
        n_0 <- sub.bigz(n_0, 1)
    }
    
    if (verbose) {
        print(num)
        print(log10(num))
    }
    
    as.bigz(num/denom)
}

combination_1_GMP(n, r-1, TRUE)
Big Integer ('bigz') :
[1] 5585745606995473920
[1] 18.74708
Big Integer ('bigz') :
[1] 138535357316356

在原始函数中，num 为 5585745606995474432，而在我们的 gmp 示例中，我们获得了 5585745606995473920。请注意，差异小于 500，这是一个 3 位数的数字。这是有道理的，因为我们的数字超过 18 位，并且如上所述，我们只能保证总共 15 位精度(即 18 - 3 = 15)。

或者，我们可以四舍五入最终结果。如果绝对需要精度，我不会推荐此选项，因为 n、m 和 r 的某些值仍然会受 double 的支配。它在这个例子中虽然有效:

combination_1_Round <- function(n,r){
    n_0 <- n
    num <- 1
    denom <- factorial(r)
    for(i in 1:(r)){
        num <- num * n_0
        n_0 <- n_0-1
    }
    round(num/denom)
}

both_large_r <- function(n,m,r){m*combination_1_Round(n,r)}
both_small_r <- function(n,m,r){factorial(m)*combination_1_Round(n,(r-1))}

both_large_r(n,m,r) - both_small_r(n,m,r)
[1] 0

最后，您最好的选择是重写您的算法以将数字保持在 double 限制内。

combination_1_Improved <- function(n,r){
    
    denom <- num <- 1
    i <- (n - r + 1)
    
    for (denom in 1:r) {
        num <- num * i;
        num <- num / denom;
        i <- i + 1
    }
    
    num
}

print(combination_1_Improved(n,r-1), digits = 22)
[1] 138535357316356

关于r - 计算错误 R，与大数字的组合偶尔会产生错误的数字，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52708595/

25

4

0

文章推荐： wpf - StringFormat 中的空格

QTCreator 的集成表单编辑器不会加载自定义小部件插件(Designer 会)
尝试使用集成到 QTCreator 的表单编辑器，但即使我将插件放入 QtCreator.app/Contents/MacOS/designer 也不会显示。不过，相同的 dylib 文件确实适用于独
java - 会 this.method2();跳过返回值？
在此代码示例中。 “this.method2();”之后会读到什么？在返回returnedValue之前会跳转到method2()吗？ public int method1(int returnedV
java - Gradle 不会解析依赖关系(Maven 会)
我的项目有通过gradle配置的依赖项。我想添加以下依赖项: compile group: 'org.restlet.jse', name: 'org.restlet.ext.apispark', v
polymer - polymer 会 build 更多现成可用的组件吗？
我将把我们基于 Windows 的客户管理软件移植到基于 Web 的软件。我发现 polymer 可能是一种选择。但是，对于我们的使用，我们找不到 polymer 组件具有表格 View 、下拉菜单
java - 从项目文件夹中读取文件，eclipse 会，但终端不会
我的项目文件夹 Project 中有一个文件夹，比如 ED 文件夹，当我在 Eclipse 中指定在哪里查找我写入的文件时 File file = new File("ED/text.txt"); e
javascript - jQuery 动画背景位置不会改变但 css 会
这是奇怪的事情，这个有效: $('#box').css({"backgroundPosition": "0px 250px"}); 但这不起作用，它只是不改变位置: $('#box').animate
javascript - 为什么按位运算符 OR 会 chop 此示例中的值？
这个问题在这里已经有了答案: Why does OR 0 round numbers in Javascript? (3 个答案) 关闭 5 年前。 Mozilla JavaScript Guide
c - strcmpi 代码不会编译但 strcmp 会？
这个问题在这里已经有了答案: Is the function strcmpi in the C standard libary of ISO? (3 个答案) 关闭 8 年前。我有一个问题，为什么
mysql - MySQL 会/是否支持 DATETIMEOFFSET？
我目前使用的是共享主机方案，我不确定它使用的是哪个版本的 MySQL，但它似乎不支持 DATETIMEOFFSET 类型。是否存在支持 DATETIMEOFFSET 的 MySQL 版本？或者有计划
java - CDI 会(或应该)提供包限定符吗？
研究 Seam 3，我发现 Seam Solder 允许将 @Named 注释应用于包 - 在这种情况下，该包中的所有 bean 都将自动命名，就好像它们符合条件一样@Named 他们自己。我没有看到
arrays - `removeLast` 会 swift 减少数组的容量吗？
我知道 .append 偶尔会增加数组的容量并形成数组的新副本，但 .removeLast 会逆转这种情况并减少容量通过复制到一个新的更小的数组来改变数组？最佳答案否(或者至少如果是，则它是一个错
ruby - Ruby 会*快*吗？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
c++ - noexcept 会 boost 性能吗？
noexcept 函数说明符是否旨在 boost 性能，因为生成的对象中可能没有记录异常的代码，因此应尽可能将其添加到函数声明和定义中？我首先想到了可调用对象的包装器，其中 noexcept 可能会产
Angularjs Promise.all 不会更新范围，而 $q.all 会
我正在使用 Angularjs 1.3.7，刚刚发现 Promise.all 在成功响应后不会更新 angularjs View ，而 $q.all 会。由于 Promises 包含在 native
javascript - 为什么移动 0 会 chop 小数？
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用
haskell - 为什么 Haskell 会(显然)不一致地推断出特定类型？
我正在编写一个玩具(物理)矢量库，并且遇到了 GHC 坚持认为函数应该具有 Integer 的问题。是他们的类型。我希望向量乘以向量以及标量(仅使用 * )，虽然这可以通过仅使用 Vector 来实现
email - Swiftmailer 不会发送邮件，但是 mail() 会
PHP 的 mail() 函数发送邮件正常，但 Swiftmailer 的 Swift_MailTransport 不起作用! 这有效: mail('user@example.com', 'test
PHP 脚本不会转储 SQL 但 phpMyAdmin 会
我尝试通过 php 脚本转储我的数据，但没有命令行。所以我用 this script 创建了我的 .sql 文件然后我尝试使用我的脚本: $link = mysql_connect($host, $u
python sqlite3 不会执行连接，但单独的 sqlite3 会
使用 python 2.6.4 中的 sqlite3 标准库，以下查询在 sqlite3 命令行上运行良好: select segmentid, node_t, start, number,title
javascript - 为什么移动 0 会 chop 小数？
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用

首页

博学

6Ren·AI

商城

r - 计算错误 R，与大数字的组合偶尔会产生错误的数字