r - mgcv_1.8-24 : "fREML" or "REML" method of bam() gives wrong explained deviance-6ren

r - mgcv_1.8-24 : "fREML" or "REML" method of bam() gives wrong explained deviance

转载作者：行者123 更新时间：2023-12-03 18:31:00

30

4

与 bam 安装相同型号使用方法“fREML”和“REML”给了我接近的结果，但解释的偏差与 summary.gam 返回的结果完全不同。 .

“fREML”的数量是~3.5%(不好)，而“REML”的数量是~50%(不是那么糟糕)。怎么可能？哪一个是正确的？

不幸的是，我无法提供一个简单的可重现示例。

#######################################
## method = "fREML", discrete = TRUE ##
#######################################

Family: binomial 
Link function: logit 
Formula:
ObsOrRand ~ s(Var1, k = 3) + s(RandomVar, bs = "re")  
Parametric coefficients:
            Estimate Std. Error z value Pr(>|z|) 
(Intercept)  -5.0026     0.2199  -22.75   <2e-16  
Approximate significance of smooth terms:
                  edf Ref.df Chi.sq  p-value 
s(Var1)          1.00  1.001  17.54 2.82e-05 
s(RandomVar)     16.39 19.000 145.03  < 2e-16  
R-sq.(adj) =  0.00349   Deviance explained = 3.57%
fREML = 2.8927e+05  Scale est. = 1         n = 312515

########################################
## method = "fREML", discrete = FALSE ##
########################################

Family: binomial 
Link function: logit 
Formula:
ObsOrRand ~ s(Var1, k = 3) + s(RandomVar, bs = "re")  
Parametric coefficients:
            Estimate Std. Error z value Pr(>|z|) 
(Intercept)  -4.8941     0.2207  -22.18   <2e-16  
Approximate significance of smooth terms:
                  edf Ref.df Chi.sq  p-value 
s(Var1)          1.008  1.016  17.44 3.09e-05 
s(RandomVar)     16.390 19.000 144.86  < 2e-16  
R-sq.(adj) =  0.00349   Deviance explained = 3.57%
fREML = 3.1556e+05  Scale est. = 1         n = 312515

#####################################################
## method = "REML", discrete method not applicable ##
#####################################################

Family: binomial 
Link function: logit 
Formula:
ObsOrRand ~ s(Var1, k = 3) + s(RandomVar, bs = "re")  
Parametric coefficients:
            Estimate Std. Error z value Pr(>|z|) 
(Intercept)  -4.8928     0.2205  -22.19   <2e-16  
Approximate significance of smooth terms:
                  edf Ref.df Chi.sq  p-value 
s(Var1)          1.156  1.278  16.57 8.53e-05 
s(RandomVar)     16.379 19.000 142.60  < 2e-16  
R-sq.(adj) =  0.0035   Deviance explained = 50.8%
-REML = 3.1555e+05  Scale est. = 1         n = 312515

最佳答案

此问题可回溯至 mgcv_1.8-23 .它的阅读日志:

* bam extended family extension had introduced a bug in null deviance 
  computation for Gaussian additive case when using methods other than fREML 
  or GCV.Cp. Fixed.

现在证明补丁对高斯情况是成功的，但对非高斯情况则不然。

让我首先提供一个可重复的示例，因为您的问题没有。

set.seed(0)
x <- runif(1000)
## the linear predictor is a 3rd degree polynomial
p <- binomial()$linkinv(0.5 + poly(x, 3) %*% rnorm(3) * 20)
## p is well spread out on (0, 1); check `hist(p)`
y <- rbinom(1000, 1, p)

library(mgcv)
#Loading required package: nlme
#This is mgcv 1.8-24. For overview type 'help("mgcv-package")'.

fREML <- bam(y ~ s(x, bs = 'cr', k = 8), family = binomial(), method = "fREML")
REML <- bam(y ~ s(x, bs = 'cr', k = 8), family = binomial(), method = "REML")
GCV <- bam(y ~ s(x, bs = 'cr', k = 8), family = binomial(), method = "GCV.Cp")

## explained.deviance = (null.deviance - deviance) / null.deviance
## so in this example we get negative explained deviance for "REML" method

unlist(REML[c("null.deviance", "deviance")])
#null.deviance      deviance 
#     181.7107     1107.5241 

unlist(fREML[c("null.deviance", "deviance")])
#null.deviance      deviance 
#     1357.936      1107.524 

unlist(GCV[c("null.deviance", "deviance")])
#null.deviance      deviance 
#     1357.936      1108.108

空偏差不能小于偏差(TSS不能小于RSS)，所以 bam的“REML”方法无法在此处返回正确的 Null 偏差。

我在 mgcv_1.8-24/R/bam.r 的第 1350 行找到了问题:

object$family <- object$fitted.values <- NULL

其实应该是

object$null.deviance <- object$fitted.values <- NULL

对于“GCV.Cp”和“fREML”以外的方法， bam依赖 gam为估算，缩小后的大 n x p模型矩阵到 p x p矩阵( n :数据数量； p :系数数量)。由于这个新模型矩阵没有自然解释， gam 返回的许多数量应该无效(除了估计的平滑参数)。西蒙输入 family 是个错字.

我构建了一个修补版本，结果证明可以修复该错误。我会告诉 Simon 在下一个版本中修复它。

关于r - mgcv_1.8-24 : "fREML" or "REML" method of bam() gives wrong explained deviance，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51523009/

30

4

0

文章推荐： iphone - objective-c 中的SQLite错误

文章推荐： javascript - 在单独的 Javascript 文件中获取模型值

文章推荐： delphi - 数据集取消或中止(正确的方法)？

文章推荐： delphi - 用于调试的Delphi编译器选项

python - 按集群拆分 bam，然后使用检查点按集群合并 bam
我有来自 3 个不同样本的三个单细胞 bam 文件，我需要将它们分成更小的 bams。然后我需要合并来自相同集群的不同样本的 bam 文件。我尝试使用检查点但有点迷路。 https://snakema
wso2 - BAM 管理员密码更改后任务失败
在 WSO2 BAM 4.1.0 中更改 admin 用户的默认密码后，任务失败并显示以下错误: TID: [0] [BAM] [2013-06-20 16:56:15,464] ERROR {org
binary - 任何语言的十六进制到二进制角度测量 (BAMS)
我有一个 32 位十六进制值，例如 04FA4FA4，我想知道如何将它转换为 BAMS以双人的形式。任何语言的例子都可以，我只关心学习算法或公式来进行转换。当我有类似 000:00.0000 的形式时
rest - WSO2 BAM:如何通过REST端点发送日志事件
Closed. This question needs to be more focused。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过editing this post专注于一个问题
wso2 - WSO2 BAM 的创建小工具
我正在为 WSO2 BAM 仪表板创建小工具。我需要将数据添加到提供受监控服务器服务的图表中。如何将这些数据作为图表的值？最佳答案遵循的标准方法是，您需要首先通过服务公开这些数据。例如:可以通过
namespaces - wso2 esb bam 服务器配置文件命名空间
我们如何在 BAM 服务器配置文件流定义(来自 WSO2 ESB 管理控制台)下实现命名空间处理，而不是在使用 XPath 表达式的中介流下进行处理？我们怀疑当输入有效载荷很大时这会导致性能问题，因
wso2 - BAM 中介不与 WSO2ESB 一起工作
我已经安装了最新版本的 WSO2 BAM (2.4.1) 和 WSO2 ESB (4.8.1)。 ESB 中的 BAM 调解器不工作。每次尝试向 BAM 发送消息时，它都会抛出以下异常。你能帮忙吗？
alignment - 使用 BWA 创建用于下游分析的输入 BAM 文件
我有大肠杆菌的 Illumina 双端读段，用于创建组装草图 (SPAdes)。我现在的任务是创建我将与 Pilon 一起使用的输入 BAM 文件——它用于改进草图程序集。我决定使用此处的文档来使用
r - 使用 bam 的零膨胀模型 (ziP) 中的错误
我正在尝试使用 bam 来运行以下广义加性模型: m runif(n) y[!ind] summary(b) Family: Zero inflated Poisson(-1.855,1.2
WSO2 在 ESB 中添加 BAM 配置文件
我们在尝试按照手册将 BAM 配置文件添加到 ESB 时遇到问题: http://docs.wso2.org/wiki/display/BAM201/Setting+up+BAM+Mediator#S
wso2 - 从后端服务传递到 API 管理器或 BAM 的计费详细信息
我们有一些服务(使用 WSO2 API Manager 公开)。我们想为消费者做帐单。不幸的是，我们的计费规则需要一些仅在已实现服务中可用的详细信息。我可以看到两种处理方法: 将详细信息作为一种元数
parsing - 从单个字符串有效地计算统计数据(bowtie2 的 bam 文件)
我的目标是有效地将包含短 DNA 测序读取的 bowtie2 映射的 bam 文件转换为包含映射开始和同一性百分比的简单表格。我即将完成此任务，但是我的解决方案非常慢并且无法处理重要的异常。我将逐步说
cassandra - WSO2 BAM 数据库，而不是 Cassandra
我们可以插入除 Cassandra 之外的任何其他数据库，因为所有发布的数据都进入 Cassandra 吗？最佳答案不，目前 WSO2 BAM 默认支持 Cassandra。但是，如果需要，可以通
python - 使用 Pysam 访问特定位置的 Bam 文件
我有给定的染色体编号和位置(chr1 和位置 1599812)。我想使用 python 的 pysam 模块访问 bam 文件以获取仅特定区域 chr1 和位置 1599812 的读取数字信息。我尝试
WSO2 BAM 2.4.0 启动失败 - 无法启动连接池
我在具有 CEP 和 APIM 实例的服务器中运行 BAM 2.4.0。此外，我正在使用 +2 端口偏移运行它。但是当我启动 BAM 时，控制台打印: [2014-03-06 16:34:04,126
wso2 - WSO2 DAS 是 WSO2 BAM 的新名称还是后继产品？
我们正在评估 WSO2 API Manager 1.8.0 (WSO2 AM) 和 WSO2 Business Activity Monitor 2.5.0 (WSO2 BAM)。从我们的支持合作伙伴
bioinformatics - 修剪 Illumina 在 bam/sam 文件中读取
我发现有很多工具可用于修剪 fastq 格式的 reads，但是否有任何工具可用于修剪已对齐的 reads？最佳答案我个人不鼓励在比对您的读段后对读段进行修整，尤其是当您尝试修整的序列是接头序列时
linux - 如何加速在非常大的单单元 BAM 文件上使用 Regex 的 sed
我有以下尝试计数的简单脚本 SAM/BAM file 中用 "CB:Z"编码的标签: samtools view -h small.bam | grep "CB:Z:" | sed 's/.
java - 如何使用 WSO2 BAM 监控 Web 应用程序？
我有一个 Web 应用程序 (java)，我想从 BAM 监控它，到目前为止我所做的一切都在此链接中进行了解释: Setting up Message Tracer Filter to a web a
mysql - 在 WSO2 BAM 2.0 中使用数据源
我想使用 MySQL 数据库将 Hive 分析脚本的结果存储在 BAM 2.0.1 中。查看提供的示例，我可以看到我必须使用许多属性 (mapred.jdbc.*) 来传递连接信息。有没有办法使用

首页

博学

6Ren·AI

商城

r - mgcv_1.8-24 : "fREML" or "REML" method of bam() gives wrong explained deviance