- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这可能是一个简单的问题,但我就是无法解决。我有一个生物化学测试结果的数据框。其中一些测试如 base_crp
返回类似 <3
的值因为检测的限制。在继续之前我需要估算这些数据。我想正确地执行此操作,而不仅仅是替换。
我尝试了来自zCompositions的multLN但似乎认为所有的包<3
值为负(错误显示 X contains negative values
)。似乎也没有太多文档 - 这是一个不起眼的包吗?
我还查看了LODI但它希望我指定插补模型的协变量 - 有没有正确的方法来选择这些变量?无论如何,我选择了 3 个理论上相关性良好的值并使用了以下代码:
clmi.out <- clmi(formula = log(base_crp) ~ base_wcc + base_neut + base_lymph, df = all, lod = crplim, seed = 12345, n.imps = 5)
其中 base_crp 是我要修复的变量。我将所有 <3 替换为 NA
并插入一个新列 all$crplim <- "3"
。然而,这只是回归 Error in sprintf("%s must be numeric.") : too few arguments
.
即使我能让 LODI 工作,我也不确定它是否是正确的工具。我只是一名本科生,几乎没有统计背景,所以我不太明白我在做什么——我只是想要一些用数字填充列的东西,这样我就可以继续使用 PIL 逊相关性和线性回归等。我真的很感激一些帮助。提前致谢。
最佳答案
我之前做过一些 CRP(C react 蛋白)水平的统计建模 - 请参阅 this peer-reviewed paper举个例子。 CRP 呈近似对数正态分布,所有测试指标的未选择人群中的中值通常约为 3.5 mg/l(大多数健康人属于“<3mg/l”类别)。您可能不想使用插补模型,因为这些模型用于缺失数据。低 CRP 数据没有丢失。您已经知道它位于某个范围内,因此如果您以这种方式进行插补,您就会丢失信息。
将“<3”替换为回归等的数值是合理的,只要您使用它来将 CRP 与临床结果等相关联,而不是(正如 Ben Norris 指出的那样)用于 CRP 机器校准。
我可以从我上面链接的研究中超过 10,000 个高灵敏度 CRP 测量样本的数据告诉您,CRP < 3 的人的平均 CRP 约为 1.3,并且将您的所有“对于大多数真实世界的临床观察研究,CRP < 3"测量值为 1.3。
如果您确实需要在缺失的 CRP 上获得合理的数值,您可以估算对数正态分布的下半部分。以下函数将为您提供的数字可能与现实生活中的 CRP 测量值无法区分:
impute_crp <- function(n)
{
x <- exp(rnorm(10 * n, 1.355, 1.45))
round(x[x < 3][seq(n)], 1)
}
所以你可以这样做
impute_crp(10)
#> [1] 1.5 2.0 1.1 0.4 2.5 0.1 0.7 1.5 1.4 0.4
还有
base_crp[base_crp == "<3"] <- impute_crp(length(which(base_crp == "<3"))
但是,您会注意到我在自己的 CRP 模型中根本没有使用插补。将较低的值替换为检测阈值对于建模来说已经足够了 - 而且我相当确定是否用对数正态尾部替换“< 3”,或者全部 1.3,或者全部 2,都没有什么区别得出您试图得出的结论。
关于r - 在 R 中,如何估算低于检测限的左删失数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63936449/
架构设计(九):估算 作者: Grey 。 原文地址: 博客园:架构设计(九):估算 。 CSDN:架构设计(九):估算 。 估算在系统设计中非常重要,这决定了你的设计是否可以满足要求,
我有以下 JavaScript 代码,它使用 sql.js库与远程 SQL 数据库通信。 var xhr = new XMLHttpRequest(); xhr.open('GET', 'https:
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
我正在使用启用了 ARC 的 Cocos2d 2.0。我的游戏是一个随机生成的游戏,所以我需要在游戏中间的场景中加载/卸载纹理(spritesheet-batchnode)。我正在尝试从文件中删除 s
我有一个不完整的数据框,incomplete_df,如下所示。我想用相应 id 的平均 amount 来估算缺失的 amount。如果该特定 id 的平均值本身就是 NaN(参见 id=4),我想使用
我正在研究 NOAA AVHRR 31 年的每日海面温度 (SST) 数据。数据采用 NetCDF 格式,维度为 28(经)x 40(纬度)x 11686(天)。我应该计算每月的气候平均值(例如 31
我想为给定现有值的变量估算缺失值。 在 var2 ,我们注意到有很多NA s。 如果任何 2 个 ID 相同,则它们的值 var2是相同的。 如果 id 没有 var2 的值,就像 id==2 的情况
我想了解(大概)读取 Android SD 卡上存储的大文件(50MB 到 100MB)需要多长时间。我在 Google Nexus One 上的 Android 2.3.3 上使用以下代码。这会给我
估计 json 对象(如果 JSon 大小可用)将在 MongoDB 中占用多少存储内存的最佳方法是什么?有某种相关公式吗? 最佳答案 有 Object.bsonsize() 方法 mongo She
我有缺失值的数据框 (DF1),我想从不同的数据框 (DF2) 中估算这些缺失值,同时保留索引而不对它们进行排序(非常重要)。我正试图找到最有效的方法来做到这一点。 DF1: index id t
我正在尝试估算将返回大量结果的应用引擎查询的结果总量。 为了做到这一点,我为每个实体分配了一个介于 0 和 1 之间的随机 float 。然后我执行了我想用以下 3 个设置估计总结果的查询: * I
我正在尝试制作一个简单的 js 机器人,它检查每个区 block 的 eth(或链的主要 token )并将其发送到另一个钱包。 我有一个工作机器人: const { ethers } = requi
我最近一直在考虑将 Azure 作为许多具有 MSSql 数据库后端的小型 asp.net 网站的托管平台。我目前使用非 Microsoft 主机,每月收取固定费用。 我看过的 Azure 演示和网络
我是 C++ 新手。我正在尝试使用计算机系统的随机数生成器根据 Ernesto Cesaro 定理统计确定 Pi 的值。但是我现在所做的可以输入一个种子数并生成100个伪随机数,然后估计pi的值。生成
在我看来,我并不完全理解 FLOPS 的概念。在 CUDA SAMPLES 中,有 Matrix Multiplication Example (0_Simple/matrixMul)。在此示例中,每
我是一名优秀的程序员,十分优秀!