r - R : Take 3 中 MI 数据的描述性统计-6ren

r - R : Take 3 中 MI 数据的描述性统计

转载作者：行者123 更新时间：2023-12-05 08:26:50

27

4

作为 R 初学者，我发现弄清楚如何计算乘法插补数据的描述性统计数据非常困难(比运行其他一些基本分析更难，例如相关性和回归)。

这些类型的问题以道歉(Descriptive statistics (Means, StdDevs) using multiply imputed data: R)开头，但尚未得到回答(https://stats.stackexchange.com/questions/296193/pooling-basic-descriptives-from-several-multiply-imputed-datasets-using-mice)或很快投下反对票。

这里是 miceadds 函数 ( https://www.rdocumentation.org/packages/miceadds/versions/2.10-14/topics/stats0 ) 的描述，我发现很难理解以 mids 格式存储的数据。

我已经使用 summary(complete(imp)) 获得了一些输出，例如平均值、中位数、最小值、最大值，但很想知道如何获得额外的汇总输出(例如，偏斜/峰度、标准差、方差)。

从上面的以前的海报借来的插图:

  > imp <- mice(nhanes, seed = 23109)

    iter imp variable
    1   1  bmi  hyp  chl
    1   2  bmi  hyp  chl
    1   3  bmi  hyp  chl
    1   4  bmi  hyp  chl
    1   5  bmi  hyp  chl
    2   1  bmi  hyp  chl
    2   2  bmi  hyp  chl
    2   3  bmi  hyp  chl

  > summary(complete(imp))
   age         bmi        hyp         chl     
   1:12   Min.   :20.40   1:18   Min.   :113  
   2: 7   1st Qu.:24.90   2: 7   1st Qu.:186  
   3: 6   Median :27.40          Median :199  
          Mean   :27.37          Mean   :194  
          3rd Qu.:30.10          3rd Qu.:218  
          Max.   :35.30          Max.   :284

有人会花时间说明如何使用 mids 对象来获得基本描述吗？

最佳答案

以下是您可以执行的一些步骤，以更好地了解每个步骤后 R 对象会发生什么。我还建议您查看本教程: https://gerkovink.github.io/miceVignettes/

library(mice)

# nhanes object is just a simple dataframe: 
data(nhanes)
str(nhanes)
#'data.frame':  25 obs. of  4 variables:
#  $ age: num  1 2 1 3 1 3 1 1 2 2 ...
#$ bmi: num  NA 22.7 NA NA 20.4 NA 22.5 30.1 22 NA ...
#$ hyp: num  NA 1 1 NA 1 NA 1 1 1 NA ...
#$ chl: num  NA 187 187 NA 113 184 118 187 238 NA ...

# you can generate multivariate imputation using mice() function
imp <- mice(nhanes, seed=23109)

#The output variable is an object of class "mids" which you can explore using str() function
str(imp)
# List of 17
# $ call           : language mice(data = nhanes)
# $ data           :'data.frame':  25 obs. of  4 variables:
#   ..$ age: num [1:25] 1 2 1 3 1 3 1 1 2 2 ...
# ..$ bmi: num [1:25] NA 22.7 NA NA 20.4 NA 22.5 30.1 22 NA ...
# ..$ hyp: num [1:25] NA 1 1 NA 1 NA 1 1 1 NA ...
# ..$ chl: num [1:25] NA 187 187 NA 113 184 118 187 238 NA ...
# $ m              : num 5
# ...
 # $ imp            :List of 4
  #..$ age: NULL
  #..$ bmi:'data.frame':    9 obs. of  5 variables:
  #.. ..$ 1: num [1:9] 28.7 30.1 22.7 24.9 30.1 35.3 27.5 29.6 33.2
  #.. ..$ 2: num [1:9] 27.2 30.1 27.2 25.5 29.6 26.3 26.3 30.1 30.1
  #.. ..$ 3: num [1:9] 22.5 30.1 20.4 22.5 27.4 22 26.3 27.4 35.3
  #.. ..$ 4: num [1:9] 27.2 22 22.7 21.7 25.5 27.2 24.9 30.1 22
  #.. ..$ 5: num [1:9] 28.7 28.7 20.4 21.7 25.5 22.5 22.5 25.5 22.7
#...


#You can extract individual components of this object using $, for example
#To view the actual imputation for bmi column
imp$imp$bmi
#       1    2    3    4    5
# 1  28.7 27.2 22.5 27.2 28.7
# 3  30.1 30.1 30.1 22.0 28.7
# 4  22.7 27.2 20.4 22.7 20.4
# 6  24.9 25.5 22.5 21.7 21.7
# 10 30.1 29.6 27.4 25.5 25.5
# 11 35.3 26.3 22.0 27.2 22.5
# 12 27.5 26.3 26.3 24.9 22.5
# 16 29.6 30.1 27.4 30.1 25.5
# 21 33.2 30.1 35.3 22.0 22.7

# The above output is again just a regular dataframe:
str(imp$imp$bmi)
# 'data.frame':  9 obs. of  5 variables:
#   $ 1: num  28.7 30.1 22.7 24.9 30.1 35.3 27.5 29.6 33.2
# $ 2: num  27.2 30.1 27.2 25.5 29.6 26.3 26.3 30.1 30.1
# $ 3: num  22.5 30.1 20.4 22.5 27.4 22 26.3 27.4 35.3
# $ 4: num  27.2 22 22.7 21.7 25.5 27.2 24.9 30.1 22
# $ 5: num  28.7 28.7 20.4 21.7 25.5 22.5 22.5 25.5 22.7

# complete() function returns imputed dataset:
mat <- complete(imp)

# The output of this function is a regular data frame:
str(mat)
# 'data.frame':  25 obs. of  4 variables:
# $ age: num  1 2 1 3 1 3 1 1 2 2 ...
# $ bmi: num  28.7 22.7 30.1 22.7 20.4 24.9 22.5 30.1 22 30.1 ...
# $ hyp: num  1 1 1 2 1 2 1 1 1 1 ...
# $ chl: num  199 187 187 204 113 184 118 187 238 229 ...

# So you can run any descriptive statistics you need with this object
# Just like you would do with a regular dataframe:
> summary(mat)
# age            bmi             hyp            chl       
# Min.   :1.00   Min.   :20.40   Min.   :1.00   Min.   :113.0  
# 1st Qu.:1.00   1st Qu.:24.90   1st Qu.:1.00   1st Qu.:187.0  
# Median :2.00   Median :27.50   Median :1.00   Median :204.0  
# Mean   :1.76   Mean   :27.48   Mean   :1.24   Mean   :204.9  
# 3rd Qu.:2.00   3rd Qu.:30.10   3rd Qu.:1.00   3rd Qu.:229.0  
# Max.   :3.00   Max.   :35.30   Max.   :2.00   Max.   :284.0

关于r - R : Take 3 中 MI 数据的描述性统计，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50143902/

27

4

0

文章推荐： pull 时git merge 问题

文章推荐：不使用 DSN 时出现 R ODBC nanodbc 错误

文章推荐：拉维尔 : JWT token expired

文章推荐： string - 在线托管可编辑的单个文本字符串？

file - 无法获取用于从 Android 中的 MI-Oreo(MI-A2)设备的下载文件夹中选择任何文件的 URI
我需要帮助来获取我们通过 Intent 从下载文件夹或任何其他文件夹中选择的内容的文件路径。我附上 fileUtil我一直在使用的类，它在牛轧糖版本之前运行良好。但是对于 oreo 以及在某些特定设备
Azure 数据工厂 : Acquire MI token from MI store V1 failed. 错误代码 2403
当我尝试对 Azure Blob 存储进行更改时，我从 Azure 数据工厂收到以下错误: Get access token from MSI failed for Datafactory. Plea
java - 在 Java 中将名称格式从 "Last, First MI."更改为 "First MI. Last"
我正在尝试获取程序从非结构化文本中检索出的名称，并以用户指定的格式“第一个 MI。最后一个”或“最后一个，第一个 MI”显示它们。有任何想法吗？到目前为止，它检查字符串中是否存在逗号。如果是这样，我想
How can I fix the Eclipse error "Unable to execute MI command: -exec-run" (path error) that occurs debugging a CygWin64 app?(如何修复调试CygWin64应用程序时出现的“Unable to Execute MI Command：-exec-Run”(无法执行MI命令：-exec-run)(路径错误)？)
当我尝试在Windows 10/11下使用Eclipse 2023-06调试任何应用程序(甚至是hello.c)时，我总是收到以下错误：。该错误清楚地指示-(错误2)-路径是错误的。。我试图在互联网上
android - 小米 MI 设备未从图库中选取图像
我有一个非常奇怪的问题。我正在从画廊中挑选一张图片，该代码在诺基亚 6、一加 X 等所有设备上都能正常工作。当它来到小米设备图像未设置ImageView . 谁能帮我解决这个问题？我必须选择多个图
gdb/mi gdb 服务器调试
gdb mi 和 gdb server 有什么区别？两者都可以用于本地调试吗？我在使用 Red Hat 上的 gdb 服务器进行调试时遇到问题。调试启动器在 72 % 处停止。最佳答案对于本地调
r - 我可以使用 mi 包汇集估算的随机效应模型估计值吗？
看来 mi在过去几年的某个时刻，软件包进行了相当大的重写。以下教程详细概述了“旧”的做事方式:http://thomasleeper.com/Rcourse/Tutorials/mi.html "n
android - 如何以编程方式检测 Mi 设备中的全屏手势模式
我正在编写一个需要计算屏幕高度才能正确显示内容的 Android 应用程序。但是当切换到全屏手势模式时，我在 Mi 设备(Mi 9 SE)中得到的高度不正确。如何获取屏幕的实际高度，或检查用户是否在
gdb/mi gdb 服务器调试
gdb mi 和 gdb server 有什么区别？两者都可以用于本地调试吗？我在使用 Red Hat 上的 gdb 服务器进行调试时遇到问题。调试启动器在 72 % 处停止。最佳答案对于本地调
android - 联系人未从 MI 手机中删除
我已经做了联系申请。我可以从 samsung 和 moto 中删除联系人，但在 MI(XIOMI) 中无法删除联系人。它显示弹出消息“第三方应用程序无法删除联系人。我的代码 ArrayList op
python - GDB/MI 将标准输入和标准输出重定向到文件
我正在使用 GDB Machine 接口(interface)来调试从 stdin 读取并写入 sdtout 的二进制文件。我想将 stdin 和 stdout 都重定向到文件。使用普通 GDB，我可
Java:在封闭范围内定义的局部变量 mi 必须是最终的或实际上是最终的
我收到错误，如主题所示，请教您如何修复它...错误在 menuItem-loop 中，我尝试将 textArea 前景色设置为从 menuItem 中选择的颜色:(colors[mi]) St
linux - gdb -i=mi 是什么意思？
当从 emacs 启动 gdb 时，emacs 说 gdb 应该启动为 gdb -i=mi 选项 -i 未在 gdb 手册页中定义。如果从命令行使用选项 -i=mi 调用 gdb，它就可以工作。所以它
sql - Azure SQL MI - 使用专用终结点的优点
似乎是一个简单的问题，但由于 SQL MI 已经需要委派给它的子网，为什么要使用专用端点？您已经拥有一个私有(private) IP 地址，可以将流量限制在 Azure 主干网中吗？就我而言，我们有一
Azure 数据资源管理器 - 使用 MI 连续数据导出
我们正在测试 ADX 中外部表的用户分配托管身份的使用 - [Microsoft 文档][1] 但是，由于错误，连续导出失败，不确定我们缺少什么配置。 Query execution has resu
oracle - 将分钟转换为 HH24 :MI format
请您帮忙将分钟转换为 ('HH24:MI') 的格式。我得到的结果是整数，即分钟。那么，如何转换它们呢？谢谢最佳答案假设，您要转换 492 分钟: select to_char(trunc(s
SAS Proc MI SAS 输出
Proc MI 用于估算 SAS 数据集中的缺失值。有没有办法从 Proc MI 过程中获取 SAS 代码，这样我们就可以在不使用 Proc MI 过程的情况下对具有缺失值的数据集进行评分？这是必需的
python 运行时错误 : "mi" not found for replace
我正在尝试将日期写入 Oracle DB sql = """INSERT INTO app_mobile_scout (type_event, date_event, version_app,
c# - 在 C# 中解决丢失的 MI
我有一些代码可以传递一个派生自某个类的类。我们称它为参数类。该代码使用反射遍历类的成员并分析提供给他们的某些自定义属性。基本上，它是一个可配置的解析器，它将根据属性分析输入并将它找到的内容放入数据成
android - 当应用程序被销毁时，定位服务无法正常工作 Mi 设备
这是我在服务中的代码，请让我知道我遗漏了什么。代码在其他设备上工作问题仅在 redmi 设备上。提前致谢。 public class AppLocationServices extends Serv

首页

博学

6Ren·AI

商城

r - R : Take 3 中 MI 数据的描述性统计