r - 将 summary() 写入 as.data.frame 以便在 ggplot/R 中使用-6ren

r - 将 summary() 写入 as.data.frame 以便在 ggplot/R 中使用

转载作者：行者123 更新时间：2023-12-04 11:23:19

请在下面找到 af 数据示例 t。

我正在使用 etm 包 中的 etmCIF 进行竞争风险分析 - 产生以下结果，这很好但需要更好的图形:

曾经有一个ggtrans.etm函数可以将数据导入ggplot。然而，这个功能显然被删除了？!

但是，我想将我的 summary() 转换为 data.frame 但我收到错误:

library(etm)
cum_in <- etmCIF(Surv(os, event %in% c(1,2)) ~ 1, t, etype = event, failcode = c(1,2))
summary(cum_in)

哪个给

CIF 1 
          P        time         var      lower     upper n.risk n.event
 0.00000000   0.3297396 0.000000000 0.00000000 0.0000000    100       0
 0.00000000  57.5268750 0.000000000 0.00000000 0.0000000     90       0
 0.00000000 178.0340104 0.000000000 0.00000000 0.0000000     54       0
 0.06387317 271.0966667 0.001897498 0.01643949 0.2311213     22       0
 0.21669472 369.4858854 0.007605761 0.09511485 0.4494356     11       1
 0.21669472 925.1224479 0.007605761 0.09511485 0.4494356      2       0

CIF 2 
          P        time          var       lower     upper n.risk n.event
 0.01000000   0.3297396 0.0000990000 0.001414712 0.0688628    100       1
 0.07065711  57.5268750 0.0006633366 0.034315233 0.1425376     90       1
 0.14846026 178.0340104 0.0015118082 0.087973840 0.2445705     54       1
 0.23751402 271.0966667 0.0031735841 0.146981679 0.3703251     22       1
 0.23751402 369.4858854 0.0031735841 0.146981679 0.3703251     11       0
 0.56839997 925.1224479 0.0281468521 0.287757542 0.8751468      2       1

我在 ggplot2 的数据框中需要 P、time、lower 和 upper，所以我尝试了

library(ggplot2)
ggplot(as.data.frame(cum_in), aes(x=time, y=P))  +
  geom_ribbon(data=cum_in, aes(ymin=lower, ymax=upper))

哪个给

Error in as.data.frame.default(cum_in) : cannot coerce class ‘"etmCIF"’ to a data.frame

知道如何将 summary() 转换成对 ggplot 有用的东西吗？我宁愿不降级包裹。

UPDATED QUESTION

所以我尝试了@PoGibas 的功能，最初效果很好。但是，功能似乎有问题。

我已经更新了下面的数据示例t

我有三个精液。 inc.-curves 分层为 t$ki67in 构成三个不同的组。

精液。 inc.-曲线估计如下

library(etm)
cum_in <- etmCIF(Surv(event.tid, event!=0) ~ ki67in, t, etype = event, failcode = 2)

其中 plot(cum_in) 正确绘制了以下内容:

但是当我尝试时(基于函数 etm_to_df)

res <- etm_to_df(cum_in)
ggplot(res, aes(time, P)) + 
  geom_ribbon(aes(ymin = lower, ymax = upper, fill = CIF), alpha = 0.2) +
  geom_line(aes(color = CIF))

我在 ggplot 中得到了这个废话(它似乎没有三组):

> head(res)
   CIF           P     time          var       lower      upper n.risk n.event
1: 0 1 0.009259259  0.25000 8.494005e-05 0.001309500 0.06390547    108       1
2: 0 1 0.018605870  1.75000 1.698800e-04 0.004685795 0.07234945    106       1
3: 0 1 0.028419811 11.83333 2.618497e-04 0.009249879 0.08556618    100       1
4: 0 1 0.028419811 12.00000 2.618497e-04 0.009249879 0.08556618     99       0
5: 0 1 0.028419811 15.00000 2.618497e-04 0.009249879 0.08556618     97       0
6: 0 1 0.038334927 18.00000 3.538387e-04 0.014552186 0.09898410     96       1
> tail(res)
   CIF          P     time         var      lower     upper n.risk n.event
1: 0 1 0.12156863 56.00000 0.006511402 0.03179904 0.4054164      9       0
2: 0 1 0.38184459 96.66667 0.049327707 0.10529823 0.8750079      3       1
3: 0 2 0.00000000  1.50000 0.000000000 0.00000000 0.0000000     17       0
4: 0 2 0.00000000  3.00000 0.000000000 0.00000000 0.0000000     15       0
5: 0 2 0.09760349 56.00000 0.008548335 0.01442923 0.5160136      9       1
6: 0 2 0.09760349 96.66667 0.008548335 0.01442923 0.5160136      3       0

我的数据样本

    t <- structure(list(ki67in = structure(c(0, 2, 0, 0, 1, 0, 2, 2, 1, 
0, 1, 2, 0, 2, 0, 1, 1, 1, 0, 2, 2, 0, 2, 1, 0, 0, 0, 1, 0, 1, 
2, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 
0, 0, 0, 1, 0, 2, 1, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 1, 0, 1, 
0, 0, 1, 0, 0, 1, 2, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 2, 1, 2, 0, 2, 0, 0, 
1, 0, 0, 0, 0, 0, 0, 1, 0, 2, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 
0, 2, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 
0, 0, 0), class = "AsIs"), event = structure(c(1, 1, 1, 1, 1, 
0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 2, 0, 2, 
0, 0, 2, 0, 0, 1, 0, 2, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 2, 2, 0, 
0, 0, 2, 0, 0, 0, 2, 2, 0, 2, 1, 0, 2, 0, 2, 0, 2, 0, 0, 0, 1, 
0, 1, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 2, 2, 0, 0, 0, 2, 0, 1, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 2, 0, 0, 0, 0), class = "AsIs"), event.tid = c(1.75, 1.5, 
11.83333333, 0.25, 1.75, 1, 2, 96.66666667, 2, 106.5833333, 3, 
3, 3, 4, 4, 4, 141.9166667, 5, 6, 7, 8, 8, 8, 9, 11, 12, 13, 
13, 15, 15, 15, 40.91666667, 17, 17, 18, 173, 28, 29, 30, 33, 
34, 35, 178.5833333, 37, 38, 39, 40, 41, 45, 49, 49, 50, 52, 
53, 54, 56, 56, 194.4166667, 56, 57, 58, 58, 60, 60, 60, 60, 
61, 275.75, 63, 189.75, 66, 67, 67, 72, 72, 74, 78, 80, 80, 80, 
81, 82, 83, 83, 84, 84, 85, 85, 86, 86, 88, 88, 88, 88, 89, 89, 
89, 90, 90, 91, 91, 92, 92, 251.8333333, 92, 93, 93, 93, 93, 
93, 93, 94, 97, 98, 98, 99, 99, 99, 100, 101, 101, 101, 103, 
103, 103, 103, 104, 104, 106, 106, 109, 110, 111, 111, 112, 114, 
114, 115, 116, 117, 299.8333333, 118, 118, 119, 120, 120, 120, 
120, 120, 120, 121, 121, 123, 124, 124, 125, 125, 125, 125)), class = "data.frame", row.names = c(1L, 
2L, 3L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 18L, 19L, 20L, 
21L, 22L, 23L, 24L, 25L, 26L, 27L, 28L, 29L, 30L, 31L, 32L, 33L, 
34L, 35L, 36L, 37L, 38L, 39L, 40L, 41L, 44L, 45L, 46L, 47L, 48L, 
49L, 50L, 51L, 52L, 53L, 54L, 55L, 57L, 59L, 60L, 61L, 62L, 63L, 
64L, 65L, 66L, 67L, 68L, 69L, 70L, 71L, 72L, 73L, 74L, 75L, 76L, 
77L, 78L, 79L, 80L, 81L, 82L, 83L, 84L, 85L, 87L, 89L, 90L, 91L, 
92L, 93L, 94L, 96L, 97L, 98L, 99L, 100L, 101L, 102L, 103L, 104L, 
105L, 106L, 107L, 109L, 110L, 111L, 112L, 113L, 114L, 115L, 116L, 
117L, 118L, 119L, 120L, 121L, 123L, 124L, 125L, 126L, 127L, 128L, 
130L, 131L, 132L, 133L, 134L, 135L, 136L, 137L, 138L, 139L, 140L, 
141L, 142L, 143L, 144L, 145L, 146L, 147L, 148L, 149L, 150L, 151L, 
152L, 153L, 154L, 155L, 156L, 157L, 158L, 159L, 160L, 161L, 162L, 
163L, 164L, 165L, 166L, 167L, 168L, 169L, 170L, 171L, 172L, 173L, 
174L, 175L))

最佳答案

ggtransfo.etm 已与此 commit 一起删除.一种方法是绕过该函数，但我尝试改进 etm:::summary.etmCIF 函数以返回绑定(bind)数据帧(引入 data.table 作为依赖项) :

# NEW VERSION (adapted according to question update)
# Works with multiple groups 
etm_to_df <- function(object, ci.fun = "cloglog", level = 0.95, ...) {
  l.X <- ncol(object$X)
  l.trans <- nrow(object[[1]]$trans)
  res <- list()
  for (i in seq_len(l.X)) {
      temp <- summary(object[[i]], ci.fun = ci.fun, level = level)
      res[[i]] <- data.table::rbindlist(
        temp[object$failcode + 1], idcol = "CIF"
      )[, CIF := paste0("CIF", CIF, "; ", names(object)[i])]
  }
  do.call(rbind, res)
}

此函数返回一个数据框，其列 CIF 包含标识符。

# With given OPs data one can use 
library(etm)
cum_in <- etmCIF(Surv(os, event %in% c(1,2)) ~ 1, n, etype = event, failcode = c(1,2))
res <- etm_to_df(cum_in)

然后很容易使用 ggplot2 绘制它:

library(ggplot2)
ggplot(res, aes(time, P)) +
  geom_ribbon(aes(ymin = lower, ymax = upper, fill = CIF), alpha = 0.2) +
  geom_line(aes(color = CIF)) +
  scale_fill_manual(values = c("red", "blue")) +
  scale_color_manual(values = c("red", "blue")) +
  theme_classic()

旧函数:

# Same functionality as etm:::summary.etmCIF, but returns a data frame
etm_to_df <- function(object, ci.fun = "cloglog", level = 0.95, ...) {
  l.X <- ncol(object$X)
  l.trans <- nrow(object[[1]]$trans)
  temp <- lapply(object[seq_len(l.X)], function(ll) {
    res <- summary(ll, ci.fun = ci.fun, level = level, ...)
    data.table::rbindlist(res[seq_len(l.trans) + 1], idcol = "CIF")
  })
  do.call(rbind, temp)
}

关于r - 将 summary() 写入 as.data.frame 以便在 ggplot/R 中使用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56784714/

文章推荐： r - 用图案填充地理空间多边形 - R

文章推荐： javascript - 将钩子(Hook)作为 Prop 传递

文章推荐： powershell - CMD 管道与 Powershell 管道不同？

r - 计算 R 中的 R 平方内、R 平方之间或整体 R 平方
我正在从 Stata 迁移到 R(plm 包)，以便进行面板模型计量经济学。在 Stata 中，面板模型(例如随机效应)通常报告组内、组间和整体 R 平方。 I have found plm 随机效应
r - Revolution R 中的模块是开源的。 R 许可证是否意味着我可以免费使用随附的 R 软件包？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
r - 如何从 R 中的用户输入中读取向量并将其用于进一步处理 [R]
我想要求用户输入整数值列表。用户可以输入单个值或一组多个值，如 1 2 3(spcae 或逗号分隔)然后使用输入的数据进行进一步计算。我正在使用下面的代码 EXP <- as.integer(rea
r - R 中的分类变量 - R 选择哪一个作为引用？
当 R 使用分类变量执行回归时，它实际上是虚拟编码。也就是说，省略了一个级别作为基础或引用，并且回归公式包括所有其他级别的虚拟变量。但是，R 选择了哪一个作为引用，以及我如何影响这个选择？具有四个级
r - 制作数据框或排名调整后的 R 平方 - R
这个问题基本上是我之前问过的问题的延伸:How to only print (adjusted) R-squared of regression model? 我想建立一个线性回归模型来预测具有 15
r - 将已安装的 R 包传输到另一台计算机上的 R
我在一台安装了多个软件包的 Linux 计算机上安装了 R。现在我正在另一台 Linux 计算机上设置 R。从他们的存储库安装 R 很容易，但我将不得不使用安装许多包 install.package
r - R 中字符的对象大小 - R 全局字符串池如何工作？
我正在阅读 Hadley 的高级 R 编程，当它讨论字符的内存大小时，它说: R has a global string pool. This means that each unique strin
r - 是否写入 "ui.R + server.R"或 "app.R"
我们可以将 Shiny 代码写在两个单独的文件中，"ui.R"和 "server.R" , 或者我们可以将两个模块写入一个文件 "app.R"并调用函数shinyApp() 这两种方法中的任何一种在性
r - 在 .R 文件中保存 R 对象(代码)(R 遗传编程)
我正在使用 R 通过 RGP 包进行遗传编程。环境创造了解决问题的功能。我想将这些函数保存在它们自己的 .R 源文件中。我这辈子都想不通怎么办。我尝试过的一种方法是: bf_str = print(b
r - 如何让 R 在编辑后自动加载我的 .r 文件？
假设我创建了一个函数“function.r”，在编辑该函数后我必须通过 source('function.r') 重新加载到我的全局环境中。无论如何，每次我进行编辑时，我是否可以避免将其重新加载到我的
r - 是否可以在命令行中将代码通过管道传递给 R 或 R 脚本？
例如，test.R 是一个单行文件: $ cat test.R # print('Hello, world!') 我们可以通过Rscript test.R 或R CMD BATCH test.R 来
r - 我可以使用 R 笔记本作为 R 包小插图吗？
我知道我可以使用 Rmd 来构建包插图，但想知道是否可以更具体地使用 R Notebooks 来制作包插图。如果是这样，我需要将 R Notebooks 编写为包小插图有什么不同吗？我正在使用最新版本
r - 在 R 运行时更新 R 包
我正在考虑使用 R 包的共享库进行 R 的站点安装。多台计算机将访问该库，以便每个人共享相同的设置。问题是我注意到有时您无法更新包，因为另一个 R 实例正在锁定库。我不能要求每个人都关闭它的 R
r - 如何从命令行向 R 提供表达式但阻止 R 立即退出？
我知道如何从命令行启动 R 并执行表达式(例如， R -e 'print("hello")' )或从文件中获取输入(例如， R -f filename.r )。但是，在这两种情况下，R 都会运行文件中
r - 从另一个 .r 文件中编辑 .r 文件
我正在尝试使我当前的项目可重现，因此我正在创建一个主文档(最终是一个 .rmd 文件)，用于调用和执行其他几个文档。这样我自己和其他调查员只需要打开和运行一个文件。当前设置分为三层:主文件、2 个读
r - 是否有任何简单的方法可以在 R 中制作不需要安装 R 的桌面应用程序
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
r - 如何在 R 包的手册中包含 Authors@R？
我的 R 包中有以下描述文件 Package: blah Title: What the Package Does (one line, title case) Version: 0.0.0.9000
r - 将 R 代码转换为 R 风格
有没有办法更有效地编写以下语句？accel 是一个数据框。 accel[[2]]<- accel[[2]]-weighted.mean(accel[[2]]) accel[[3]]<- accel[[
r - 安装 R 包时，R 如何检查系统外部依赖项？
例如，在尝试安装 R 包时 curl作为 usethis 的依赖项: * installing *source* package ‘curl’ ... ** package ‘curl’ succes
r - 在 R 包中包含 R 脚本
我想将一些软件作为一个包共享，但我的一些脚本似乎并不能很自然地作为函数运行。例如，考虑以下代码块，其中“raw.df”是一个包含离散和连续类型变量的数据框。函数“count.unique”和“squa

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 将 summary() 写入 as.data.frame 以便在 ggplot/R 中使用