gpt4 book ai didi

r - 如何呈现包含时变协变量的生存数据并在 R 中拟合模型

转载 作者:行者123 更新时间:2023-11-30 09:19:53 25 4
gpt4 key购买 nike

我想使用名为 timereg 的 R 包中的 aalen() 函数执行包括时变协变量的生存分析。但是,我仍然对如何在数据框中呈现数据以及如何指定模型公式感到困惑。

这是一个组成的数据集:

subject_id 生存时间 体重 高度 结果_indicator
1                               3           65      1.8      0
1                               4           68      1.8      0
1                               7           70      1.8      1
2                               2           55      1.6      0
2                               9           53      1.6      0
3                               2           62      1.7      0
3                               3           65      1.7      0
3                               5           64      1.7      0
3                               6           66      1.7      0

以下是一些解释:

  1. 共有 3 个研究对象,由 subject_id 变量标识,并分别随访了 3、2、4 次。
  2. 权重是一个随时间变化的协变量。
  3. 高度与时间无关,因此对于每个受试者来说,每次随访时高度都保持不变。
  4. 假设survival_time的单位是年,那么感兴趣的事件在第7年发生在受试者1上。
  5. 主题 2 和 3 都是右删失案例。
  6. 属于同一主题的每个后续事件都可以按 survival_time 排序。

最后,我的问题列表(即使您没有找到所有答案,或者我的解决方案是正确的,也请随时发表评论):

  1. 我对于包含时变协变量的生存数据的表述是否正确?
  2. 如果第一个问题的答案是“否”,那么您能否指出问题所在并提供一些解释?
  3. 假设数据集没问题,那么如何指定模型公式并拟合 aalen 模型(或任何其他包含时变协变量的模型)?是不是类似:

aalen(公式 = Survf(survival_time, Outcome_indicator) ~ const(高度) + 体重, data = data_set, id = data_set$subject_id)

其中 Survf() 函数用于组合两个与结果相关的变量; const() 用于表示随时间变化的协变量,其他协变量保持原样; data_set 是数据框的名称; id 参数用于关联同一主题的不同行?

最佳答案

这可能不是表示这些数据的正确方式。从变量 survival_time 的顺序来看,这些是协变量发生变化的队列时间。您需要一个滞后事件时间来指示观察的“开始”,对于第一个患者记录设置为 0。现在格式化数据的方式已经对分母时间进行了平方,降低了发生率,并将风险比降低到零。

以第一个参与者为例:实际上他们是从 0 到 7 进行观察的。第一个记录是 0 到 3,下一个记录是 3 到 4,最后一个记录是 4 到 7。你在哪里明确地告诉 R 了这一点? R 不知道这些记录属于同一个人。 R 现在认为有 3 个人被跟踪了 3 + 4 + 7 = 14 年,发生了 1 件事件,而不是 7 年发生了 1 件事件(发生率从 14 ppy 变为 7 ppy)。

关于r - 如何呈现包含时变协变量的生存数据并在 R 中拟合模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43939812/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com