gpt4 book ai didi

python - `lifelines` 中的 Cox PH 模型 - 违反了虚拟变量的假设

转载 作者:行者123 更新时间:2023-12-01 08:15:30 24 4
gpt4 key购买 nike

我正在使用lifelines库来估计Cox PH模型。对于回归,我有许多分类特征,我对它们进行一次性编码并删除每个特征的一列,以避免多重共线性问题(虚拟变量陷阱)。我没有附上代码,因为该示例与文档 here 中给出的示例类似。 。

通过运行cph.check_asclusions(data),我收到每个虚拟变量违反假设的信息:

Variable 'dummy_a' failed the non-proportional test: p-value is 0.0063.
Advice: with so few unique values (only 2), you can try `strata=['dummy_a']` in the call in `.fit`. See documentation in link [A] and [B] below.

我应该如何理解针对单个分类特征的多个虚拟变量的建议?我应该将它们全部添加到分层中吗?

我将不胜感激任何评论:)

最佳答案

@abu,您的问题在文档中提出了明显的差距 - 如果虚拟变量违反比例测试该怎么办。在这种情况下,我建议不要虚拟变量,并将原始列添加为分层变量,例如:fit(..., strata=['dummy'])

关于python - `lifelines` 中的 Cox PH 模型 - 违反了虚拟变量的假设,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55007387/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com