gpt4 book ai didi

r - R选择lm回归中因素的基本类别的最佳方法

转载 作者:行者123 更新时间:2023-12-04 04:18:58 25 4
gpt4 key购买 nike

假设我想使用lmfactor作为右侧变量运行回归。在因子中选择哪个级别的最佳方法是基本类别(为避免多重共线性而排除的类别)。请注意,我对排除拦截不感兴趣,因为我有很多因素。

我还希望有一个基于公式的解决方案,而不是直接作用于data.frame的解决方案,尽管如果您认为自己有一个非常好的解决方案,也请发布该解决方案。

我的解决方案是:

base_cat <- function(x) c(x,1:(x-1),(x+1):100) 
a_reg <- lm(y ~ x1 + x2 + factor(x3, levels=base_cat(30)) #suppose that x3 has draws from the integers 1 to 100.
lm遗漏的类别是该因子中的第一级,因此这只是对这些级别进行了重新排序,因此 base_cat()中指定的那一级是第一级,其余部分放在后面。

还有其他想法吗?

最佳答案

函数relevel正是这样做的。您为它传递一个无序因子和引用级别的名称,它会返回一个以该级别为第一个因子的因子。

关于r - R选择lm回归中因素的基本类别的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7828396/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com