gpt4 book ai didi

statistics - 分类变量的多重共线性

转载 作者:行者123 更新时间:2023-12-03 17:41:08 25 4
gpt4 key购买 nike

如果数据同时包含分类自变量和连续自变量,可使用哪些不同的度量来检查多重共线性?

我可以通过将分类变量转换为虚拟变量来使用 VIF 吗?由于我无法在互联网上找到任何引用资料,这是否存在根本性缺陷?

最佳答案

Can I use VIF by converting categorical variables into dummy variables ?

是的你可以。这种方法没有根本的缺陷。
if the data contains both categorical and continuous independent variables?

多重共线性不关心它是分类变量还是整数变量。分类变量没有什么特别之处。将您的分类变量转换为二进制,并将它们视为所有其他变量。

我认为您的担忧是分类变量必须相互关联,这是一个有效的担忧。假设引用类别中案例的比例很小的情况。假设有 3 个分类变量:超重、正常、体重不足。我们可以把它变成 2 个分类变量。那么,如果一个类别的数据非常小(比如正常人是 100 人中有 5 人,而其他 95 人体重过轻或超重),则指标变量必然具有较高的 VIF,即使该类别变量与其他变量无关回归模型。
What are the different measures available to check for multicollinearity

检测多重共线性的一种方法是获取数据的相关矩阵,并检查相关矩阵的特征值。

接近 0 的特征值表示数据是相关的。

关于statistics - 分类变量的多重共线性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35998395/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com