gpt4 book ai didi

python - 线性回归是否适用于分类自变量和连续因变量?

转载 作者:行者123 更新时间:2023-11-30 09:17:08 32 4
gpt4 key购买 nike

我有一个数据集,其中:

X1 - 分类自变量

X2 - 连续自变量

y - 连续因变量

我希望使用 X1 和 X2 来预测 y。线性回归是否适合于此(对分类自变量进行回归是否有意义?)?如果是这样,当 X1 是分类自变量(例如眼睛颜色)时,如何使用线性回归?

我应该为 X1 中的每个类别创建单独的线性回归模型吗?或者尝试创建多元线性回归模型?

网上看看,大部分资源都是关于连续独立 -> 连续相关(线性回归),或连续独立 -> 分类相关(逻辑回归)。

如果有人指出任何可以帮助我的资源/工具,我将不胜感激。

最佳答案

您可以使用线性回归,但首先需要将 X1 编码为一系列变量。

这是一个使用“虚拟编码”方法的简单示例:

┏━━━━━━━━━━━━┳━━━━━┳━━━━━┓
┃ Eye Colour ┃ x11 ┃ x12 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Blue ┃ 0 ┃ 0 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Brown ┃ 1 ┃ 0 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Green ┃ 0 ┃ 1 ┃
┗━━━━━━━━━━━━┻━━━━━┻━━━━━┛

这里有一篇文章解释了不同的编码方法:

https://stats.idre.ucla.edu/spss/faq/coding-systems-for-categorical-variables-in-regression-analysis-2/

关于python - 线性回归是否适用于分类自变量和连续因变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52832467/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com