- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个数据集,其中:
X1 - 分类自变量
X2 - 连续自变量
y - 连续因变量
我希望使用 X1 和 X2 来预测 y。线性回归是否适合于此(对分类自变量进行回归是否有意义?)?如果是这样,当 X1 是分类自变量(例如眼睛颜色)时,如何使用线性回归?
我应该为 X1 中的每个类别创建单独的线性回归模型吗?或者尝试创建多元线性回归模型?
网上看看,大部分资源都是关于连续独立 -> 连续相关(线性回归),或连续独立 -> 分类相关(逻辑回归)。
如果有人指出任何可以帮助我的资源/工具,我将不胜感激。
最佳答案
您可以使用线性回归,但首先需要将 X1 编码为一系列变量。
这是一个使用“虚拟编码”方法的简单示例:
┏━━━━━━━━━━━━┳━━━━━┳━━━━━┓
┃ Eye Colour ┃ x11 ┃ x12 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Blue ┃ 0 ┃ 0 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Brown ┃ 1 ┃ 0 ┃
┣━━━━━━━━━━━━╋━━━━━╋━━━━━┫
┃ Green ┃ 0 ┃ 1 ┃
┗━━━━━━━━━━━━┻━━━━━┻━━━━━┛
这里有一篇文章解释了不同的编码方法:
关于python - 线性回归是否适用于分类自变量和连续因变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52832467/
我有一个名为copyToClipboard()的函数。这需要一个名为 element 的参数。该函数通过定位元素的 id、选择并复制内容来复制元素的内容。 例如: JS /* * Copy to c
我正在研究 Java,想知道以下各项在性能方面有何不同。我知道过早优化是编程的困境,但我的好奇心仅供将来引用。 public class Type1{ int[] data = new da
我正在使用此代码从 csv 文件中获取数组: array_map('str_getcsv', 'file.csv') 但是在 array_map 函数中使用它时,如何为 str_getcsv() 设置
我是一名优秀的程序员,十分优秀!