作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前有一个包含 260,000 行和 50 列的数据框,其中 3 列是数字,其余是分类。我想要对分类列进行一次热编码,以便执行 PCA 并使用回归来预测类别。我怎样才能在 R 中完成下面的例子?
Example:
V1 V2 V3 V4 V5 .... VN-1 VN
to
V1_a V1_b V2_a V2_b V2_c V3_a V3_b and so on
最佳答案
您可以使用model.matrix
或sparse.model.matrix
。像这样的事情:
sparse.model.matrix(~.-1, data = your_data)
~.
告诉 R 您的整个表格(.
)是某个假设模型的右侧,而 -1
> 表示忽略拦截。如果没有 -1
,您的第一列将是 1 的向量。
关于r - 如何在 R 中使用大数据对多个变量进行热编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43578647/
我是一名优秀的程序员,十分优秀!