gpt4 book ai didi

r - 如何使用自定义中断从连续变量创建分箱因子变量?

转载 作者:行者123 更新时间:2023-12-04 02:50:36 27 4
gpt4 key购买 nike

我有一个看起来像这样的向量:

dataset <- c(4,7,9,1,10,15,18,19,3,16,10,16,12,22,2,23,16,17)

我想创建四个虚拟类别,在其中我通过自定义中断对连续数据集进行分类。 .. 例如:1:4、5:9、10:17、18:23。

输出虚拟类别的长度与原始连续向量的长度相同(在本例中为 18),但现在每个分箱虚拟变量将只包含 1 或 0。

最佳答案

使用 cut :

data.frame(dataset, bin=cut(dataset, c(1,4,9,17,23), include.lowest=TRUE))

关于r - 如何使用自定义中断从连续变量创建分箱因子变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12353915/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com