gpt4 book ai didi

r - R 包 mlr 的(二进制)因子变量应该有哪些类?

转载 作者:行者123 更新时间:2023-11-30 09:34:53 25 4
gpt4 key购买 nike

我想准备一个数据集,以便在 mlr 包的 Task 中使用它。二元因子自变量应该是类因子、逻辑变量、字符变量还是整数变量?是否可以将超过 2 个类的因子变量作为因子/字符,或者是否有集成在 mlr 中的模型需要例如mlr 不会自动进行转换的模型矩阵?对于这些情况,MLR 期望哪些类别?

例如:

x1 <- factor(sample(0:1, size=10, replace = TRUE))
x2 <- factor(sample(letters[1:5], size=10, replace = TRUE))
y <- sample(c("yes", "no"), size=10, replace = TRUE)
library(mlr)
makeClassifTask(data = data.frame(y, x1, x2), target = "y", positive="yes")

最佳答案

是的。如果是一个因素,那就应该是一个因素。当然,您可以拥有两个以上的类(class),尽管并非所有学习器都支持两个以上的类(class)(mlr 将负责自动确定学习器是否兼容)。 mlr 始终自动转换任务中的所有内容以适合学习者,或者告诉您学习者和任务不兼容。

您还可以使用函数 listLearners() 列出适合给定任务的学习者。

关于r - R 包 mlr 的(二进制)因子变量应该有哪些类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45712641/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com