r2 plot(r2) > sapply(df,class) Sepal.Length -6ren">
gpt4 book ai didi

r - R中决策树的party包不支持字符数据类型?

转载 作者:行者123 更新时间:2023-12-01 18:16:12 25 4
gpt4 key购买 nike

如果我的数据框中的一列的数据类型为字符,则会收到以下错误。

> library("party")
> r2 <- ctree(Sepal.Length ~ .,data=df)
Error in trafo(data = data, numeric_trafo = numeric_trafo, factor_trafo = factor_trafo, :
data class character is not supported
> plot(r2)
> sapply(df,class)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
"factor" "factor" "factor" "character" "factor"

有时,我也会收到此错误

 Error in match.arg(type) : 
'arg' should be one of “response”, “node”, “prob” >
> sapply(df,class)
AGE GENDER STAY GRADE XYNS CHARGE
"integer" "integer" "factor" "integer" "integer" "integer"

我该如何解决这些问题?

最佳答案

响应变量和所有解释变量的规模对于 CTree 算法的两个方面很重要:(1)在每个节点中进行关联测试以确定应使用哪个变量进行 split 。 (2)给定解释变量中最佳分割点的选择。

关联测试始终捕获响应与每个解释变量之间的“相关性”或“缺乏独立性”。相关性度量的类型取决于所涉及变量的规模(请参阅交叉验证上的这篇文章:https://stats.stackexchange.com/questions/144143)。变量可以是数字(或整数)、无序分类(即因子)、有序分类或审查(Surv 对象)。为数据框中的给定变量选择适当的变量类型对于从树中获得有意义的结果至关重要。

类似地,给定变量中可能的二元分割的确定很大程度上取决于规模。而且character并不是一个衡量相关性或 split 的标准方法。

关于r - R中决策树的party包不支持字符数据类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29641015/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com