gpt4 book ai didi

scala - 可以在 Spark MLlib 随机森林训练中使用样本权重吗?

转载 作者:行者123 更新时间:2023-12-04 15:55:25 27 4
gpt4 key购买 nike

我正在使用 Spark 1.5.0 MLlib 随机森林算法(Scala 代码)进行二分类。由于我使用的数据集高度不平衡,因此多数类以 10% 的采样率进行下采样。

是否可以在 Spark 随机森林训练中使用采样权重(在这种情况下为 10)?我在 trainClassifier() 的输入参数中没有看到权重在随机森林中。

最佳答案

在 Spark 1.5 中完全没有,在 Spark 1.6 中只有部分(Logistic/LinearRegression)

https://issues.apache.org/jira/browse/SPARK-7685

这是跟踪所有子任务的伞形 JIRA

https://issues.apache.org/jira/browse/SPARK-9610

关于scala - 可以在 Spark MLlib 随机森林训练中使用样本权重吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35949420/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com