gpt4 book ai didi

scikit-learn - scikit-learn (python) 中的平衡随机森林

转载 作者:行者123 更新时间:2023-12-04 02:59:34 26 4
gpt4 key购买 nike

我想知道在最新版本的 scikit-learn 包中是否有平衡随机森林 (BRF) 的实现。 BRF 用于数据不平衡的情况。它作为普通 RF 工作,但对于每次引导迭代,它通过欠采样来平衡普遍性类别。例如,给定两个类 N0 = 100 和 N1 = 30 个实例,在每次随机抽样时,它从第一个类中抽取(有替换)30 个实例,从第二个类中抽取相同数量的实例,即它在平衡数据集。更多信息please refer to this paper .

RandomForestClassifier() 确实有 'class_weight=' 参数,它可能被设置为 'balanced',但我不确定它是否与引导训练样本的下采样有关。

最佳答案

您正在寻找的是 BalancedBaggingClassifier来自 imblearn .

imblearn.ensemble.BalancedBaggingClassifier(base_estimator=None,
n_estimators=10, max_samples=1.0, max_features=1.0, bootstrap=True,
bootstrap_features=False, oob_score=False, warm_start=False, ratio='auto',
replacement=False, n_jobs=1, random_state=None, verbose=0)
实际上,它允许您做的是连续对多数类进行欠采样,同时在顶部拟合估计量。您可以使用随机森林或来自 scikit-learn 的任何基本估计器。这是一个 example .

关于scikit-learn - scikit-learn (python) 中的平衡随机森林,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40565444/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com