gpt4 book ai didi

python - Scikit-learn 平衡子采样

转载 作者:IT老高 更新时间:2023-10-28 21:40:00 25 4
gpt4 key购买 nike

我正在尝试为我的大型不平衡数据集创建 N 个平衡随机子样本。有没有办法简单地使用 scikit-learn/pandas 来做到这一点,还是我必须自己实现它?任何指向执行此操作的代码的指针?

这些子样本应该是随机的,并且可以重叠,因为我将每个子样本提供给一个非常大的分类器集合中的单独分类器。

在 Weka 中有一个名为 spreadsubsample 的工具,在 sklearn 中是否有等效的工具? http://wiki.pentaho.com/display/DATAMINING/SpreadSubsample

(我知道权重,但这不是我想要的。)

最佳答案

现在有一个成熟的 python 包来解决不平衡的数据。它以 sklearn-contrib 包的形式提供,地址为 https://github.com/scikit-learn-contrib/imbalanced-learn

关于python - Scikit-learn 平衡子采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23455728/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com