gpt4 book ai didi

python - scikit-learn 中的异常值检测在管道中使用 Transformers

转载 作者:太空宇宙 更新时间:2023-11-03 12:03:22 24 4
gpt4 key购买 nike

<分区>

我想知道是否可以在 scikit-learn 的管道中包含 scikit-learn 离群值检测(如隔离森林)?

所以这里的问题是我们只想在训练数据上拟合这样一个对象,而不对测试数据做任何事情。特别是,人们可能想在这里使用交叉验证。

解决方案会是什么样子?

构建一个继承自 TransformerMixin(和 ParameterTuning 的 BaseEstimator)的类。现在定义一个 fit_transform 函数,用于存储函数是否已被调用的状态。如果尚未调用,则该函数会拟合并预测数据上的离群值函数。如果之前调用过该函数,则已经对训练数据调用了离群值检测,因此我们假设我们现在找到了我们简单返回的测试数据。

这种方法是否有机会奏效,还是我在这里遗漏了什么?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com