gpt4 book ai didi

python - 使用自定义函数在 sklearn 中创建管道?

转载 作者:行者123 更新时间:2023-12-03 23:51:45 26 4
gpt4 key购买 nike

如何使用自定义函数创建 sklearn 管道?
我有两个功能,一个用于清理数据,第二个用于构建模型。

def preprocess(df):
……………….
# clean data
return df_clean

def model(df_clean):
…………………
#split data train and test and build randomForest Model
return model

所以我使用 FunctionTransformer 并创建了管道
from sklearn.pipeline import Pipeline, make_pipeline
from sklearn.preprocessing import FunctionTransformer

pipe = Pipeline([("preprocess", FunctionTransformer(preprocess)),("model",FunctionTransformer(model))])

pred = pipe.predict_proba(new_test_data)
print(pred)

我知道上面是错误的,不知道如何处理,在管道中我需要先传递训练数据,然后我必须传递 new_test_data?

最佳答案

您需要创建自己的类,该类继承了 sklearn 的 BaseEstimator、TransformerMixin。

然后在您自己的类的 fit/transform/fit_transform/predict/predict_prob 等函数中指定您的函数。

Put customized functions in Sklearn pipeline

关于python - 使用自定义函数在 sklearn 中创建管道?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56553564/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com