gpt4 book ai didi

python - Scikit Learn 中预测的扩展特征

转载 作者:行者123 更新时间:2023-11-30 08:58:40 25 4
gpt4 key购买 nike

我一直在研究机器学习模型,目前正在使用带有 GridSearchCV 的管道。我的数据使用 MinMaxScaler 进行缩放,并且我使用带有 RBR 内核的 SVR。现在我的问题是,我的模型是完整的、拟合的,并且具有不错的评估分数,我是否还需要使用 MinMaxScaler 缩放新数据进行预测,或者我可以直接使用数据进行预测吗?我读过 3 本关于 scikit learn 的书,但它们都专注于特征工程和拟合。除了使用预测方法之外,它们实际上并未涵盖预测步骤中的任何其他步骤。

这是代码:

pipe = Pipeline([('scaler', MinMaxScaler()), ('clf', SVR())]) 
time_split = TimeSeriesSplit(n_splits=5)

param_grid = {'clf__kernel': ['rbf'],
'clf__C':[0.0001, 0.001],
'clf__gamma': [0.0001, 0.001]}

grid = GridSearchCV(pipe, param_grid, cv= time_split,
scoring='neg_mean_squared_error', n_jobs = -1)
grid.fit(X_train, y_train)

最佳答案

当然,如果您获得新的(未处理的)数据,您需要执行与训练模型时相同的准备步骤。例如,如果您使用具有默认比例的 MinMaxScaler,则模型将用于在每个特征中包含零均值和标准方差的数据,如果您不对数据进行预处理,则模型将无法生成准确的结果。

请记住使用与训练数据完全相同的 MinMaxScaler 对象。因此,如果您将模型保存到文件中,请同时保存预处理对象。

关于python - Scikit Learn 中预测的扩展特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49543049/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com