gpt4 book ai didi

scikit-learn - 使用 sklearn 预处理量表训练模型后,您如何处理新样本?

转载 作者:行者123 更新时间:2023-12-04 01:53:44 26 4
gpt4 key购买 nike

假设我有一个数据集 X 和标签 Y 用于监督机器学习任务。

假设 X 有 10 个特征和 1000 个样本,我相信使用 sklearn.preprocessing.scale 缩放我的数据是合适的。执行此操作并训练我的模型。

我现在希望将它用于新数据的模型,因此我收集了 X 的 10 个特征的新样本,并希望使用我训练的模型对这个样本进行分类。

在尝试分类之前,是否有一种简单的方法可以在将我的模型训练到这个新样本之前应用在 X 上执行的相同缩放?

如果不是,那么唯一的解决方案是在缩放之前保留 X 的副本并将我的新样本添加到此数据中,然后缩放此数据集并在通过此过程缩放后尝试对新样本进行分类?

最佳答案

使用类 api 而不是函数 api。喜欢 preprocessing.MinMaxScaler , preprocessing.StandardScaler
http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing

The function scale provides a quick and easy way to perform this operation on a single array-like dataset

The preprocessing module further provides a utility class StandardScaler that implements the Transformer API to compute the mean and standard deviation on a training set so as to be able to later reapply the same transformation on the testing set.

关于scikit-learn - 使用 sklearn 预处理量表训练模型后,您如何处理新样本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51804784/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com