gpt4 book ai didi

python - 如何在特征少于最初训练的原始数据集的数据集上使用标准缩放模型

转载 作者:行者123 更新时间:2023-12-04 08:47:33 25 4
gpt4 key购买 nike

我使用的是 sklearn.preprocessing 中的标准标量模型。我在包含 27 个特征的数据集上安装了标准缩放模型。是否可以在包含少于 27 个特征的测试数据集上使用相同的标准标量模型代码片段

from sklearn.preprocessing import StandardScaler()
sc=StandardScaler()
sc.fit_transform(x_train)
到目前为止,这一切正常。当我尝试转换我的测试数据集时出现了问题。我知道问题为什么会这样。测试数据集有 24 个特征。但是是否可以转换仅有的 24 个特征并忽略其中不存在的那些列。
sc.transform(x_test)
提前致谢!!

最佳答案

如果不想先选择所有特征 3功能使用 DataFrame.iloc :

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()

x_train.iloc[:, 3:] = sc.fit_transform(x_train.iloc[:, 3:])
print (x_train)
如果功能在列表中,请使用 subset :
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()

features = ['col1','col2',..., 'col24']
x_train[features] = sc.fit_transform(x_train[features])
print (x_train)

关于python - 如何在特征少于最初训练的原始数据集的数据集上使用标准缩放模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64238018/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com