gpt4 book ai didi

python - 如果我进行一次热编码,我是否总是需要保留一份训练数据的副本?

转载 作者:行者123 更新时间:2023-11-30 09:31:47 25 4
gpt4 key购买 nike

我正在对分类数据进行 one-hot 编码。当我测试时,我会这样做:

data.append(train_data_X)
data.append(test_data_X)
one_hot_encode(data)
model.test(data[:test_data_X.shape[0])

我想知道是否有一种方法可以在不访问我的训练数据的情况下测试我的测试数据。

最佳答案

通常的最佳实践是使用 scikit-learnOneHotEncoder 函数,恰恰可以避免您遇到的问题。

from sklearn.preprocessing import OneHotEncoder
encoder = OneHotEncoder(categories = "auto", handle_unknown = 'ignore')
X_train_encoded = encoder.fit_transform(X_train)
X_test_encoded = encoder.transform(X_test)

这确保了测试集将实现相同的 One Hot Encoding。因此,您可以使用 X_train_encoded 来训练模型,然后使用 X_test_encoded 来评估它。

关于python - 如果我进行一次热编码,我是否总是需要保留一份训练数据的副本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54896335/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com