gpt4 book ai didi

python - SKlearn SGD 部分拟合错误 : Number of features 378 does not match previous data 4598

转载 作者:行者123 更新时间:2023-11-30 08:54:08 25 4
gpt4 key购买 nike

我已经 pkl 我的分类器并在另一个笔记本中打开,并尝试在分类器上执行partial_fit,但收到错误:特征数 378 与之前的数据 4598 不匹配。

with open("models/count_vect_Item Group.pkl", 'r') as f:
global count_vect_item_group
count_vect_item_group = joblib.load(f)

with open("models/model_Item Group.pkl", 'r') as f:
global model_predicted_item_group
model_predicted_item_group = joblib.load(f)

count_matrix_X_train = count_vect_item_group.fit_transform(X_test)
X_train_tf_idf = tf_idf(count_matrix_X_train)

model_predicted_item_group.partial_fit(X_train_tf_idf, labels_test )

无法使用新数据集训练我的分类器。

最佳答案

此错误是因为在腌制分类器之前,您使用 4598 个特征(X 中的列数)对其进行训练,而现在只有 378 个。它应该与旧功能相同。

如何做到这一点,只需调用 count_vect_item_group.transform()。现在,您再次在 count_vect_item_group 上调用 fit_transform(),然后它会忘记之前学习的数据,并适合新数据,因此找到的特征数量比以前少。

将代码更改为:

count_matrix_X_train = count_vect_item_group.transform(X_test)
X_train_tf_idf = tf_idf(count_matrix_X_train)

model_predicted_item_group.partial_fit(X_train_tf_idf, labels_test)

关于python - SKlearn SGD 部分拟合错误 : Number of features 378 does not match previous data 4598,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44033443/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com