gpt4 book ai didi

python - KNN 查询数据维度必须与训练数据维度匹配

转载 作者:行者123 更新时间:2023-11-30 08:57:33 36 4
gpt4 key购买 nike

我正在尝试使用具有两列的数据集进行词袋问题 - 摘要和解决方案。我正在使用 KNN。训练数据集有 91 列,测试数据集有 15 列。

为了生成向量,我使用以下代码。

vectorizer = CountVectorizer()
train_bow_set = vectorizer.fit_transform(dataset[0]).todense()
print( vectorizer.fit_transform(dataset[0]).todense() )
print( vectorizer.vocabulary_ )

我训练了它。

classifier = KNeighborsClassifier(n_neighbors=3)  
classifier.fit(train_bow_set, dataset[1])

现在,我正在测试它。

y_pred = classifier.predict(test_bow_set) 

在这里,我在测试时遇到以下错误:

sklearn/neighbors/binary_tree.pxi in sklearn.neighbors.kd_tree.BinaryTree.query()
**ValueError: query data dimension must match training data dimension**

最佳答案

我猜您是在测试数据上再次拟合向量化器,而不是使用transform函数。

确保您正在执行以下操作。

test_bow_set = vectorizer.transform(test_dataset)

关于python - KNN 查询数据维度必须与训练数据维度匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53758936/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com