gpt4 book ai didi

python - 将 OpenCV 图像传入 KNearest 的 find_nearest

转载 作者:太空宇宙 更新时间:2023-11-03 21:35:27 28 4
gpt4 key购买 nike

我一直在关注示例 here通过使用 kNN 分类训练 OpenCV 为 OCR 设置 Python。我按照第一个示例生成了一个 knn_data.npz 来存储训练数据和训练标签供以后使用。我现在要做的是调用训练数据并将其应用于内部具有单个字符的 OpenCV 图像:

# Load training data
trainingData = np.load('knn_data.npz')
train = trainingData['train']
trainLabels = trainingData['train_labels']

knn = cv2.KNearest()
knn.train(train, trainLabels)

letter = cv2.imread('letter.png')
letter = cv2.cvtColor(letter, cv2.COLOR_BGR2GRAY)
print letter.shape
letter = letter.reshape((1,100))
letter = np.float32(letter)
print letter.shape

ret, result, neighbors, dist = knn.find_nearest(letter, k=5)
print result

'letter.png' 图像是 10x10 图像,因此调整大小非常安全,numpy 成功地将图像调整为形状为 (1, 100) 的一维数组。但是,当我尝试将其传递给 knn.find_nearest(...) 函数时,我收到一条错误消息,指出要使用浮点矩阵:

OpenCV Error: Bad argument (Input samples must be floating-point matrix (<num_samples>x<var_count>)) in find_nearest, file /build/buildd/opencv-2.4.8+dfsg1/modules/ml/src/knearest.cpp, line 370
Traceback (most recent call last):
File "sudoku.py", line 103, in <module>
ret, result, neighbors, dist = knn.find_nearest(letter, k=5)
cv2.error: /build/buildd/opencv-2.4.8+dfsg1/modules/ml/src/knearest.cpp:370: error: (-5) Input samples must be floating-point matrix (<num_samples>x<var_count>) in function find_nearest

但是,我 reshape 了我的图像,使其占据一行并将其转换为 float ,所以我不完全确定为什么会出现此错误。有什么建议么?

最佳答案

我刚刚意识到为什么会这样。为了使 kNN 分类起作用,测试数据(或本例中的单个字母)需要具有与训练数据完全相同数量的特征。在这种情况下,我的训练数据使用 20x20 图像,因此行向量的长度为 400,但我的字母只有 10x10。

我通过将字母放大到 20x20 并将其展平为大小为 400 (20^2) 的行向量来解决此问题。

这也不一定非得通过行向量来工作。测试数据可以被格式化为与训练数据完全一样的矩阵,其中每一行包含一个样本,在本例中是一个字母。然后 find_nearest 将返回一个矩阵,其中每一行对应于测试数据。

关于python - 将 OpenCV 图像传入 KNearest 的 find_nearest,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32553377/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com