gpt4 book ai didi

multidimensional-array - 符号识别,例如 scikit-learn 中的手写数字示例(python)

转载 作者:行者123 更新时间:2023-11-30 09:57:41 25 4
gpt4 key购买 nike

我留意这个例子:http://scikit-learn.org/stable/auto_examples/plot_digits_classification.html#example-plot-digits-classification-pyscikit-learn python 库中的手写数字。

我想准备一个 3d 数组 (N * a* b),其中 N 是我的图像编号 (75),a* b 是图像的矩阵(如示例中的 8x8 形状)。我的问题是:我为每个图像都有不同形状的标志:(202, 230),(250, 322)..然后给我此错误:ValueError:此代码中除 d_0 之外的数组维度必须一致:

#here there is the error:
grigiume = np.dstack(listagrigie)
print(grigiume.shape)
grigiume=np.rollaxis(grigiume,-1)
print(grigiume.shape)

有一种方法可以将所有图像调整为标准尺寸(即 200x200),或者有一种方法可以使用矩阵(a,b)创建 3d 数组,其中 a != 来自 b 并且不会在这段代码中给我错误:

data = digits.images.reshape((n_samples, -1))
classifier.fit(data[:n_samples / 2], digits.target[:n_samples / 2])

我的代码:

import os
import glob
import numpy as np
from numpy import array
listagrigie = []

path = 'resize2/'
for infile in glob.glob( os.path.join(path, '*.jpg') ):
print("current file is: " + infile )
colorato = cv2.imread(infile)
grigiscala = cv2.cvtColor(colorato,cv2.COLOR_BGR2GRAY)
listagrigie.append(grigiscala)

print(len(listagrigie))

#here there is the error:
grigiume = np.dstack(listagrigie)
print(grigiume.shape)
grigiume=np.rollaxis(grigiume,-1)
print(grigiume.shape)


#last step
n_samples = len(digits.images)
data = digits.images.reshape((n_samples, -1))

# Create a classifier: a support vector classifier
classifier = svm.SVC(gamma=0.001)

# We learn the digits on the first half of the digits
classifier.fit(data[:n_samples / 2], digits.target[:n_samples / 2])

# Now predict the value of the digit on the second half:
expected = digits.target[n_samples / 2:]
predicted = classifier.predict(data[n_samples / 2:])

print "Classification report for classifier %s:\n%s\n" % (
classifier, metrics.classification_report(expected, predicted))
print "Confusion matrix:\n%s" % metrics.confusion_matrix(expected, predicted)

for index, (image, prediction) in enumerate(
zip(digits.images[n_samples / 2:], predicted)[:4]):
pl.subplot(2, 4, index + 5)
pl.axis('off')
pl.imshow(image, cmap=pl.cm.gray_r, interpolation='nearest')
pl.title('Prediction: %i' % prediction)

pl.show()

最佳答案

您必须将所有图像调整为固定尺寸。例如使用 PIL 的 Image 类或 Pillow :

from PIL import Image
image = Image.open("/path/to/input_image.jpeg")
image.thumbnail((200, 200), Image.ANTIALIAS)
image.save("/path/to/output_image.jpeg")

编辑:以上方法不起作用,请尝试调整大小:

from PIL import Image
image = Image.open("/path/to/input_image.jpeg")
image = image.resize((200, 200), Image.ANTIALIAS)
image.save("/path/to/output_image.jpeg")

编辑 2:可能有一种方法可以保留宽高比并用黑色像素填充其余部分,但我不知道如何在一些 PIL 调用中执行此操作。您可以使用 PIL.Image.thumbnail 并使用 numpy 进行填充。

关于multidimensional-array - 符号识别,例如 scikit-learn 中的手写数字示例(python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13973952/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com