gpt4 book ai didi

python - Keras 中单个输入的多个输出向量

转载 作者:太空宇宙 更新时间:2023-11-04 04:56:22 26 4
gpt4 key购买 nike

我想在 Keras 中创建一个神经网络,用于将手写内容转换为计算机字母。

我的第一步是将一个句子转换成一个数组。我的数组的形状为 (1, number of letters,27)。现在我想将它输入到我的深度神经网络中并进行训练。

但是如果尺寸不适合我的图像,我该如何正确输入呢?我如何实现我的预测函数给我一个 (1, number of letters,27) 的输出数组?

最佳答案

看起来你正在尝试做 Handwritten Recognition或类似的 Optical Character Recognition或光学字符识别。这是一个相当广阔的领域,有很多方法可以进行。尽管如此,我建议的一种方法如下:

众所周知,神经网络具有固定大小的输入,也就是说,如果您将其构建为接受形状为 (28,28,1) 的输入然后模型将期望该形状作为他们的输入。因此,不建议在样本中使用取决于句子中字母数量的维度(某些变量),因为您无法使用神经网络以这种方式训练模型。

如果您将模型设计为一次预测一个字符,而不是可以具有不同长度的整个句子,然后对预测的字符进行分组,那么训练这样的模型是可能的。您可以尝试实现这一目标的步骤可能是:

  1. 获取您希望识别的字符的训练样本(例如 MNIST 数据库),并设计和训练您的模型以一次预测一个字符。

  2. 获取带有文字的图像以进行分类,并在其上传递一个与您预期的输入大小相匹配的滑动窗口(例如 28x28 窗口)。然后,将这些窗口中的每一个分类为一个字符。代替滑动窗口,您可以尝试以某种方式隔离所需的功能,然后只对那些 28x28 段进行分类。

  3. 以某种方式对预测的字符进行分组,以便您获得单词(可能对由空格分隔的单词进行分组)或对预测做任何您想做的事情。

您也可以尝试搜索手写识别的教程或指南,例如 this one我发现很有用。希望这可以帮助您走上正轨,祝您好运。

关于python - Keras 中单个输入的多个输出向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46971808/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com