gpt4 book ai didi

gesture-recognition - 逐个符号手写识别有哪些算法?

转载 作者:行者123 更新时间:2023-12-04 08:16:04 25 4
gpt4 key购买 nike

我认为有一些算法可以评估绘制符号和预期符号之间的差异,或者类似的东西。任何帮助将不胜感激 :))

最佳答案

您可以实现一个简单的神经网络来识别手写数字。最简单的实现类型是通过反向传播训练的前馈网络(它可以随机训练或批量模式训练)。您可以对反向传播算法进行一些改进,以帮助您的神经网络更快地学习(动量、Silva 和 Almeida 算法、模拟退火)。

至于查看真实符号和预期图像之间的差异,我见过使用的一种算法是 k-nearest-neighbor algorithm . Here是一篇描述使用 k-nearest-neighbor 算法进行字符识别的论文(编辑:我之前有错误的链接。我提供的链接要求您支付论文费用;我正在尝试找到一个免费版本的论文)。

如果你使用神经网络来识别你的角色,所涉及的步骤是:

  • 使用适当的训练算法设计您的神经网络。我建议从最简单的(随机反向传播)开始,然后根据需要改进算法,同时训练网络。
  • 获取训练数据的良好样本。对于识别手写数字的神经网络,我使用了 MNIST database .
  • 将训练数据转换为神经网络的输入向量。对于 MNIST 数据,您需要对图像进行二值化。我使用的阈值为 128。我从 Otsu's method 开始,但这并没有给我想要的结果。
  • 创建您的网络。由于来自 MNIST 的图像以 28x28 的数组形式出现,因此您的神经网络有一个包含 784 个分量和 1 个偏置(即 785 个输入)的输入向量。我使用了一个隐藏层,其节点数设置为 guidelines outlined here (以及偏见)。您的输出向量将有 10 个组件(每个数字一个)。
  • 将训练数据(随机排序的数字,每个数字随机输入图像)随机呈现给您的网络并对其进行训练,直到达到所需的错误级别。
  • 针对您的神经网络运行测试数据(MNIST 数据也随附)以验证它是否正确识别数字。

  • 您可以查看示例 here (无耻的插件)试图识别手写数字。我使用来自 MNIST 的数据训练了网络。

    如果您决定走这条路,请花一些时间让自己了解神经网络概念。在我真正理解这个概念之前,我至少花了 3-4 天的时间阅读和编写代码。一个很好的资源是 heatonresearch.com .我建议首先尝试实现神经网络来模拟 AND、OR 和 XOR bool 运算(使用阈值激活函数)。这应该让您了解基本概念。当它真正归结为训练您的网络时,您可以尝试训练一个识别 XOR bool 运算符的神经网络;这是开始介绍学习算法的好地方。

    在构建神经网络时,您可以使用现有框架,例如 Encog ,但我发现自己构建网络要令人满意得多(我认为您可以通过这种方式了解更多信息)。如果你想看一些资源,你可以查看我在 github 上的一个项目。 (无耻插件),它有一些 Java 基本类,可帮助您构建和训练简单的神经网络。

    祝你好运!

    编辑

    我发现了一些使用 k-nearest-neighbors 进行数字和/或字符识别的来源:
  • Bangla Basic Character Recognition Using Digital Curvelet Transform (一个的曲波系数
    原始图像及其形态学改变的版本用于训练单独的 k-
    最近邻分类器。这些分类器的输出值使用简单的融合
    多数投票方案以达成最终决定。)
  • The Homepage of Nearest Neighbors and Similarity Search
  • Fast and Accurate Handwritten Character Recognition using Approximate Nearest Neighbors Search on Large Databases
  • Nearest Neighbor Retrieval and Classification

  • 对于神经网络资源,我发现以下链接很有用:
  • CS-449: Neural Networks
  • Artificial Neural Networks: A neural network tutorial
  • An introduction to neural networks
  • Neural Networks with Java
  • Introduction to backpropagation Neural Networks
  • Momentum and Learning Rate Adaptation (此页面介绍了标准反向传播算法的一些增强功能,可以加快学习速度)
  • 关于gesture-recognition - 逐个符号手写识别有哪些算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8299942/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com