gpt4 book ai didi

java - 我从哪里开始进行文本模式识别 - 基于 Java

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:25:38 25 4
gpt4 key购买 nike

我正在认真考虑做一个光学字符识别程序。我精通 Java,很想知道那里可用的库。基本上,我想将如下内容转换为文本。我将需要手动中断以指定模式。例如,我需要要求用户在此文本中标记 f,以便我知道 f 出现的位置。

enter image description here

我完全是新手,所以我也不介意从头开始学习。需要指导。

最佳答案

如果您正在考虑从头开始编写 OCR 程序,阅读相关技术可能会有用。我找到了一个 OCR Survey from 1996其中回顾了十五年前的一些流行技术。阅读可能有帮助;追踪它引用的论文或引用它的论文。

通常流程如下:

find text
find characters in the text
extract features from the characters found
do pattern matching
report suspected character

虽然让用户注释文本既有趣又令人兴奋,但找到一组已经注释的笔迹可能会为您节省大量时间,这样您就可以专注于执行 OCR 的具体细节,而不是构建自己的笔迹注释文本数据库。

要从一个稍微简单的任务开始,您可能需要考虑构建一个系统来检测手写数字。 USPS 制作了一份 corpus用于开发系统来执行此操作以进行邮政编码处理。该链接是我通过快速搜索找到的。

关于java - 我从哪里开始进行文本模式识别 - 基于 Java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6311296/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com