gpt4 book ai didi

java - 将手写笔记的图像转换为文本

转载 作者:行者123 更新时间:2023-12-01 19:34:21 24 4
gpt4 key购买 nike

我有数百张手写笔记的图像。它们是由不同的人写的,但它们是按顺序排列的,所以你知道,例如 person1img1.jpg -> img100.jpg 。每个人的笔迹风格都有很大差异,但笔记的某些部分总是固定的,我想这可以帮助算法(它对我有帮助!)。

我试过tesseract它在识别文本方面非常失败。我在想,既然每个人都有大约 100 张图像,是否有一种算法可以通过向它提供少量示例(例如 5 个或更少)来训练,并且它可以从中学习?还是数据不够?从周围搜索看来我需要实现 CNN (例如 this paper )。

我对ai的了解虽然是有限的,但我仍然可以使用图书馆和一些学习来做到这一点吗?如果是这样,我接下来应该做什么?

最佳答案

这称为OCR并且已经取得了进展。实际上,这里有一个示例,说明使用 tesseract 将图像文件解析为文本是多么简单:

try:
from PIL import Image
except ImportError:
import Image
import pytesseract


def ocr_core(file):
text = pytesseract.image_to_string(file)
return text


print(ocr_core('sample.png'))

但是

我不太确定它是否可以识别不同类型的手写体。你可以自己尝试一下就知道了。如果您想尝试 python 示例,您需要导入 tesseract 但首先要在您的操作系统上安装 tesseract 并将其添加到您的 路径

关于java - 将手写笔记的图像转换为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58395079/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com