gpt4 book ai didi

image-processing - 如何告诉 Tesseract 我的字体具有特定大小?

转载 作者:行者123 更新时间:2023-12-04 23:00:12 25 4
gpt4 key购买 nike

我有一组打字的图像标题,看起来像这样:

Typewritten text

我知道打字机是一致且等宽的,字符大小为 14x22 像素(从大写字母的顶部到下降器的底部测量)。

Tesseract 产生这样的输出:

OCR results for typewritten text

当 Tesseract 检测到字母的正确边界框时,结果大多是好的。但是有很多字母串在一起(例如第一行的“Ea”、“tree”、“fr”和“om”)。这些总是被错误地转录并导致了大部分错误。

这令人沮丧,因为我先验地知道所有字符都具有特定大小。是否可以将这些知识传递给 tesseract命令行工具?

我生成box文件的命令是:

tesseract foo.jpg foo batch.nochop makebox

如果可能,我宁愿避免在字体上训练 Tesseract——我没有任何手动转录的样本,因此构建训练数据语料库需要一些努力。

最佳答案

我不确定 Tesseract 是否会像 Noremac 所说的那样完全关闭连接的字符。

实际上,我认为只要单词检测的结果不令人满意,它就会包括对连接字符的切碎,如 An Overview of the Tesseract OCR Engine 的第 4.1 段所述。

而且我也认为一旦找到固定间距的文本,它应该会自动切割文本,即使字符是连接的(看同一篇论文的图2)。

我知道添加这个答案有点晚了,但也许它会帮助一些 future 的访问者!

关于image-processing - 如何告诉 Tesseract 我的字体具有特定大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27592430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com