gpt4 book ai didi

ocr - OCR和2或3种字体之间的区别

转载 作者:行者123 更新时间:2023-12-04 17:44:59 31 4
gpt4 key购买 nike

假设我有一个黑白图像的文档,仅使用2或3种字体。标题使用3个字符之一,而另一个则是小字体(或至少很普通)。例如,一小段文字可能是:

Fancy/Bolded/Italicized/Script font: The Best Soup In The World
Plain/small: Made with tap water, salt, and sugar.

Fancy/Bolded/Italicized/Script font: The Best Soup and 1/2 Sandwich In The World
Plain/small: Made with flour, tap water, salt, and sugar.


我不需要大型的OCR系统,它可以告诉我“最佳汤”使用斜体/等特殊的特殊字体。我只需要一个系统,可以告诉我“最佳汤”的格式与“自来水”的格式完全不同,“最佳汤”和“三明治”可能使用相同的格式,“三明治”比“自来水”更大/更漂亮水。”

如果需要的话,我将使用Tesseract进行实际的OCR和边界框检测(http://www.mail-archive.com/tesseract-ocr@googlegroups.com/msg02157.html)。

有什么可以用来做这种简单的格式分类的东西吗?

编辑:

有没有什么可以做到的,而又不会花费我一条胳膊和一条腿?

最佳答案

我不确定tesseract是否可以解决您描述的任务,但是我相信好的ocr引擎应该可以检测字体样式。例如,ABBYY OCR SDK不仅可以识别粗体/斜体字体样式,还可以定义要在输出中使用的正确字体。

根据您的描述,我想您正在尝试确定文档样式层次结构,例如标题级别等。ABBYYFineReader Engine提供了此功能,并且您没有参与基于字体大小和样式的文本用途例程。此外,它提供了最佳的ocr质量,并且可以免费试用。如果您计划商业软件,请考虑尝试一下。我在ABBYY工作,如有必要,可以为您提供更多OCR SDK信息。

最好的祝福。

关于ocr - OCR和2或3种字体之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6880969/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com