gpt4 book ai didi

ocr - 是否有一个 OCR 库可以输出在图像中找到的单词的坐标?

转载 作者:行者123 更新时间:2023-12-03 09:51:55 28 4
gpt4 key购买 nike

关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。












想改进这个问题?将问题更新为 on-topic对于堆栈溢出。

12 个月前关闭。




Improve this question




根据我的经验,OCR 库倾向于仅输出在图像中找到的文本,而不是在找到文本的位置。是否有一个 OCR 库可以输出在图像中找到的单词以及找到这些单词的坐标 (x, y, width, height)?

最佳答案

大多数商业 OCR 引擎将返回单词和字符坐标位置,但您必须使用他们的 SDK 来提取信息。即使是 Tesseract OCR 也会返回位置信息,但要获得它并不容易。版本 3.01 将变得更容易,但 DLL 接口(interface)仍在开发中。

不幸的是,大多数免费的 OCR 程序都以基本形式使用 Tesseract OCR,它们只报告原始的 ASCII 结果。

www.transym.com - Transym OCR - 输出坐标。
www.rerecognition.com - KADMOS 引擎返回坐标。

Caere Omnipage、Mitek、Abbyy、Charactell 也返回角色位置。

关于ocr - 是否有一个 OCR 库可以输出在图像中找到的单词的坐标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5041038/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com