gpt4 book ai didi

ios - 使用iOS的Tesseract OCR逐字扫描图像

转载 作者:行者123 更新时间:2023-12-01 16:31:59 25 4
gpt4 key购买 nike

现在,我正在使用iOS版TesseractOCR扫描图像并将其转换为文本。我希望能够找到一个单词,使它在原始图像中突出显示,因此我想逐个单词地扫描文档,并寻找用户传递的短语或单词。但是,在tesseractOCR网站上找不到任何指向该方向的资源。因此,基本上,我希望逐字扫描图像,以便找到短语。我需要能够在原始图像上突出显示单词,这就是为什么我认为我应该逐字扫描原始图像的原因。有什么办法可以使用tesseractOCR逐字扫描原始图像(可能涉及检测空白)?如果是这样,任何相关资源都将有所帮助。如果我不能使用tesseractOCR,我应该使用其他产品吗?还是根本不可能?

提前致谢。

最佳答案

适用于iOS的TesseractOCR有一个api调用,返回recognized blocks by iterator level。您可以将迭代器级别设置为G8PageIteratorLevelWord以获取单词。

同样重要的是,每个识别的块都具有boundingBox属性,该属性直接指向图像上该块的位置。您可以使用它来突出显示图像上的单词。

如果在此之后,您想在获得的一组单词中找到一些特定的短语或单词,则必须要更有创造力:) OCR结果可能包含错误,因此可以使用精确的字符串匹配,但可以使用模糊匹配。另外,搜索短语(而不是仅搜索单词)会提出布局OCR结果的问题,因为一个短语中的单词在OCR结果中并不总是相邻的。

注意:我的公司MicroBlink提供用于移动设备的商业OCR engine。在iOS上,您可以轻松地使用cocoapods进行尝试

pod try PPBlinkOCR

BlinkOCR解决了上述所有问题,使用时可以与我们联系以获取支持。

关于ios - 使用iOS的Tesseract OCR逐字扫描图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31170607/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com