gpt4 book ai didi

ios - iOS视觉:VNRecognizedText boundingBox(for :)方法返回任意范围的相同边界框

转载 作者:行者123 更新时间:2023-12-01 19:33:12 25 4
gpt4 key购买 nike

我正在使用iOS Vision框架通过VNRecognizeTextRequest调用执行OCR,并且试图在结果VNRecognizedText观察结果中定位每个单独的字符。但是,当我在任何boundingBox(for range: Range<String.Index>)对象上并且对于识别的文本内的任何有效范围调用VNRecognizedText方法时,我都会得到相同的边界框。此边界框对应于整个字符串的边界框。

我是否误解了boundingBox(for:)方法,或者是否有其他方法来获取已识别文本观察中单个字符的离散位置信息?

提前致谢!

编辑:

在深入研究之后,我意识到单词组和空白之间存在某种联系。
考虑字符串值为“Foo bar”的公认文本观察。为“Foo”中的每个字符调用boundingBox(for:)会返回完全相同的边界框,基于尺寸,边界框似乎对应于整个子字符串“Foo”,而不是我们将其范围传递给boundingBox方法的单个字符。然后,在另一种奇怪的行为中,空格字符的boundingBox只是原点处的空白区域,其边缘与该边的子字符串不对应。最后,第二个子字符串的行为与第一个子字符串相同:“bar”中的每个字符都有相同的边界框。

最佳答案

经过数小时的进一步调查,我决定与Apple开发人员技术支持联系。果然,这是一个错误!当像我一样将VNRecognizeTextRequest.recognitionLevel设置为.accurate时,该错误就会显现出来。当recognitionLevel设置为.fast时,结果按预期方式运行,每个字符都有离散的边框。

关于ios - iOS视觉:VNRecognizedText boundingBox(for :)方法返回任意范围的相同边界框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61214811/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com