gpt4 book ai didi

android - 使用 OCR 移动视觉将图像锚定到检测到的文本

转载 作者:搜寻专家 更新时间:2023-11-01 09:20:22 28 4
gpt4 key购买 nike

我正在使用 Google 的文本识别(移动视觉/机器学习)来检测相机源上的文本。一旦我检测到文本并确保它等于“HERE WE GO”,我就使用传递的边界在检测到的文本旁边绘制一个心形。

我面临的问题是形状跳跃和滞后。我希望它更像是锚定到检测到的文本。我可以做些什么来改进它吗?

我听说过 ArCore 库,但它似乎是基于现有图像来确定 anchor ,但在我的情况下,它可以是与“HERE WE GO”匹配的任何文本。

有什么建议吗?

最佳答案

我相信您正在尝试在相机预览中实时叠加文本。相机输入和检测之间会有很小的延迟。由于在输出返回时 API 是异步的,您将显示另一帧。为了减轻这种情况,您可以使用一些锁/互斥使处理部分同步,或者覆盖另一个仅在处理完成后刷新的图像。我们这里有一些例子:https://github.com/firebase/quickstart-android/tree/master/mlkit

我还通过使用 DispatchGroup https://github.com/googlecodelabs/mlkit-ios/blob/master/translate/TranslateDemo/CameraViewController.swift#L245 解决了 iOS 上的类似问题

关于android - 使用 OCR 移动视觉将图像锚定到检测到的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56465858/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com