gpt4 book ai didi

google-cloud-platform - 如何针对特定语言改进 Google Vision API 的 TEXT_DETECTION

转载 作者:行者123 更新时间:2023-12-03 23:09:50 24 4
gpt4 key购买 nike

我对 Google Vision API 的 TEXT_DETECTION 很感兴趣,它的效果令人印象深刻。但似乎 TEXT_DETECTION 只在文本为英文时给出准确的结果。就我而言,我想在非常狭窄的上下文中使用 TEXT_DETECTION,例如检测特定语言广告横幅上的文本(我的情况是越南语)。我可以根据自己的数据收集来训练机器以获得更准确的结果吗?以及如何实现?

除了 Google Vision API 的 TEXT_DETECTION 之外,Google 还有使用 Tesseract 依赖项的 Google 光学字符识别 (OCR) 软件。正如我所知,他们有不同的算法来检测文本。我使用 Google Docs 和 Google Vision API 的 TEXT_DETECTION 从图片中读取文本(越南语)。 Google Docs 给出了一个很好的结果,但 Vision API 没有。为什么 Google Vision API 没有继承 Google OCR 的优点?

我想多说一些关于 Google Vision API 文本检测的内容,也许这里的任何 Google 专家都可以阅读这篇文章。正如谷歌宣布的那样,他们的 TEXT_DETECTION 非常棒:“即使这张图片中的文字倾斜且不清楚,OCR 仍能正确提取文字及其位置。它甚至可以在演示者的 T 恤上识别出“beacon”一词”。但是对于我的一些照片,发生的事情真的很有趣。例如 this pic ,即使是“Kem Oxit”字样在图片中心也很大,无法识别。或者在 this pic ,图片中心的红色文字“HOA CHAT NGOC VIET”也未被识别。文本检测算法一定有问题。

最佳答案

您是否尝试过 LanguageHints ( link to documentation)?

越南语在supported languages的列表中,如果文本始终是越南语,这应该会提高文本检测的质量。

如果这没有帮助,您就无法通过提供自己的训练示例来提高文本检测的质量。

关于google-cloud-platform - 如何针对特定语言改进 Google Vision API 的 TEXT_DETECTION,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40013910/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com