gpt4 book ai didi

ocr - 在 Google Cloud Vision API OCR 中设置图像检测区域

转载 作者:行者123 更新时间:2023-12-04 15:53:58 24 4
gpt4 key购买 nike

我已经使用 Google Cloud Vision API 进行文档文本检测,但我无法弄清楚它是否允许我们定义图像的特定区域以从中提取文本。例如,如果我的图像有 3 列文本,并且我想提供我要执行 OCR 的特定列的左上角坐标、宽度和高度。可能吗?当我们在图像中有 3 列文本时,还有其他方法可以避免文本困惑吗?

最佳答案

目前,无法定义从中提取文本的特定图像区域。 REST 中的图像上下文中都没有可用参数或 gRPC蜜蜂。一种可能的解决方法是裁剪图像并仅发送要转录的文本。如果你想尝试自动化这个过程,也许是 object localizationcrop hints功能可能有用。

关于困惑的文本,您可以在 Json response 中找到每个 block 或段落。 .

关于ocr - 在 Google Cloud Vision API OCR 中设置图像检测区域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52647919/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com