gpt4 book ai didi

ocr - 通过Google Cloud Vision API获得正确的图像方向(TEXT_DETECTION)

转载 作者:行者123 更新时间:2023-12-04 21:53:31 25 4
gpt4 key购买 nike

我在旋转90度的图像上尝试了Google Cloud Vision API(TEXT_DETECTION)。它仍然可以正确返回识别的文本。 (见下图)

这意味着即使图像旋转了90、180、270度,引擎也可以识别文本。

但是,响应结果不包含正确图像方向的信息。 (文档:EntityAnnotation

无论如何,不​​仅要获得可识别的文本,还要获得方向?
Google是否可以像(FaceAnnotation:getRollAngle)一样支持它

enter image description here

最佳答案

Public Issue Tracker中所述,我们的工程团队现在知道此功能请求,并且目前尚无实现该功能的ETA。

注意,方向信息可能已经在图像的元数据中可用。该Third-party library中提供了有关如何提取元数据的示例。

一个广泛的解决方法是检查返回的“ boundingPoly”“顶点”是否为返回的“ textAnnotations”。通过计算每个检测到的单词的矩形的宽度和高度,可以判断出如果矩形的“高度”>“宽度”(即图像是横向的),图像是否不是右上方。

关于ocr - 通过Google Cloud Vision API获得正确的图像方向(TEXT_DETECTION),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41285556/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com