gpt4 book ai didi

image-recognition - 我可以告诉 Google Cloud 视觉隔离它在图像中读取的最大(字体大小)文本吗?

转载 作者:行者123 更新时间:2023-12-04 17:58:09 24 4
gpt4 key购买 nike

我想使用云视觉来识别和隔离图片中的“主要”文本(例如包装上最大的文字)。我假设云视觉能够通过查看字体大小/每个字母占用多少像素在后端做到这一点,但我不确定 API 中是否有输出。

我对这些信息在文档中的位置的最佳猜测是在以下链接中,但我看不到与此相关的任何内容:https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText

最佳答案

TEXT_DETECTION 视觉 API( https://cloud.google.com/vision/docs/samples#detecting_text_in_images )可以返回 (string + boundingPoly) 的数组。

json 表示 AnnotateImageResponse 如下。

"textAnnotations": [
{
object(EntityAnnotation)
}
]

实体注释 https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation

您可以从 BoundingPoly 获取字体大小(以像素为单位) https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly

关于image-recognition - 我可以告诉 Google Cloud 视觉隔离它在图像中读取的最大(字体大小)文本吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38678837/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com