gpt4 book ai didi

api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置?

转载 作者:行者123 更新时间:2023-12-01 06:04:53 25 4
gpt4 key购买 nike

我正在尝试开发一个需要知道图像中标记对象位置的应用程序。知道图像中有“钢琴”是不够的,我需要知道钢琴在图像中的位置。

微软的计算机视觉 API 和谷歌的云视觉 API 都提供了某种形式的裁剪建议/智能缩略图生成服务,这让我认为正在检测某些对象的位置 - 但是有没有办法获取该信息(如边界框)围绕每个检测到的对象)来自 Microsoft 的计算机视觉 API 或 Google 的 Cloud Vision API?

编辑:我知道这两个 API 都可以返回图像中检测到的人脸的位置,但是我正在寻找图像中每个对象的位置和大小:汽车、钢琴、树木、人......任何东西。

最佳答案

Microsoft Vision API 不提供检测到的对象的像素坐标(请参阅返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa)。

但是,如果您想检测人,Microsoft API 可以返回人脸矩形的坐标。

关于api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41307758/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com