api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？-6ren

api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？

转载作者：行者123 更新时间：2023-12-01 06:04:53

25

4

我正在尝试开发一个需要知道图像中标记对象位置的应用程序。知道图像中有“钢琴”是不够的，我需要知道钢琴在图像中的位置。

微软的计算机视觉 API 和谷歌的云视觉 API 都提供了某种形式的裁剪建议/智能缩略图生成服务，这让我认为正在检测某些对象的位置 - 但是有没有办法获取该信息(如边界框)围绕每个检测到的对象)来自 Microsoft 的计算机视觉 API 或 Google 的 Cloud Vision API？

编辑:我知道这两个 API 都可以返回图像中检测到的人脸的位置，但是我正在寻找图像中每个对象的位置和大小:汽车、钢琴、树木、人......任何东西。

最佳答案

Microsoft Vision API 不提供检测到的对象的像素坐标(请参阅返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa)。

但是，如果您想检测人，Microsoft API 可以返回人脸矩形的坐标。

关于api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41307758/

25

4

0

文章推荐： amazon-kinesis-firehose - Kinesis Firehose putRecord 与 putRecordBatch

文章推荐： skype - 使用 Skype For Web SDK 记录通话、消息和视频

文章推荐： jquery - 如何让 jQuery 使用安全服务？

java - 缓慢移动的物体(视觉)
当我尝试以非整数的步长(例如，每帧 0.5 像素)在屏幕上移动图形对象时，这会导致移动不稳定和“滞后”；因为对象只会每两帧移动 1 个像素。我理解为什么会发生这种情况，因为对象的 x/y 值必须是整
Android - 如何创建家谱图(视觉)
市面上有大量的家谱应用程序，但出于某种原因，我找不到一个示例来说明如何为 Android 应用程序创建一个。我是否使用 Canvas ，是否有图表库？我的基本要求是画一个三层的树(节点)图/图表，其
vim:视觉 block 选择直到每一行的字符
[ {name: 'John'}, {name: 'Plasmody'}, {name: 'Kugelschreiber'}, {name: 'Sarrah'}, ] 如果我在 J并做
php - 视觉 Composer 在哪里存储链接？
我试图定位所有没有 www 的链接。在数据库中。 https://launchhousing.org.au 并替换为 https://www.launchhousing.org.au 我使用了“搜索和
svn - 视觉 SVN 还是替代方案？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
svn - (视觉)SVN 通过正则表达式忽略文件
我需要排除具有以下模式的文件: ProjectFoo.Data[0-9]{14}.lgp 如何将 RegEx 用于 (Visual)SVN 忽略列表？最佳答案 subversion 忽略列表不支持正
audio - 创建绘制的音频 react 视觉
我正在寻找在处理中创建该项目的方法，但是，我发现该术语有点困难。我不确定如何调用在整个歌曲中线条永久保持的效果来“绘制”音乐数据。对于我可以查看哪些教程或某人的回答，我将不胜感激。我的目标是创建尽
android:视觉/艺术 Assets
我正在尝试为 android 制作游戏。我目前已将所有美术资源加载到 drawables 文件夹中，但我的问题是如何实际引用特定资源来渲染它？我知道每个文件都有一个唯一的@id，我可能必须在onDr
android - 视觉，图标，图像等移动应用程序设计
Closed. This question is off-topic。它当前不接受答案。
ios - 视觉 QuartzCore iOS
只是一个简单的问题。有一个简单的可视化工具可以生成iOS/QuartzCore的源代码吗？例如，我会制作一个带有路径和a的CAKeyframeAnimation(例如CGPathMoveToPoi
html - 如何调整文本宽度并将其放在帖子(视觉)编辑器的中心？
编辑 3:我想这已经解决了。我刚刚启用了古腾堡编辑器并发现了它的“经典编辑器”部分，即代码编辑器。我唯一需要习惯的是我无法轻易修改的编辑器行高，这还不错。这对我有用，它超过了修改 functions.
jquery - 视觉 Composer 挑战
我想在具有背景 slider 的可视 Composer 行内创建一个下拉菜单，最重要的是我要切换的链接。我在编辑自定义 css 时面临的问题是链接没有设置为 bottom:0;已设置position:
c++ - 视觉 C++ 开发
我正在学习 C++，并且了解一点 Visual Basic 和 Delphi。但我想知道，有没有像 Delphi 这样的程序，但适用于 C++。您可以将按钮拖到窗体上，双击它，就像在 Delphi
python - 找不到匹配的 GLX 视觉
我正在努力使用 pygame 初始化 OpenGL 显示。和pyopengl . import pygame pygame.init() pygame.display.set_mode((1920,
html - Wordpress 视觉 - 没有换行符被识别
不确定我做错了什么。我创建了一个主题，除了我在可视化编辑器中创建帖子外，一切都很好。对我来说，这很好，但大多数用户不了解 HTML，因此无法真正进入并编辑代码。在元素检查器(Chrome)中，文章是
c# - 如何在所谓的事件中找到哪个控件引发了事件？视觉 C#
我正在编写一个 C# 程序，它接受一堆参数并对数据点进行一些转换，然后将它们绘制到屏幕上。在我的一个表单上，我有一堆文本框，我都想执行相同的 KeyPress 事件。在我只做一个 switch 语句
uml - 视觉 2013 : Where are the signal shapes?
我正在创建 UML 事件图，我需要使用发送和接受信号，但我似乎找不到它。我试图用谷歌搜索它，但我似乎找不到任何东西。有谁知道我在哪里可以找到它们，或者它们在 Visio 中不存在？最佳答案想知道为
visual-studio - 视觉 haskell 2008
是 Haskell for Visual Studio 2005兼容VS2008 SP1 ? 最佳答案您最初问题的答案是否定的。visual haskell 的代码是用 Haskell 编写的，并通
wordpress - 是否可以在可分页容器(视觉 Composer )上使用箭头？
我正在使用 Visual Composer 开发我的 WordPress 网站。我需要包含一个可分页的容器，但如果它可以像幻灯片一样就更好了。 This is my pageable contain
rest - 视觉 REST API Playground
有哪些 Web 应用程序可以让我直观地(通过单击)使用任何 REST API 并生成一些代码(以任何语言)来捕捉我所描述的视觉内容？与 Swagger 或 Google API Playground

首页

博学

6Ren·AI

商城

api - Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？