- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我需要从捕获的视频中识别帧中的矩形。我使用以下方法在观察图像的顶部显示一个矩形。
func displayRect(for observation: VNRectangleObservation) {
DispatchQueue.main.async { [weak self] in
guard let size = self?.imageView.frame.size else { return }
guard let origin = self?.imageView.frame.origin else { return }
let transform = CGAffineTransform(scaleX: size.width, y: size.height)
let rect = observation.boundingBox.applying(transform)
.applying(CGAffineTransform(scaleX: 1.0, y: -1.0))
.applying(CGAffineTransform(translationX: 0.0, y: size.height))
.applying(CGAffineTransform(translationX: -origin.x, y: -origin.y))
let path = UIBezierPath(rect: rect)
let layer = CAShapeLayer()
layer.path = path.cgPath
layer.fillRule = kCAFillRuleEvenOdd
layer.fillColor = UIColor.red.withAlphaComponent(0.2).cgColor
self?.overlay.sublayers = nil
self?.overlay.addSublayer(layer)
}
}
这对于从相机拍摄的图像来说效果很好,但对于来自拍摄视频的帧,矩形是关闭的。事实上,如果偏离 90 度,它看起来就像它(以及图像的整个坐标系)。请查看下面的屏幕截图。
我是否遗漏了有关视频帧的某些内容,可能会导致观察的 boundingBox
属性处于完全不同的坐标系中?
下面是我对 captureOutput
委托(delegate)方法的实现。
func captureOutput(_ output: AVCaptureOutput, didOutput sampleBuffer: CMSampleBuffer, from connection: AVCaptureConnection) {
guard let buffer = CMSampleBufferGetImageBuffer(sampleBuffer) else { return }
// Also tried converting to CGImage, creating handler from that, but made no difference
let handler = VNImageRequestHandler(cvPixelBuffer: buffer, options: [:])
let request = VNDetectRectanglesRequest()
request.minimumAspectRatio = VNAspectRatio(0.2)
request.maximumAspectRatio = VNAspectRatio(1.0)
request.minimumSize = Float(0.3)
try? handler.perform([request])
// Note: Only ever captures one rectangle, so calling `first` not the issue.
guard let observations = request.results as? [VNRectangleObservation],
let observation = observations.first else {
return removeShapeLayer()
}
displayRect(for: observation, buffer: buffer)
}
最佳答案
此问题是您没有将缓冲区的方向传递给 VNImageRequestHandler
,因此它将视频作为横向进行交易。然后,当它返回该矩形时,您将其放在纵向显示的视频上方。
您需要将方向传递给 VNImageRequestHandler
,或者修改(旋转)返回的矩形以将其考虑在内。
关于ios - 视觉框架为捕获的视频输出帧中的矩形提供了错误的坐标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51863050/
当我尝试以非整数的步长(例如,每帧 0.5 像素)在屏幕上移动图形对象时,这会导致移动不稳定和“滞后”;因为对象只会每两帧移动 1 个像素。 我理解为什么会发生这种情况,因为对象的 x/y 值必须是整
市面上有大量的家谱应用程序,但出于某种原因,我找不到一个示例来说明如何为 Android 应用程序创建一个。我是否使用 Canvas ,是否有图表库? 我的基本要求是画一个三层的树(节点)图/图表,其
[ {name: 'John'}, {name: 'Plasmody'}, {name: 'Kugelschreiber'}, {name: 'Sarrah'}, ] 如果我在 J并做
我试图定位所有没有 www 的链接。在数据库中。 https://launchhousing.org.au 并替换为 https://www.launchhousing.org.au 我使用了“搜索和
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
我需要排除具有以下模式的文件: ProjectFoo.Data[0-9]{14}.lgp 如何将 RegEx 用于 (Visual)SVN 忽略列表? 最佳答案 subversion 忽略列表不支持正
我正在寻找在处理中创建该项目的方法,但是,我发现该术语有点困难。我不确定如何调用在整个歌曲中线条永久保持的效果来“绘制”音乐数据。 对于我可以查看哪些教程或某人的回答,我将不胜感激。 我的目标是创建尽
我正在尝试为 android 制作游戏。我目前已将所有美术资源加载到 drawables 文件夹中,但我的问题是如何实际引用特定资源来渲染它? 我知道每个文件都有一个唯一的@id,我可能必须在onDr
Closed. This question is off-topic。它当前不接受答案。
只是一个简单的问题。 有一个简单的可视化工具可以生成iOS/QuartzCore的源代码吗? 例如,我会制作一个带有路径和a的CAKeyframeAnimation(例如CGPathMoveToPoi
编辑 3:我想这已经解决了。我刚刚启用了古腾堡编辑器并发现了它的“经典编辑器”部分,即代码编辑器。我唯一需要习惯的是我无法轻易修改的编辑器行高,这还不错。这对我有用,它超过了修改 functions.
我想在具有背景 slider 的可视 Composer 行内创建一个下拉菜单,最重要的是我要切换的链接。我在编辑自定义 css 时面临的问题是链接没有设置为 bottom:0;已设置position:
我正在学习 C++,并且了解一点 Visual Basic 和 Delphi。 但我想知道,有没有像 Delphi 这样的程序,但适用于 C++。您可以将按钮拖到窗体上,双击它,就像在 Delphi
我正在努力使用 pygame 初始化 OpenGL 显示。和pyopengl . import pygame pygame.init() pygame.display.set_mode((1920,
不确定我做错了什么。我创建了一个主题,除了我在可视化编辑器中创建帖子外,一切都很好。对我来说,这很好,但大多数用户不了解 HTML,因此无法真正进入并编辑代码。 在元素检查器(Chrome)中,文章是
我正在编写一个 C# 程序,它接受一堆参数并对数据点进行一些转换,然后将它们绘制到屏幕上。 在我的一个表单上,我有一堆文本框,我都想执行相同的 KeyPress 事件。在我只做一个 switch 语句
我正在创建 UML 事件图,我需要使用发送和接受信号,但我似乎找不到它。我试图用谷歌搜索它,但我似乎找不到任何东西。有谁知道我在哪里可以找到它们,或者它们在 Visio 中不存在? 最佳答案 想知道为
是 Haskell for Visual Studio 2005兼容VS2008 SP1 ? 最佳答案 您最初问题的答案是否定的。visual haskell 的代码是用 Haskell 编写的,并通
我正在使用 Visual Composer 开发我的 WordPress 网站。 我需要包含一个可分页的容器,但如果它可以像幻灯片一样就更好了。 This is my pageable contain
有哪些 Web 应用程序可以让我直观地(通过单击)使用任何 REST API 并生成一些代码(以任何语言)来捕捉我所描述的视觉内容? 与 Swagger 或 Google API Playground
我是一名优秀的程序员,十分优秀!