ios - 带有 VNRecognizedObjectObservation 的 boundingBox 框架不正确-6ren

ios - 带有 VNRecognizedObjectObservation 的 boundingBox 框架不正确

转载作者：行者123 更新时间：2023-12-04 22:36:19

29

4

我在使用 Core ML & Vision 在已识别对象周围显示边界框时遇到问题。

水平检测似乎工作正常，但是，垂直框太高，越过视频的顶部边缘，没有一直到达视频的底部，也没有跟随视频的运动相机正确。在这里您可以看到问题:https://imgur.com/Sppww8T

这是视频数据输出的初始化方式:

let videoDataOutput = AVCaptureVideoDataOutput()
videoDataOutput.alwaysDiscardsLateVideoFrames = true
videoDataOutput.videoSettings = [kCVPixelBufferPixelFormatTypeKey as String: Int(kCVPixelFormatType_420YpCbCr8BiPlanarFullRange)]
videoDataOutput.setSampleBufferDelegate(self, queue: dataOutputQueue!)
self.videoDataOutput = videoDataOutput
session.addOutput(videoDataOutput)
let c = videoDataOutput.connection(with: .video)
c?.videoOrientation = .portrait

我也尝试过其他视频方向，但没有太大成功。

执行视觉请求:

let handler = VNImageRequestHandler(cvPixelBuffer: image, options: [:])
try? handler.perform(vnRequests)

最后一旦请求被处理。 viewRect设置为视频 View 的大小:812x375(我知道，视频层本身有点短，但这不是这里的问题):

let observationRect = VNImageRectForNormalizedRect(observation.boundingBox, Int(viewRect.width), Int(viewRect.height))

我也试过做类似的事情(有更多问题):

var observationRect = observation.boundingBox
observationRect.origin.y = 1.0 - observationRect.origin.y
observationRect = videoPreviewLayer.layerRectConverted(fromMetadataOutputRect: observationRect)

我试图尽可能多地删除我认为不相关的代码。

我实际上使用 Apple 的示例代码遇到了类似的问题，当边界框不会按预期垂直绕过对象时: https://developer.apple.com/documentation/vision/recognizing_objects_in_live_capture也许这意味着 API 存在一些问题？

最佳答案

我使用这样的东西:

let width = view.bounds.width
let height = width * 16 / 9
let offsetY = (view.bounds.height - height) / 2
let scale = CGAffineTransform.identity.scaledBy(x: width, y: height)
let transform = CGAffineTransform(scaleX: 1, y: -1).translatedBy(x: 0, y: -height - offsetY)
let rect = prediction.boundingBox.applying(scale).applying(transform)

这假定纵向和 16:9 纵横比。它假定 .imageCropAndScaleOption = .scaleFill .

致谢:转换代码取自此存储库: https://github.com/Willjay90/AppleFaceDetection

关于ios - 带有 VNRecognizedObjectObservation 的 boundingBox 框架不正确，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55132517/

29

4

0

文章推荐： ssl - 通过 Istio 入口网关的 TLS 握手失败(tlsMode=passthrough)

文章推荐： .net - WebApp 的 APEX 限制

文章推荐： ZSH 和 ZLE，移到行首，写字符串，移到行尾

ios - 带有 VNRecognizedObjectObservation 的 boundingBox 框架不正确
我在使用 Core ML & Vision 在已识别对象周围显示边界框时遇到问题。水平检测似乎工作正常，但是，垂直框太高，越过视频的顶部边缘，没有一直到达视频的底部，也没有跟随视频的运动相机正确。在

首页

博学

6Ren·AI

商城

ios - 带有 VNRecognizedObjectObservation 的 boundingBox 框架不正确