ios - CoreAudio : Calculate total latency between input and output with kAudioUnitSubType

ios - CoreAudio : Calculate total latency between input and output with kAudioUnitSubType_VoiceProcessingIO

转载作者：行者123 更新时间：2023-12-01 16:13:10

24

4

我正在开发一个在 iPhone/iPad 上使用 CoreAudio 的应用程序。该应用程序既通过扬声器(输出)播放音频，又同时从麦克风(输入)录制音频。出于此应用程序的目的，我能够比较输入和输出，特别是它们在时域中“排列”的程度，这一点非常重要。因此，正确计算输入和输出 channel 之间的总延迟时间至关重要。

我正在 3 种不同的设备上进行测试。 iPhone、iPad 和模拟器。我已经能够根据经验确定 iPhone 的延迟大约为 4050 个样本，iPad 接近 4125 个样本，而模拟器大约为 2500 个样本。

经过大量研究(又名谷歌搜索)，我在网上发现了一些关于计算 CoreAudio 延迟的讨论，但它们通常与在 OSX 而不是 iOS 上使用 CoreAudio 有关。因此，它们指的是 iOS 上不存在的各种功能。然而，对于 iOS 来说，正确的解决方案似乎是使用 AVAudioSession 以及 inputLatency、outputLatency 和 IOBufferDuration 的一些组合。然而，这些值的组合似乎没有加起来等于上面根据经验确定的值。此外，在调用 AudioUnitInitialize 之前和之后检查每个参数时，我会得到截然不同的值。更令人困惑的是，这些值更接近调用 AudioUnitInitialize 之前的预期延迟，这与我的预期相反。

这是我看到的值。

iPad(之前):输入 0.032375，输出 0.013651，buf 0.023220，样本总数 3054
iPad(之后):输入 0.000136，输出 0.001633，buf 0.023220，样本总数 1102
iPhone(之前):in 0.065125，out 0.004500，buf 0.021333，样本总数 4011
iPhone(之后):0.000354，out 0.000292，buf 0.021333，总样本 969

模拟器总是为输入和输出返回 0.01，但我怀疑这些不是实际/正确的值，而且模拟器不支持此功能。

另一个可能有趣的注意事项是，我使用的是 kAudioUnitSubType_VoiceProcessingIO 而不是 kAudioUnitSubType_RemoteIO，我确实希望这会增加一些额外的延迟。我的假设是这将包含在 inputLatency 值中，但也许我需要查询另一个值来包含它？

确定 iOS 中输入和输出之间总延迟的正确方法是什么？

最佳答案

每个设备都有自己的延迟指标。即使相同的型号和操作系统版本。在模拟器上估计时间没有意义。它不会显示设备的实际延迟时间。

延迟无法高精度计算。因为您没有考虑信号到达麦克风的时间。此外，在每次开始使用流时，仍然存在延迟。

选择用于录音的麦克风也会受到影响。从 iPhone 6 开始，至少有三个。默认值较低。

两年来我一直在处理此类问题。最有效的方法是校准(平衡)设备。启动音频单元时，您需要发送随机高频信号。在入口处获取它，评估差异并从它开始。

我在缓冲区的帮助下自行调整流，以始终处理相应的样本。

最好在每次开始时都这样做。这需要一瞬间，但您的 I/O 流始终保持同步。

编辑 1

如果你要做一个校准器:

请记住，voiprocessing 处理高频声音效果更差。
18 kHz 以上频率的可听度显着下降。
同时录制和播放时，默认使用顶部扬声器(您很可能已经知道这一点)。
生成信号时，只使用多个频率(我不知道英文怎么说)。频率必须是 sampleRate/frameSize 的倍数。

例如，采样频率为 44100，样本大小为 512，您可以使用 44100/512 = 倍数的频率86.13.

频率:86.13 赫兹、172.27 赫兹、258.40 赫兹、344.53 赫兹、430.66 赫兹、516.80 赫兹、602.93 赫兹、689.06 赫兹、775.20 赫兹、861.33 赫兹、947.46 赫兹、1033.59 赫兹、1119.73 赫兹、1205.86 赫兹 等

否则，将信号转换为频谱时，会变得模糊。

编辑 2

创建示例并获取示例频谱示例代码。

import Foundation
import Accelerate
import AudioUnit
import AVFoundation

public class StackExample {


    //
    // createSample(512, [1, 3, 5])
    // Was create sample with length 512 reports for frequencies: 86.13 Hz (1), 258.40 Hz (3), 430.66 Hz (5).
    // Number of frequency is number of multiplicity 44100/512
    // You can use frequencies from 1 to half of frameSize
    //
    public func createSample(frameSize: Int, frequencies: [Int]) -> [Float] {
        // result sample
        var sample = [Float]()
        // prepare diferent report in sample
        for index in 0..<frameSize {
            var report: Float = 0.0
            for frequencyNumber in frequencies {
                report += sinf(2.0 * Float.pi * Float(index) * Float(frequencyNumber) / Float(frameSize))
            }
            // report value mast been in range between -1.0 and 1.0
            // if we send more one frequencies we must divide each report by the number of frequencies
            if frequencies.count > 1 { report = report / Float(frequencies.count) }

            // with this configuration, the signal will immediately play at maximum volume. It must be smoothed in sinusoin over the entire segment.
            report *= sinf(Float.pi * Float(index) / Float(frameSize - 1))

            sample.append(report)
        }

        return sample
    }

    // spectrum was half of count of reports in sample
    // for sample with length 512 get spectrum with 256 frequencies. Frequency numbers are also multiple like in code of generation of sample.
    public func getSpectrum(frameSize: Int, sample: [Float]) -> [Float] {
        // create fft setup
        let frameLog2Size = UInt(log2(Double(frameSize)))
        let fftSetup = vDSP_create_fftsetup(frameLog2Size, FFTRadix(FFT_RADIX2))!
        let spectrumSize = frameSize / 2

        var reals = [Float]()
        var imags = [Float]()

        for (idx, element) in sample.enumerated() {
            if idx % 2 == 0 {
                reals.append(element)
            } else {
                imags.append(element)
            }
        }

        var complexBuffer = DSPSplitComplex(realp: UnsafeMutablePointer(mutating: reals), imagp: UnsafeMutablePointer(mutating: imags))
        // direct fft transform
        vDSP_fft_zrip(fftSetup, &complexBuffer, 1, UInt(frameLog2Size), Int32(FFT_FORWARD))
        var magnitudes = [Float](repeating: 0.0, count: spectrumSize)
        // calculation of magnitudes
        vDSP_zvmags(&complexBuffer, 1, &magnitudes, 1, UInt(spectrumSize))
        return magnitudes
    }
}

编辑 3

如何简单地进行校准:

发送信号。
监听输入流并等待信号。
当您找到信号高于阈值的样本时，使用上一个当前样本和下一个样本进行二进制搜索。

关于ios - CoreAudio : Calculate total latency between input and output with kAudioUnitSubType_VoiceProcessingIO，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59754071/

24

4

0

文章推荐： ios - 模块 AppRegistry 不是注册的可调用模块

文章推荐： java - 如何在jscrollpane中添加自动滚动条？

文章推荐： Java Spring Boot Web 应用程序 : Handling 404 Exception

文章推荐： java - 当子类扩展父类(super class)时自动将其添加到列表中

javascript - 将文本从一个 INPUT 拖动到另一个 INPUT，而不从源 INPUT 中删除文本
我有两个文本输入元素 A 和 B。我希望用户能够从 A 中选择部分或全部文本并拖动到 B，但文本不会从 A 中消失。假设“A”包含“quick brown fox”，用户突出显示“fox”一词并将
JavaScript 无法将 input.min、input.max、input.value 识别为整数
我正在一个网站上工作，如果在提交表单之前数字不在最小值和最大值之间，我希望数字输入能够自行更正。我的代码如下: HTML: JavaScript: function CorrectOverUnder
php - Laravel 4:Input::has() + Input::get() vs. ($var = Input::get()) != null
在检查输入值是否存在并将其分配给变量时，我看到了两种实现此目的的方法: if(Input::has('id')) { $id = Input::get('id'); // do som
input - <input type ="submit"/> 和 <input type ="text"/> 之间的盒模型不一致
我意识到有一个 border-box盒子模型，而有一个 content-box盒子模型。此行为存在于 IE8 和 FF 中。不幸的是，这使我无法将这种样式应用于大小均匀的输入: input, tex
html - 在 Polymer 中，为什么要使用 `<input is="iron-input">` instead of ` `？
在 Polymer 文档 ( https://elements.polymer-project.org/elements/iron-input ) 中，我发现: 而在另一个官方文档(https://
PHP : multiple inputs into other multiple inputs
我使用 jquery 添加/删除输入我使用append为日期/收入添加多个Tr 我还使用另一个附加来添加多个 td 以获取同一日期 Tr 中的收入我添加多个日期输入，并在此表中添加多个收入输入我
python input() 在调用 input() 之前采用旧的标准输入
Python3 的 input() 似乎在两次调用 input() 之间采用旧的 std 输入。有没有办法忽略旧输入，只接受新输入(在 input() 被调用之后)？ import time a =
jquery - :input and input in Jquery 之间的区别
在一些教程中，我看到了这些选择器: $(':input'); 或 $('input'); 注意“:”。有什么不同吗？最佳答案 $('input') = 仅包含元素名称，仅选择 HTML 元素。 $
javascript - $(input).blur() & $(input).focusout
我有下一个 html 表单: Nombre: El nombre es obligatorio. Solo se pe
javascript - 为什么 `@input` 装饰器优先于 `inputs:[]`
有两种方法可以在组件上定义输入: @Component({ inputs: ['displayEntriesCount'], ... }) export class MyTable i
input: dynamic input is missing dimensions in profile
input: dynamic input is missing dimensions in profile onnx2trt代码报错： import numpy as np import tensor
python - 如何在 "two-input input"中允许单个输入？
所以，我有允许两个输入的代码: a, b = input("Enter a command: ").split() if(a == 'hello'): print("Hi") elif(a =
python - 如何在 input() 进行时访问 input() 函数
我有一个与用户交流的程序。我正在使用 input() 从用户那里获取数据，但是，我想告诉用户，例如，如果用户输入脏话，我想打印 You are swearing!立即删除它! 而用户正在输入。如您
Java input = ""与 input = null 不同吗？
我在运行 J2ME 应用程序时遇到了一些严重的内存问题。所以我建立了另一个步骤来清除巨大的输入字符串并处理它的数据并清除它。但直到我设置 input = null 而不是 input = "" 才解
安卓模拟器 : both soft input and hard keyboard input
我想在我的 android 虚拟设备中同时启用软输入和硬键盘。我知道如何两者兼得，但不会两者。同时想要BOTH的原因: 软输入:预览当键盘缩小屏幕时布局如何调整大小硬键盘:显然是快速输入。提前致
javascript - addClass "input-invalid"to input 在我点击输入元素外部之前不会显示
我有一个邮政编码字段，在 keyup 上我执行了一个 ajax 调用。如果没有可用的邮政编码，那么我想添加类“input-invalid”。但问题是，在我单击输入字段的外部某处之前，红色边框验证不会
Angular4 @Input() 与 Component.inputs 数组
根据我的理解使用 @Input() name: string; 并在组件装饰器中使用输入数组，如下所示 @Component({ ... inputs:
typescript - 如何将语法 "inputs"属性更改为 "@Input"属性装饰器
我有一段代码是这样的 @Component({ selector: 'control-messages', inputs: ['controlName: control'],
input - Angular 2 : What are @input and @output properties
在@component中， @input 和@output 属性代表什么以及它们的用途是什么？什么是指令，为什么我们必须把指令放在下面的结构中？ directives:[CORE_DIRECTIVE
input - 避免SAS错误消息: "NOTE: Invalid argument to function INPUT"
有没有一种方法可以测试变量是否会使SAS中的INPUT转换过程失败？或者，是否可以避免生成的“NOTE:无效参数”消息？ data _null_; format test2 date9.; inp

首页

博学

6Ren·AI

商城

ios - CoreAudio : Calculate total latency between input and output with kAudioUnitSubType_VoiceProcessingIO