- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在开发一个在 iPhone/iPad 上使用 CoreAudio 的应用程序。该应用程序既通过扬声器(输出)播放音频,又同时从麦克风(输入)录制音频。出于此应用程序的目的,我能够比较输入和输出,特别是它们在时域中“排列”的程度,这一点非常重要。因此,正确计算输入和输出 channel 之间的总延迟时间至关重要。
我正在 3 种不同的设备上进行测试。 iPhone、iPad 和模拟器。我已经能够根据经验确定 iPhone 的延迟大约为 4050 个样本,iPad 接近 4125 个样本,而模拟器大约为 2500 个样本。
经过大量研究(又名谷歌搜索),我在网上发现了一些关于计算 CoreAudio 延迟的讨论,但它们通常与在 OSX 而不是 iOS 上使用 CoreAudio 有关。因此,它们指的是 iOS 上不存在的各种功能。然而,对于 iOS 来说,正确的解决方案似乎是使用 AVAudioSession
以及 inputLatency
、outputLatency
和 IOBufferDuration 的一些组合
。然而,这些值的组合似乎没有加起来等于上面根据经验确定的值。此外,在调用 AudioUnitInitialize
之前和之后检查每个参数时,我会得到截然不同的值。更令人困惑的是,这些值更接近调用 AudioUnitInitialize
之前的预期延迟,这与我的预期相反。
这是我看到的值。
模拟器总是为输入和输出返回 0.01,但我怀疑这些不是实际/正确的值,而且模拟器不支持此功能。
另一个可能有趣的注意事项是,我使用的是 kAudioUnitSubType_VoiceProcessingIO
而不是 kAudioUnitSubType_RemoteIO
,我确实希望这会增加一些额外的延迟。我的假设是这将包含在 inputLatency
值中,但也许我需要查询另一个值来包含它?
确定 iOS 中输入和输出之间总延迟的正确方法是什么?
最佳答案
每个设备都有自己的延迟指标。即使相同的型号和操作系统版本。在模拟器上估计时间没有意义。它不会显示设备的实际延迟时间。
延迟无法高精度计算。因为您没有考虑信号到达麦克风的时间。此外,在每次开始使用流时,仍然存在延迟。
选择用于录音的麦克风也会受到影响。从 iPhone 6 开始,至少有三个。默认值较低。
两年来我一直在处理此类问题。最有效的方法是校准(平衡)设备。启动音频单元时,您需要发送随机高频信号。在入口处获取它,评估差异并从它开始。
我在缓冲区的帮助下自行调整流,以始终处理相应的样本。
最好在每次开始时都这样做。这需要一瞬间,但您的 I/O 流始终保持同步。
编辑 1
如果你要做一个校准器:
例如,采样频率为 44100,样本大小为 512,您可以使用 44100/512 = 倍数的频率86.13.
频率:86.13 赫兹、172.27 赫兹、258.40 赫兹、344.53 赫兹、430.66 赫兹、516.80 赫兹、602.93 赫兹、689.06 赫兹、775.20 赫兹、861.33 赫兹、947.46 赫兹、1033.59 赫兹、1119.73 赫兹、1205.86 赫兹 等
否则,将信号转换为频谱时,会变得模糊。
编辑 2
创建示例并获取示例频谱示例代码。
import Foundation
import Accelerate
import AudioUnit
import AVFoundation
public class StackExample {
//
// createSample(512, [1, 3, 5])
// Was create sample with length 512 reports for frequencies: 86.13 Hz (1), 258.40 Hz (3), 430.66 Hz (5).
// Number of frequency is number of multiplicity 44100/512
// You can use frequencies from 1 to half of frameSize
//
public func createSample(frameSize: Int, frequencies: [Int]) -> [Float] {
// result sample
var sample = [Float]()
// prepare diferent report in sample
for index in 0..<frameSize {
var report: Float = 0.0
for frequencyNumber in frequencies {
report += sinf(2.0 * Float.pi * Float(index) * Float(frequencyNumber) / Float(frameSize))
}
// report value mast been in range between -1.0 and 1.0
// if we send more one frequencies we must divide each report by the number of frequencies
if frequencies.count > 1 { report = report / Float(frequencies.count) }
// with this configuration, the signal will immediately play at maximum volume. It must be smoothed in sinusoin over the entire segment.
report *= sinf(Float.pi * Float(index) / Float(frameSize - 1))
sample.append(report)
}
return sample
}
// spectrum was half of count of reports in sample
// for sample with length 512 get spectrum with 256 frequencies. Frequency numbers are also multiple like in code of generation of sample.
public func getSpectrum(frameSize: Int, sample: [Float]) -> [Float] {
// create fft setup
let frameLog2Size = UInt(log2(Double(frameSize)))
let fftSetup = vDSP_create_fftsetup(frameLog2Size, FFTRadix(FFT_RADIX2))!
let spectrumSize = frameSize / 2
var reals = [Float]()
var imags = [Float]()
for (idx, element) in sample.enumerated() {
if idx % 2 == 0 {
reals.append(element)
} else {
imags.append(element)
}
}
var complexBuffer = DSPSplitComplex(realp: UnsafeMutablePointer(mutating: reals), imagp: UnsafeMutablePointer(mutating: imags))
// direct fft transform
vDSP_fft_zrip(fftSetup, &complexBuffer, 1, UInt(frameLog2Size), Int32(FFT_FORWARD))
var magnitudes = [Float](repeating: 0.0, count: spectrumSize)
// calculation of magnitudes
vDSP_zvmags(&complexBuffer, 1, &magnitudes, 1, UInt(spectrumSize))
return magnitudes
}
}
编辑 3
如何简单地进行校准:
关于ios - CoreAudio : Calculate total latency between input and output with kAudioUnitSubType_VoiceProcessingIO,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59754071/
我有两个文本输入元素 A 和 B。 我希望用户能够从 A 中选择部分或全部文本并拖动到 B,但文本不会从 A 中消失。 假设“A”包含“quick brown fox”,用户突出显示“fox”一词并将
我正在一个网站上工作,如果在提交表单之前数字不在最小值和最大值之间,我希望数字输入能够自行更正。我的代码如下: HTML: JavaScript: function CorrectOverUnder
在检查输入值是否存在并将其分配给变量时,我看到了两种实现此目的的方法: if(Input::has('id')) { $id = Input::get('id'); // do som
我意识到 有一个 border-box盒子模型,而有一个 content-box盒子模型。此行为存在于 IE8 和 FF 中。不幸的是,这使我无法将这种样式应用于大小均匀的输入: input, tex
在 Polymer 文档 ( https://elements.polymer-project.org/elements/iron-input ) 中,我发现: 而在另一个官方文档(https://
我使用 jquery 添加/删除输入 我使用append为日期/收入添加多个Tr 我还使用另一个附加来添加多个 td 以获取同一日期 Tr 中的收入 我添加多个日期输入,并在此表中添加多个收入输入 我
Python3 的 input() 似乎在两次调用 input() 之间采用旧的 std 输入。有没有办法忽略旧输入,只接受新输入(在 input() 被调用之后)? import time a =
在一些教程中,我看到了这些选择器: $(':input'); 或 $('input'); 注意“:”。 有什么不同吗? 最佳答案 $('input') = 仅包含元素名称,仅选择 HTML 元素。 $
我有下一个 html 表单: Nombre: El nombre es obligatorio. Solo se pe
有两种方法可以在组件上定义输入: @Component({ inputs: ['displayEntriesCount'], ... }) export class MyTable i
input: dynamic input is missing dimensions in profile onnx2trt代码报错: import numpy as np import tensor
所以,我有允许两个输入的代码: a, b = input("Enter a command: ").split() if(a == 'hello'): print("Hi") elif(a =
我有一个与用户交流的程序。我正在使用 input() 从用户那里获取数据,但是,我想告诉用户,例如,如果用户输入脏话,我想打印 You are swearing!立即删除它! 而 用户正在输入。 如您
我在运行 J2ME 应用程序时遇到了一些严重的内存问题。 所以我建立了另一个步骤来清除巨大的输入字符串并处理它的数据并清除它。但直到我设置 input = null 而不是 input = "" 才解
我想在我的 android 虚拟设备中同时启用软输入和硬键盘。我知道如何两者兼得,但不会两者。 同时想要BOTH的原因: 软输入:预览当键盘缩小屏幕时布局如何调整大小 硬键盘:显然是快速输入。 提前致
我有一个邮政编码字段,在 keyup 上我执行了一个 ajax 调用。如果没有可用的邮政编码,那么我想添加类“input-invalid”。但问题是,在我单击输入字段的外部 某处之前,红色边框验证不会
根据我的理解使用 @Input() name: string; 并在组件装饰器中使用输入数组,如下所示 @Component({ ... inputs:
我有一段代码是这样的 @Component({ selector: 'control-messages', inputs: ['controlName: control'],
在@component中, @input 和@output 属性代表什么以及它们的用途是什么? 什么是指令,为什么我们必须把指令放在下面的结构中? directives:[CORE_DIRECTIVE
有没有一种方法可以测试变量是否会使SAS中的INPUT转换过程失败?或者,是否可以避免生成的“NOTE:无效参数”消息? data _null_; format test2 date9.; inp
我是一名优秀的程序员,十分优秀!