swift AVAudioEngine 将多声道非交错信号转换为单声道-6ren

swift AVAudioEngine 将多声道非交错信号转换为单声道

转载作者：行者123 更新时间：2023-12-02 23:28:31

我正在使用 AVAudioEngine 进行测量。我从界面中播放刺激声音，并使用 micTap 记录返回的信号。

我现在正在研究支持多种不同格式的不同音频接口(interface)。我通过混合器转换 inputNode 的输入格式有两个不同的原因:

从接口(interface)的首选 sampleRate 下采样到我的应用程序正在运行的 sampleRate

将输入 channel 数转换为单个单声道

我试试这个，但它似乎并不总是按预期工作。如果我的界面正在运行 96k 而我的应用程序正在运行 48k，则通过混音器进行格式更改最终会得到以下结果:

这看起来只是获得立体声交错 channel 的一侧。下面是我的音频引擎代码:

func initializeEngine(inputSweep:SweepFilter)  {
    buf1current = 0
    buf2current = 0
    in1StartTime = 0
    in2startTime = 0
    in1firstRun = true
    in2firstRun = true
    in1Buf = Array(repeating:0, count:1000000)
    in2Buf = Array(repeating:0, count:1000000)
    engine.stop()
    engine.reset()
    engine = AVAudioEngine()
    numberOfSamples = 0

    var time:Int = 0
    do {
        try AVAudioSession.sharedInstance().setCategory(.playAndRecord)
        try AVAudioSession.sharedInstance()
        .setPreferredSampleRate(Double(sampleRate))    
    } catch {
        assertionFailure("AVAudioSession setup failed")
    }

    let format = engine.outputNode.inputFormat(forBus: 0)
    let stimulusFormat = AVAudioFormat(commonFormat: .pcmFormatFloat32,
        sampleRate: Double(sampleRate),
        channels: 1,
        interleaved: false)

    let outputFormat = engine.outputNode.inputFormat(forBus: 0)
    let inputFormat = engine.inputNode.outputFormat(forBus: 0)

    let srcNode = AVAudioSourceNode { _, timeStamp, frameCount, AudioBufferList -> OSStatus in
            let ablPointer = UnsafeMutableAudioBufferListPointer(AudioBufferList)
            if self.in2firstRun == true {
                let start2 = CACurrentMediaTime()
                self.in2startTime = Double(CACurrentMediaTime())
                self.in2firstRun = false
            }

            if Int(frameCount) + time >= inputSweep.stimulus.count{
            self.running = false
            print("AUDIO ENGINE STOPPED")
        }

        if (Int(frameCount) + time) <= inputSweep.stimulus.count {
            for frame in 0..<Int(frameCount) {
                let value = inputSweep.stimulus[frame + time] * Float(outputVolume)
                for buffer in ablPointer {
                    let buf: UnsafeMutableBufferPointer<Float> = UnsafeMutableBufferPointer(buffer)
                    buf[frame] = value
                }
            }

            time += Int(frameCount)
        } else {
            for frame in 0..<Int(frameCount) {
                let value = 0
                for buffer in ablPointer {
                    let buf: UnsafeMutableBufferPointer<Float> = UnsafeMutableBufferPointer(buffer)
                    buf[frame] = Float(value)
                }
            }
        }
    return noErr
    }

    engine.attach(srcNode)
    engine.connect(srcNode, to: engine.mainMixerNode, format: stimulusFormat)
    engine.connect(engine.mainMixerNode, to: engine.outputNode, format: format)

    let requiredFormat = AVAudioFormat(commonFormat: .pcmFormatFloat32,
        sampleRate: Double(sampleRate),
        channels: 1,
        interleaved: false)  

    let formatMixer = AVAudioMixerNode()
    engine.attach(formatMixer)
    engine.connect(engine.inputNode, to: formatMixer, format: inputFormat)

    let MicSinkNode = AVAudioSinkNode() { (timeStamp, frames, audioBufferList) ->
        OSStatus in
            if self.in1firstRun == true {
                let start1 = CACurrentMediaTime()
                self.in1StartTime = Double(start1)
                self.in1firstRun = false

           }

            let ptr = audioBufferList.pointee.mBuffers.mData?.assumingMemoryBound(to: Float.self)
            var monoSamples = [Float]()
            monoSamples.append(contentsOf: UnsafeBufferPointer(start: ptr, count: Int(frames)))
        if self.buf1current >= 100000 {
            self.running = false
        }
            for frame in 0..<frames {
                self.in1Buf[self.buf1current + Int(frame)] = monoSamples[Int(frame)]
            }
            self.buf1current = self.buf1current + Int(frames)



       return noErr
    }

    engine.attach(MicSinkNode)
    engine.connect(formatMixer, to: MicSinkNode, format: requiredFormat)

    engine.prepare()
    assert(engine.inputNode != nil)
    running = true
    try! engine.start()
}

我的 sourceNode 是一个使用stimulusFormat 合成的浮点数组。如果我以 96k 的接口(interface)收听这个 audioEngine，输出刺激听起来完全干净。然而，这个 splinter 的信号是来自 micTap 的。物理上接口(interface)的输出是路由的。直接输入，所以不通过任何其他设备。

除此之外，我还有以下函数，它将我的数组记录到 WAV 文件中，以便我可以在 DAW 中直观地检查。

func writetoFile(buff:[Float], name:String){
let SAMPLE_RATE =  sampleRate

let outputFormatSettings = [
    AVFormatIDKey:kAudioFormatLinearPCM,
    AVLinearPCMBitDepthKey:32,
    AVLinearPCMIsFloatKey: true,
    AVLinearPCMIsBigEndianKey: true,
    AVSampleRateKey: SAMPLE_RATE,
    AVNumberOfChannelsKey: 1
    ] as [String : Any]

let fileName = name
let DocumentDirURL = try! FileManager.default.url(for: .documentDirectory, in: .userDomainMask, appropriateFor: nil, create: true)


let url = DocumentDirURL.appendingPathComponent(fileName).appendingPathExtension("wav")
//print("FilePath: \(url.path)")

let audioFile = try? AVAudioFile(forWriting: url, settings: outputFormatSettings, commonFormat: AVAudioCommonFormat.pcmFormatFloat32, interleaved: false)

let bufferFormat = AVAudioFormat(settings: outputFormatSettings)

let outputBuffer = AVAudioPCMBuffer(pcmFormat: bufferFormat!, frameCapacity: AVAudioFrameCount(buff.count))

for i in 0..<buff.count {
    outputBuffer?.floatChannelData!.pointee[i] = Float(( buff[i] ))
}
outputBuffer!.frameLength = AVAudioFrameCount( buff.count )

do{
    try audioFile?.write(from: outputBuffer!)

} catch let error as NSError {
    print("error:", error.localizedDescription)
}

}

如果我将我的接口(interface)设置为 48k，并且我的应用程序以 48k 运行，如果我检查我的引用信号和。我的测量信号，我得到以下信息:

测量的信号显然比原始刺激要长很多。物理文件大小。与初始化为固定大小的空数组相同。但是在某些时候进行格式转换，这是不正确的。
如果我将界面设置为 44.1k，而我的应用程序以 48k 运行，我可以在音频中看到常规的“故障”。所以这里的格式转换不能正常工作。

任何人都可以看到明显的错误吗？

最佳答案

将非交错选项“AVLinearPCMIsNonInterleaved”放入格式设置中:

let outputFormatSettings = [
**AVLinearPCMIsNonInterleaved: 0,**
AVFormatIDKey:kAudioFormatLinearPCM,
AVLinearPCMBitDepthKey:32,
AVLinearPCMIsFloatKey: true,
AVLinearPCMIsBigEndianKey: true,
AVSampleRateKey: SAMPLE_RATE,
AVNumberOfChannelsKey: 1
] as [String : Any]

它对我有用，让我知道

关于swift AVAudioEngine 将多声道非交错信号转换为单声道，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58774639/

文章推荐： string - Powershell-从字符串变量中提取第一个和第三个元素

文章推荐： elasticsearch - Logstash:突变过滤器不起作用

文章推荐： arrays - 通过数组过滤器长度查询ElasticSearch

C 信号。信号()与信号集()？
所以我目前正在研究 C 中的 POSIX 线程和信号编程。我的讲师使用 sigset(int sigNumber, void* signalHandlerFUnction) 因为他的笔记不是世界上最好
c++ - while 和 for 循环中的 vector push_back 返回 SIGABRT 信号(信号 6)(C++)
我正在制作一个 C++ 游戏，它要求我将 36 个数字初始化为一个 vector 。你不能用初始化列表初始化一个 vector ，所以我创建了一个 while 循环来更快地初始化它。我想让它把每个数字
python-2.7 - 尝试通过 Popen() 使用 Python 发送 EOF 信号(Ctrl+D)信号
我正在尝试让 Python 发送 EOF信号 (Ctrl+D) 通过 Popen() .不幸的是，我找不到任何关于 Popen() 的引用资料。 *nix 类系统上的信号。这里有谁知道如何发送 EOF
python-2.7 - 尝试通过 Popen() 使用 Python 发送 EOF 信号(Ctrl+D)信号
我正在尝试让 Python 发送 EOF信号 (Ctrl+D) 通过 Popen() .不幸的是，我找不到任何关于 Popen() 的引用资料。 *nix 类系统上的信号。这里有谁知道如何发送 EOF
用于处理简单用户通知系统的 Django 信号
我正在学习编码并拥有一个实时的 Django 项目来保持我的动力。在我的 Django 应用程序中，用户留下评论，而其他人则回复所述评论。每次用户刷新他们的主页时，我都会计算他们是否收到了关于他们之
登录中的 Django 信号
登录功能中的django信号有什么用？用户已添加到请求 session 表中。那么 Django auth.login 函数中对信号的最后一行调用是什么？ @sensitive_post_param
用户创建时的 Django 信号
我已经将用户的创建与函数 create_user_profile 连接起来，当我创建我的用户时出现问题，我似乎连接的函数被调用了两次，而 UserProfile 试图被创建两次，女巫触发了一个错误列
插槽断开后的 Qt 信号
我有一个来自生产者对象处理的硬件的实时数据流。这会连接到一个消费者，该消费者在自己的线程中处理它以保持 gui 响应。 mainwindow::startProcessing(){ QObje
iphone - 如何正确处理异常情况(信号？)
在我的 iPhone 应用程序中，我想提供某种应用程序终止处理程序，该处理程序将在应用程序终止之前执行一些最终工作(删除一些敏感数据)。我想尽可能多地处理终止情况: 1) 用户终止应用 2) 设备电
Angular 信号 - 有什么优势？
我试图了解使用 Angular Signals 的优势。许多解释中都给出了计数示例，但我试图理解的是，与我下面通过变量 myCount 和 myCountDouble 所做的方式相比，以这种方式使用信
Django 信号 dispatch_uid
我对 dispatch_uid 的用法有疑问为信号。目前，我通过简单地添加 if not instance.order_reference 来防止信号的多次使用。 .我现在想知道是否dispatch
Django 信号。如何创建唯一的调度ID？
有时 django 中的信号会被触发两次。在文档中，它说创建(唯一)dispatch_uid 的一个好方法是模块的路径或名称[1] 或任何可哈希对象的 ID[2]。今天我尝试了这个: import
捕获 CTRL-\信号
我有一个用户定义的 shell 项目，我试图在其中实现 cat 命令，但允许用户单击 CTRL-/ 以显示下一个 x 行。我对信号很陌生，所以我认为我在某个地方有一些语法错误...... 主要...
使用定时器处理 C 信号
http://codepad.org/rHIKj7Cd (不是全部代码) 我想要完成的任务是， parent 在共享内存中写入一些内容，然后 child 做出相应的 react ，并每五秒写回一些内容
c++ - 信号/槽连接总数？
有没有一种方法可以找到 Qt 应用程序中信号/槽连接的总数有人向我推荐 Gamma 射线，但有没有更简单的解决方案？最佳答案检查 Qt::UniqueConnection . This is a
C++:信号/槽库中的线程安全
我正在实现一个信号/插槽框架，并且到了我希望它是线程安全的地步。我已经从 Boost 邮件列表中获得了很多支持，但由于这与 boost 无关，我将在这里提出我的未决问题。什么时候信号/槽实现(或任何
c++ - 信号 - 循环内的槽连接
在我的代码中，我在循环内创建相同类型的新对象并将信号连接到对象槽。这是我的试用版。 A * a; QList aList; int aCounter = 0; while(aCounter aLis
c++ - 如何在windows平台上使用c++信号
我知道 UNIX 上的 C 有 signal() 可以在某些操作后调用某些函数。我在 Windows 上需要它。我发现了，它存在什么 from here .但是我不明白如何正确使用它。我在 UNIX
c++ - 信号、槽和其他类
目前我正在将控制台 C++ 项目移植到 Qt。关于移植，我有一些问题。现在我的项目调整如下我有一个派生自 QWidget 的 Form 类，它使用派生自 QObject 的其他类。现在请告诉我我是否
c++ - 信号/槽基类多继承
在我的 Qt 多线程程序中，我想实现一个基于 QObject 的基类，以便从它派生的每个类都可以使用它的信号和槽(例如抛出错误)。我实现了 MyQObject : public QObject{..

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

swift AVAudioEngine 将多声道非交错信号转换为单声道