ios - 提高/增加文本转语音 (AVSpeechUtterance) 的音量以使其声音更大-6ren

ios - 提高/增加文本转语音 (AVSpeechUtterance) 的音量以使其声音更大

转载作者：行者123 更新时间：2023-11-29 05:36:23

我有一个导航应用程序，可以使用 AVSpeechUtterance 提供方向语音指令(例如“200 英尺内左转”)。我已经把音量调到1了，就像这样。 speechUtteranceInstance.volume = 1，但与来自 iPhone 的音乐或播客相比，音量仍然很低，尤其是当声音通过蓝牙或有线连接(例如通过蓝牙连接到汽车)时

有什么办法可以提高音量吗？(我知道以前有人问过这个问题，但到目前为止还没有找到适合我的解决方案。)

最佳答案

经过大量研究和尝试，我找到了一个很好的解决方案。

首先我认为这是一个 iOS 错误。当以下所有条件都成立时，我发现语音指令本身也会被闪避(或者至少听起来被闪避)，导致语音指令以与 DUCKED 音乐相同的音量播放(因此声音太小，听不清楚)。

在后台播放音乐
回避背景音乐.duckOtheraudioSessionCategory
通过 AVSpeechSynthesizer 播放语音
通过连接的蓝牙播放音频设备(例如蓝牙耳机或蓝牙汽车扬声器)

我找到的解决方案是将speechUtterance提供给AVAudioEngine。这只能在 iOS13 或更高版本上完成，因为这会添加 .write method to AVSpeechSynthesizer

简而言之，我使用 AVAudioEngine、AVAudioUnitEQ 和 AVAudioPlayerNode，将 AVAudioUnitEQ 的 globalGain 属性设置为大约10分贝。这也有一些怪癖，但可以解决(请参阅代码注释)。

完整代码如下:

import UIKit
import AVFoundation
import MediaPlayer

class ViewController: UIViewController {

    // MARK: AVAudio properties
    var engine = AVAudioEngine()
    var player = AVAudioPlayerNode()
    var eqEffect = AVAudioUnitEQ()
    var converter = AVAudioConverter(from: AVAudioFormat(commonFormat: AVAudioCommonFormat.pcmFormatInt16, sampleRate: 22050, channels: 1, interleaved: false)!, to: AVAudioFormat(commonFormat: AVAudioCommonFormat.pcmFormatFloat32, sampleRate: 22050, channels: 1, interleaved: false)!)
    let synthesizer = AVSpeechSynthesizer()
    var bufferCounter: Int = 0

    let audioSession = AVAudioSession.sharedInstance()




    override func viewDidLoad() {
        super.viewDidLoad()



        let outputFormat = AVAudioFormat(commonFormat: AVAudioCommonFormat.pcmFormatFloat32, sampleRate: 22050, channels: 1, interleaved: false)!
        setupAudio(format: outputFormat, globalGain: 0)



    }

    func activateAudioSession() {
        do {
            try audioSession.setCategory(.playback, mode: .voicePrompt, options: [.mixWithOthers, .duckOthers])
            try audioSession.setActive(true, options: .notifyOthersOnDeactivation)
        } catch {
            print("An error has occurred while setting the AVAudioSession.")
        }
    }

    @IBAction func tappedPlayButton(_ sender: Any) {

        eqEffect.globalGain = 0
        play()

    }

    @IBAction func tappedPlayLoudButton(_ sender: Any) {
        eqEffect.globalGain = 10
        play()

    }

    func play() {
        let path = Bundle.main.path(forResource: "voiceStart", ofType: "wav")!
        let file = try! AVAudioFile(forReading: URL(fileURLWithPath: path))
        self.player.scheduleFile(file, at: nil, completionHandler: nil)
        let utterance = AVSpeechUtterance(string: "This is to test if iOS is able to boost the voice output above the 100% limit.")
        synthesizer.write(utterance) { buffer in
            guard let pcmBuffer = buffer as? AVAudioPCMBuffer, pcmBuffer.frameLength > 0 else {
                print("could not create buffer or buffer empty")
                return
            }

            // QUIRCK Need to convert the buffer to different format because AVAudioEngine does not support the format returned from AVSpeechSynthesizer
            let convertedBuffer = AVAudioPCMBuffer(pcmFormat: AVAudioFormat(commonFormat: AVAudioCommonFormat.pcmFormatFloat32, sampleRate: pcmBuffer.format.sampleRate, channels: pcmBuffer.format.channelCount, interleaved: false)!, frameCapacity: pcmBuffer.frameCapacity)!
            do {
                try self.converter!.convert(to: convertedBuffer, from: pcmBuffer)
                self.bufferCounter += 1
                self.player.scheduleBuffer(convertedBuffer, completionCallbackType: .dataPlayedBack, completionHandler: { (type) -> Void in
                    DispatchQueue.main.async {
                        self.bufferCounter -= 1
                        print(self.bufferCounter)
                        if self.bufferCounter == 0 {
                            self.player.stop()
                            self.engine.stop()
                            try! self.audioSession.setActive(false, options: [])
                        }
                    }

                })

                self.converter!.reset()
                //self.player.prepare(withFrameCount: convertedBuffer.frameLength)
            }
            catch let error {
                print(error.localizedDescription)
            }
        }
        activateAudioSession()
        if !self.engine.isRunning {
            try! self.engine.start()
        }
        if !self.player.isPlaying {
            self.player.play()
        }
    }

    func setupAudio(format: AVAudioFormat, globalGain: Float) {
        // QUIRCK: Connecting the equalizer to the engine somehow starts the shared audioSession, and if that audiosession is not configured with .mixWithOthers and if it's not deactivated afterwards, this will stop any background music that was already playing. So first configure the audio session, then setup the engine and then deactivate the session again.
        try? self.audioSession.setCategory(.playback, options: .mixWithOthers)

        eqEffect.globalGain = globalGain
        engine.attach(player)
        engine.attach(eqEffect)
        engine.connect(player, to: eqEffect, format: format)
        engine.connect(eqEffect, to: engine.mainMixerNode, format: format)
        engine.prepare()

        try? self.audioSession.setActive(false)

    }

}

关于ios - 提高/增加文本转语音 (AVSpeechUtterance) 的音量以使其声音更大，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56999334/

文章推荐： php - foreach 数组错误

文章推荐： mysql - phpMyAdmin: "Choose Field to display"不显示

文章推荐： java - 设置mysql进程之间的优先级

文章推荐： java - 使用 Servlet 监听器和过滤器的 HTTP 服务的编程配置

ios - 更改iOS应用中使用按钮播放的“语音”
我有一个说一些短语的音板应用程序，但是现在我希望能够从男声/女声中改变出来，问题是我不知道该怎么做。任何帮助，将不胜感激。我正在使用AVFoundation/AVAudioPlayer播放声音。谢
audio - 语音/音乐分类
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 4 年前。
android - 如何在android中连续录制后台音频/语音？
因为我想在后台录制音频，所以我使用了服务..但是我无法在服务中录制音频。我在 Activity 中尝试了相同的代码，它对我有用。但是如何在输入语音/语音时在后台进行录音，这意味着如果有语音输入就应该
c# - 语音/语音转文本
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 6 年前。
audio - 用于从音频流中提取单词(语音)的库？
我有一个音频流，我会从中提取单词(语音)。因此，例如使用 audio.wav 我会得到 001.wav、002.wav、003.wav 等，其中每个 XXX.wav 是一个词。我正在寻找一个库或程序
macos - NSSpeechSynthesizer 语音/语言关系
不幸的是，我只能说四种语言，那么如果我知道文本的语言，我如何知道我必须使用哪种 OS X 语音？我在Apple的文档中找不到任何有关它的信息。至少有一张有语音/语言的 table 吗？最佳答案您可
cmd - 来自命令行的 ms 语音
有没有办法从命令行使用 MS Speech 实用程序？我可以在 Mac 上完成，但在 Windows XP 上找不到任何引用。最佳答案我在这个主题上的 2 美分，命令行单行: 在 Win 上使用
javascript - 语音 channel 不设防
所以我开始了我的不和谐机器人的音乐部分。现在，正如我在上一个问题中所做的那样，这里只是音乐命令的片段:Pastebin #1 在显示 if (msg.member.voiceConnection ==
java - 如何在java中听(语音)文本
有谁知道有什么好的 API 或库可以听(语音)文本。我尝试听三种语言的(语音)文本，我想知道最好从哪里开始以及如何开始。我可以对所有三种语言使用通用语音吗？我将使用 eclipse 和 java 作为
c# - 语音 session ——如何让更多人参与进来？
首先，我只是一个爱好者，如果这是一个愚蠢的问题或者我太天真了，我很抱歉。 (这也意味着我买不起昂贵的库) 情况是这样的:我正在使用 C#.NET 构建一个简单的语音聊天应用程序(类似于 Ventril
c - 语音 ip 的服务类型字段集
我正在制作一个模块，可以生成和传输语音 IP 数据包。我知道我必须为服务类型字段设置一些值。这个值是多少？最佳答案该值应该是x。关于c - 语音 ip 的服务类型字段集，我们在Stack Ove
c++ - 文字转语音 SAPI 语音
有人能帮帮我吗？我使用 SAPI 语音文本，但我不能设置女声，这是代码，它用男声说话，但我想改变它，我想要女声 #include "stdafx.h" using namespace std; voi
java - 基于命令(语音)识别的项目
我正在寻找一种方法来为一个项目在 Java 中识别预注册的语音命令，但我还没有想出一个好的方法，我研究了快速傅里叶和处理 wave 文件的不同方法，但我无法决定我应该如何实现它。这个想法很简单，
android - 西类牙语语音(语音)识别
我在 android 的语音识别 API 工作。我是 Speech Recognition Api 的新手，我的要求是西类牙语语音，并从 Android 的语音识别 API 中获得西类牙语的最佳匹配
Java - 将效果应用于 MaryTTS 语音
我在 Java 中使用一组名为(MaryTTS[实际上还有更多])的库来将 text to speech 转换为该目的，使用以下代码: public class TextToSpeech {
javascript - webRTC 音频/语音
我正在尝试使用webRTC和php作为服务器端来实现单向语音传输。查看samples ，我无法理解webRTC机制。在我看来，流程应该是这样的: 调用者和接收者在服务器上注册接收者监听来电调用
c++ - Windows 语音 C++
我的名字是 Joey，我想知道是否有一种在 C++ 中使用语音的方法，如果有人可以给我指出引用资料和书籍，非常感谢...... 最佳答案你应该看看 Windows Text-To-Speech AP
c++ - 从零开始构建 IP 语音
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
Java 语音 API 空响应
我正在使用 Java 语音识别 API - Jarvis，位于 https://github.com/lkuza2/java-speech-api 但是，当我运行应用程序时，出现错误:服务器返回 HT
c# - 如何将阿拉伯文本转换为 SAMPA 语音？
我们正在做一个需要讲阿拉伯语的项目，我们找到了一个开源工具，Mbrola project , 可以做到这一点。但是，我还需要一些方法将阿拉伯语文本转换为 SAMPA 语音。那么有人可以帮助我将阿拉伯

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

ios - 提高/增加文本转语音 (AVSpeechUtterance) 的音量以使其声音更大