gpt4 book ai didi

audio - 使用语音框架iOS从音频文件生成字幕

转载 作者:行者123 更新时间:2023-12-02 23:07:46 33 4
gpt4 key购买 nike

在我的应用程序中,我借助AvPlayer使用url播放音频。现在,我想在其中添加字幕的支持。 iOS 10引入了Speech framework,可帮助我们识别实时语音和录制的语音。根据苹果的说法:

“您可以执行实时和录制音频的语音转录。例如,您可以使用以下代码获取语音识别器并开始简单的语音识别:

let recognizer = SFSpeechRecognizer()
let request = SFSpeechURLRecognitionRequest(url: audioFileURL)
recognizer?.recognitionTask(with: request, resultHandler: { (result, error) in
print (result?.bestTranscription.formattedString)
})

现在,我正在寻找如何使用此语音框架以当前正在播放的音频的字符串形式获取字幕的方法。以及我将如何知道当前正在播放哪个对话,以便可以在屏幕上显示完全相同的字符串。

最佳答案

在SFSpeechRecognition的segments部分中,您可以有选择地标识所需的字幕。为此,您需要通过突出显示特定文本的过滤器来分析句段。

关于audio - 使用语音框架iOS从音频文件生成字幕,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38565380/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com