iOS 10 : SFSpeechRecognizer and Twilio TVILocalAudioTrack-6ren

iOS 10 : SFSpeechRecognizer and Twilio TVILocalAudioTrack

转载作者：行者123 更新时间：2023-11-28 06:20:43

32

4

我正在使用 Swift 开发一个尝试转录对话的 iOS 应用程序。我成功地能够使用 AVAudioEngine() 和 SFSpeechRecognizer() 转录对话。

    // MARK: Speech Helper Methods
func recordAndRecognizeSpeech() {
    guard let node = audioEngine.inputNode else { return }
    let recordingFormat = node.outputFormat(forBus: 0)
    node.installTap(onBus: 0, bufferSize: 1024, format: recordingFormat) { buffer, _ in
        self.request.append(buffer)
    }

    audioEngine.prepare()
    do {
        try audioEngine.start()
    } catch {
        return print(error)
    }

    guard let myRecognizer = SFSpeechRecognizer() else {
        return
    }
    if !myRecognizer.isAvailable {
        return
    }

    recognitionTask = speechRecognizer?.recognitionTask(with: request, resultHandler: { result, error in
        if let result = result {
            let bestString = result.bestTranscription.formattedString
        } else if let error = error {
            print(error)
        }
    })
}

现在我想尝试将它带到视频聊天中。所以我按照 Twilio quickstart 找到了 here on github并根据需要设置所有内容(我使用的是 CallKit 版本，这并不重要)。但是，我在 Twilio 视频通话期间可用的音轨不是 AVAudioEngine 音轨，而是 TVILocalAudioTrack。这是 Twilio SDK 的特定类型。

TVILocalAudioTrack is here, 的文档但我不知道如何将其插入 SFSpeechRecognizer。

可能的替代方案

当有人在 Twilio 房间时启动 AVAudioEngine()(根据 Twilio 的 SDK，我认为我做不到)——如果有人对此有建议，那就太好了。

也许 Swift 对这个项目来说不够好？我知道!

最佳答案

目前 Twilio v1.0 beta 14 无法做到这一点。它需要访问音频缓冲区，而这无法通过 Twilio 的 API 访问。

参见 this Github issue了解更多详情。

关于iOS 10 : SFSpeechRecognizer and Twilio TVILocalAudioTrack，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43595482/

32

4

0

文章推荐： ios - 如何在 UIImageView 中获取图像的右上角和左下角坐标

文章推荐： javascript - 光滑的 slider 不工作

ios - SFSpeechRecognizer 多种语言
我正在构建一个支持语音识别并将语音转换为文本的搜索，所以我使用 SFSpeechRecognizer .但问题是我需要同时支持多种语言，例如(“en_US”、“fr”、vi、ar)。主要思想是用户可
ios - SFSpeechRecognizer 同时请求？
我正在尝试使用 SFSpeechRecognizer 在我的应用程序中转录语音命令。命令只有一个词。 SFSpeechAudioBufferRecognitionRequest(来自麦克风点击)可能需
ios - SFSpeechRecognizer 是否需要互联网连接？
SFSpeechRecognizer 是否像 Siri 一样工作，是在 Apple 服务器上完成处理还是在 iPhone 本地完成？最佳答案语音识别 API 的描述在此 link指出 " In t
ios - SFSpeechRecognizer 没有正确处理上下文字符串
SFSpeechRecognizer 对于我的用例来说非常不准确。我尝试设置 contextual 字符串，因为我有一组要与之匹配的单词。但它仍然无法这样做。我需要任何其他配置吗？我正在使用 App
ios - SFSpeechRecognizer 识别几个命令词而不是整个短语？
我有一个 SFSpeechRecognizer 从 Apple 的示例应用程序设置 https://developer.apple.com/library/content/samplecode/Spe
ios - SFSpeechRecognizer - 检测话语结束
我正在使用 iOS 10 内置语音识别来破解一个小项目。我使用设备的麦克风得到了工作结果，我的语音被非常准确地识别。我的问题是为每个可用的部分转录调用识别任务回调，我希望它检测停止说话的人并调用回调
swift - SFSpeechRecognizer 不可用
我已经在以下位置下载了示例代码 SpeakToMe: https://developer.apple.com/library/prerelease/content/samplecode/SpeakTo
ios - 使用 SFSpeechRecognizer 的正确方法？
我正在尝试使用 SFSpeechRecognizer 但我没有办法测试我是否正确地实现了它，而且由于它是一个相对较新的类，我找不到示例代码(我不知道快)。我是否犯了任何不可原谅的错误/遗漏了什么？ [
ios - SFSpeechRecognizer init 不接受语言环境
我正在尝试初始化 SFSpeechRecognizer 的实例，但出现以下错误 Cannot convert value of type 'Locale' to expected argument t
ios - 从 SFSpeechRecognizer 停止语音输入后处理文本
我正在使用 iOS SFSpeechRecognizer API 开发语音转文本应用程序。找到一个很棒的tutorial here:并且效果很好。我想在语音输入停止后立即处理文本并执行一些操作。所
swift - 使用 SFSpeechRecognizer 的单个口语字母？
我正在编写一个拼字比赛应用程序。我一直在使用 SFSpeechRecognizer，但它不能很好地处理单个字母，因为我猜它正在寻找口头短语。我已经在谷歌上搜索 SFSpeechRecognizer
ios - Swift SFSpeechRecognizer 不工作两次
这是我第一次在 Swift 中使用 SFSpeechRecognizer，有一个功能无法正常工作。当我按下按钮 audioButtonPressed 时，它似乎开始识别正常，再次按下它会停止。当我尝试
ios - 从 SFSpeechRecognizer 获取语音振幅
我正在使用这个库 https://github.com/appcoda/SpeechToTextDemo将语音转录为文本我想用这个库显示真实的语音幅度来显示语音图表 https://github.c
Swift SFSpeechRecognizer 附加现有的 UITextView 内容
我在我的应用程序中使用 SFSpeechRecognizer，由于有一个专用按钮(开始语音识别)，它可以很好地简化最终用户在 UITextView 中输入评论的过程。但是如果用户首先手动输入一些文本
iOS 10 : SFSpeechRecognizer and Twilio TVILocalAudioTrack
我正在使用 Swift 开发一个尝试转录对话的 iOS 应用程序。我成功地能够使用 AVAudioEngine() 和 SFSpeechRecognizer() 转录对话。 // MARK:
iOS:AVSpeechSynthesizer 在使用 SFSpeechRecognizer 录制后不起作用
我正在制作一个文本转语音和语音转文本的应用程序。我现在遇到的问题是文本转语音使用 AVSpeechSynthesizer 可以正常工作。但是在我使用 SFSpeechRecognizer 录制并进行
swift - 如何使 SFSpeechRecognizer 在 macOS 上可用？
我正在尝试使用 Apple 的语音框架在 macOS 10.15.1 上进行语音识别。在 macOS 10.15 之前，语音识别仅在 iOS 上可用，但根据 the documentation和 th
ios - SFSpeechRecognizer kAFAssistantErrorDomain Code=203 "Retry"
我使用 SFSpeechRecognizer，基本上可以工作。 1.但有时会出现如下错误。主要是在我没有执行 avStop() 之前。 [Utility] +[AFAggregator logDic
ios - 使用 SFSpeechRecognizer 后 AVSpeechSynthesizer 不说话
所以我构建了一个简单的应用程序，它使用 SFSpeechRecognizer 进行语音识别，并在屏幕上的 UITextView 中将转换后的语音显示为文本。现在我想让手机说出显示的文字。由于某种原
ios - 连续语音识别。使用 SFSpeechRecognizer (ios10-beta)
我正在尝试执行续。在 iOS 10 测试版上使用 AVCapture 进行语音识别。我设置了 captureOutput(...) 以持续获取 CMSampleBuffers。我将这些缓冲区直接放入我

首页

博学

6Ren·AI

商城

iOS 10 : SFSpeechRecognizer and Twilio TVILocalAudioTrack