gpt4 book ai didi

macos - 是否有 API(或任何 hack)可以访问 Mac OS X Mavericks 中的增强听写功能?

转载 作者:行者123 更新时间:2023-12-01 18:33:17 24 4
gpt4 key购买 nike

我正在尝试找到一种简单的方法将音频文件转录为文本(CMU Sphinx、Julius 等对于不了解语音识别、配置语言模型、声学模型等的人来说很难)。

我想知道是否有办法将我的音频文件传输到 Mac OS 10.9 Mavericks 的“增强听写”功能中,该功能允许本地离线语音听写。

当我将一根跳线从耳机插孔插入我的线路时,我以为我很聪明,但不幸的是,当你开始听写时,它会将所有其他音频播放静音(任何有关如何禁用此静音的建议都将得到正确的解决方案)我的回答)。

最佳答案

我还没有找到直接的方法来做到这一点。但是,您可以使用 Soundflower 作为解决方法。

例如,您可以在 VLC 中选择音频 -> 音频设备 -> Soundflower (2ch) 作为输出。然后在系统偏好设置->听写和语音->听写->Soundflower (2ch) [在麦克风图标下下拉]。然后您可以在 VLC 中开始播放,并开始听写(例如在 TextEdit 中),您应该会看到转录出现。这种方法的缺点是速度慢(仅限于音频的实时播放),并且不太有利于自动化工作流程。

注意:在切换到 TextEdit 并启动 ED 之前,您必须开始音频播放。

关于macos - 是否有 API(或任何 hack)可以访问 Mac OS X Mavericks 中的增强听写功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19579566/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com