gpt4 book ai didi

iphone - 将音频剪辑从 iPhone 流式传输到服务器

转载 作者:行者123 更新时间:2023-12-03 19:20:56 25 4
gpt4 key购买 nike

我想知道是否有任何原子示例可以将音频从 iPhone 流式传输到服务器。我对电话或 SIP 风格的解决方案不感兴趣,只是一个简单的套接字流,用于在录制时以 .wav 格式发送音频剪辑。尽管似乎有很多相反的例子,但我在谷歌或其他明显途径上的运气并不好。

最佳答案

我不知道如何注册我最初发布的未注册帐户。

无论如何,我目前对音频格式并不真正感兴趣,只是对流媒体方面感兴趣。我想获取麦克风输入,并将其从 iPhone 传输到服务器。我目前不关心传输速率,因为最初只是通过 wifi 连接进行测试,而不是 3g 设置。我无法缓存它的原因是因为我有兴趣为我的本科论文尝试一些开源语音识别内容。可以缓存然后发送录音,但将语音数据发送到服务器需要相当长的时间。如果我可以在开始录制时立即开始发送数据,那么响应时间会大大缩短,因为当我松开录制按钮时,大部分数据已经到达服务器。此外,如果我能让这个流媒体功能在 iPhone 上工作,那么在服务器端,我也可以在第一个音频通过时立即启动语音识别器。同样,从用户的角度来看,这应该大大增加了交易所需的最终时间。

colin barrett 提到了电话和电话网络,但这些实际上对于 ASR 来说是一个相当次优的解决方案,主要是因为它们没有提供从错误中恢复的好方法 - 通过 voip 对话这样做是一种可怕的体验。然而,iPhone,特别是触摸屏提供了一个很好的方法来做到这一点,通过使用 ime 或 nbest 列表来识别其他候选者。

如果我能弄清楚流式传输音频的基本架构,那么我就可以开始考虑进行 flac 编码或其他方法来降低所需的传输速率。甚至可能是特征提取,尽管这限制了以后使用录音重新训练系统的能力。

关于iphone - 将音频剪辑从 iPhone 流式传输到服务器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1727205/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com