gpt4 book ai didi

c# - 使用 Microsoft Cognitive 进行实时说话人识别

转载 作者:太空宇宙 更新时间:2023-11-03 12:38:39 25 4
gpt4 key购买 nike

我正在尝试构建一个应用程序,通过使用 Microsoft Cognitive Speaker Recognition API 来解决说话人分类问题。

查看 sample project并阅读 APIs documentation ,我知道应该通过向服务发送 wav 文件来完成识别,这违背了我实时进行的目标。

有人研究过吗?使用这些 API 是否可行,或者我应该寻找另一条路?

最佳答案

注册需要 30 秒的数据。一旦你有了用户配置文件,你就可以从 1 秒的样本中识别用户,这样你就可以几乎实时地以非常小的延迟进行识别。要使用它,您需要设置 shortAudio parameter .很难想象识别工作会比这更快。

如果您需要不同的东西,可以使用开源语音工具包,例如 Kaldi这可以做更灵活的事情。

关于c# - 使用 Microsoft Cognitive 进行实时说话人识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39920134/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com