gpt4 book ai didi

Python 说话人识别

转载 作者:IT老高 更新时间:2023-10-28 20:54:42 26 4
gpt4 key购买 nike

我有一个音频文件,一个 2 人的电话录音,我需要自动分离 2 个扬声器的声音。我是语音识别的新手,我查看了 python 的 wave 模块,但没有找到任何有用的信息。

请帮助如何开始。另外请建议我免费的python库,这将帮助我解决问题。

最佳答案

说话人的分离任务不是语音识别任务,而是说话人识别任务。在语音社区中,此任务也称为说话者分类。有几个可用于 Python 的说话人分类和说话人识别包:

SIDEKIT from LIUM

Bob toolkit from Idiap

Speaker diarization from ISCI

如果您不限于 Python,还有其他:

LIUM speaker diarization

Speaker recognition setup in Kaldi .包括最先进的基于 DNN 的 i 向量,称为 x 向量。

关于Python 说话人识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7309219/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com