gpt4 book ai didi

tensorflow - 如何训练 lstm 进行语音识别

转载 作者:行者123 更新时间:2023-12-03 11:19:44 25 4
gpt4 key购买 nike

我正在尝试训练 lstm 模型进行语音识别,但不知道要使用哪些训练数据和目标数据。我正在使用 LibriSpeech dataset它包含音频文件和他们的成绩单。此时,我知道目标数据将是矢量化的转录文本。至于训练数据,我正在考虑使用每个音频文件(或 MFCC 功能)中的频率和时间。如果这是解决问题的正确方法,训练数据/音频将是多个数组,我将如何将这些数组输入到我的 lstm 模型中?我是否必须对它们进行矢量化?

谢谢!

最佳答案

要准备语音数据集以输入 LSTM 模型,您可以查看这篇文章 - Building Speech Dataset for LSTM binary classification以及分割Data Preparation .

作为一个很好的例子,你可以看到这篇文章 - http://danielhnyk.cz/predicting-sequences-vectors-keras-using-rnn-lstm/ .这篇文章讲的是如何使用 RNN 预测 Keras 中的向量序列 - LSTM .

我相信你会发现这篇文章 (https://stats.stackexchange.com/questions/192014/how-to-implement-a-lstm-based-classifier-to-classify-speech-files-using-keras) 也很有帮助。

关于tensorflow - 如何训练 lstm 进行语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40812339/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com