gpt4 book ai didi

api - 使用Tensorflow Dataset API的音频背景噪声

转载 作者:行者123 更新时间:2023-12-03 01:41:05 25 4
gpt4 key购买 nike

我正在建立语音识别系统的输入管道。
我用数据集API成功读取了WAV中的一些短语(给我留下深刻的印象,它是如此简单和快捷),并且有些音频文件带有背景噪音,我想与我的短语混合使用以增强它们并使系统更强大发出噪音。

我想使用单独的tf.data.Dataset.shuffle()随机选择背景噪声样本,然后将其与另一个tf.data.Dataset样本中的样本混合。

如何连接两个不同长度的数据集(背景噪声数据集可能是无限的)? tf.data.Dataset.zip在这里合适并且可以工作吗?

UPD: tf.data.Dataset.zip成功运行,但如果噪声样本的数据集很小,则应将其乘以使其大小等于语音样本数据集的大小。如果不执行此操作,则结果数据集将具有压缩在一起的数据集中最短的数据集长度。

最佳答案

tf.data.Dataset.zip成功运行,但是如果噪声样本的数据集很小,则应将其乘以使其大小等于语音样本数据集的大小。如果不执行此操作,则结果数据集将具有压缩在一起的数据集中最短的数据集长度。

关于api - 使用Tensorflow Dataset API的音频背景噪声,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47371690/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com