gpt4 book ai didi

audio - 音频/声音增强的神经网络

转载 作者:行者123 更新时间:2023-12-03 01:44:07 27 4
gpt4 key购买 nike

一个人会使用哪种类型的神经网络架构将声音映射到其他声音?神经网络擅长学习从序列到其他序列,因此声音增强/生成似乎是它们的一种非常流行的应用(但不幸的是,事实并非如此-我只能找到一个(相当古老的)洋红色项目来处理以及其他2篇博客文章)。

假设我有足够大的相同长度的输入声音/输出声音数据集,我将如何格式化数据?也许在频谱图上训练CNN(诸如cycleGAN或pix2pix之类的东西),也许使用WAV文件中的实际数据并使用LSTM?没有其他人听说过这对声音有好处的怪异建筑吗?请帮帮我!

最佳答案

对于其他做类似事情的人-答案是使用快速傅立叶变换将数据置于可管理的状态,然后人们通常使用RNN或LSTM来处理数据-而不是CNN。

关于audio - 音频/声音增强的神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45070884/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com