gpt4 book ai didi

audio - 将大量数据从 NIST 更改为 RIFF wav 文件

转载 作者:行者123 更新时间:2023-12-01 09:46:30 25 4
gpt4 key购买 nike

所以,我正在编写一个语音识别程序。为此,我从 TIMIT 下载了 400MB 的数据。当我打算阅读 wav 文件时(我尝试了两个库),如下所示:

import scipy.io.wavfile as wavfile
import wave

(fs, x) = wavfile.read('../data/TIMIT/TRAIN/DR1/FCJF0/SA1.WAV')
w = wave.open('../data/TIMIT/TRAIN/DR1/FCJF0/SA1.WAV')

在这两种情况下,他们都存在 wav 文件格式为“NIST”且必须为“RIFF”格式的问题。 (我也读过一些关于 sph 的内容,但我下载的 nist 文件是 .wav,而不是 .sph)。

然后我从 http://sox.sourceforge.net/ 下载了 SOX
我将路径正确添加到我的环境变量中,以便我的 cmd 识别 sox。但我真的找不到如何正确使用它。

我现在需要的是一个脚本或其他东西,可以将特定文件夹和子文件夹下的每个 wav 文件格式从 NIST 更改为 RIFF。

编辑:
reading a WAV file from TIMIT database in python我找到了一个对我有用的回应......
运行 sph2pipe -f wav input.wav output.wav我需要的是一个脚本或在文件夹下搜索的东西,所有包含 .wav 文件的子文件夹以应用该行代码。

最佳答案

forfiles是 Windows 命令,这里是 unix 的解决方案。
刚刚cd到上层文件夹并键入:
find . -name '*.WAV' | parallel -P20 sox {} '{.}.wav'
您需要安装 parallel 和 sox,但对于 Mac,您可以通过 brew install 获得两者。 .希望这可以帮助。

关于audio - 将大量数据从 NIST 更改为 RIFF wav 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47370167/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com