gpt4 book ai didi

Python:如何快速加载大型音频数据集

转载 作者:太空宇宙 更新时间:2023-11-03 20:41:39 24 4
gpt4 key购买 nike

我是处理大量数据的新手。我有一个相当大的数据集(大约 100 万个音频文件,每几秒长),并且我正在尝试以有效的方式加载数据以实现可视化目的(并最终用作神经网络中的训练数据)。

到目前为止,我尝试的是使用 librosa(使用 librosa.load(filename)),但这花了几个小时才加载 10,000 个文件。我试图找出是否可以使用 GPU 来加速(用 Numba 摸索),但我不清楚这是否是 GPU 需要解决的有效问题。

我觉得我错过了一些非常明显的东西。有经验的人可以告诉我该怎么做吗?我很难在互联网上找到解决方案。感谢您的帮助!

最佳答案

你可以使用 pygame.在我制作的这个小程序中,我测试了加载一个大约10秒长的声音文件需要多长时间:

import pygame
import time

pygame.init()
time_now = time.time()
sound = pygame.mixer.music.load('music.wav')
print(time.time() - time_now)

结果是:

0.0

如果您想播放该文件,您可以:

pygame.mixer.music.play(loops=int, start=float)

加载全部内容大约需要 1-4 小时。欲了解更多信息,请访问https://www.pygame.org/docs/ref/music.html .

关于Python:如何快速加载大型音频数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56829222/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com