python - 为什么每个帧的长度不相等？-6ren

python - 为什么每个帧的长度不相等？

转载作者：太空宇宙更新时间：2023-11-03 15:59:52

24

4

我目前正在采样和构建一些音频文件，以便我可以将其作为神经网络的输入。我正在使用Librosa对音频进行采样并对其进行框架，尤其是框架非常重要，因为这是作为神经网络需求的输入提供的，这意味着长度必须一致，这似乎是我当前的问题。帧。

我目前正在这样采样和取景:

def load_sound_files(file_paths , data_input):
    raw_sounds = []
    data_output = []
    for fp in file_paths:
        y,sr = librosa.load(fp)
        X = librosa.util.frame(y)
        raw_sounds.append(X)
return raw_sounds

每个音频文件都附加到一个列表中，并且对于列表中的每个条目，每个帧都有一个数组。所以raw_sounds中的信息是这样存储的:

[array([[frame],[frame],...,[frame]],dtype=float32), ...]

我似乎对不同大小的帧有问题，每个音频文件都有不同的长度，但由于我使用相同的设置对其进行帧化，因此每个帧应该相同，但根据这些打印调试，情况并非如此。

print len(raw_sounds)
print len(raw_sounds[0])
print len(raw_sounds[0][0])
print len(raw_sounds[0][1])
print '\n'
print len(raw_sounds[1])
print len(raw_sounds[1][0])
print len(raw_sounds[1][1])

输出:

是我设置错误吗？或者我在这里做错了什么？

原始样本:

[array([[ -1.58969939e-04,   2.85098387e-04,   2.57675620e-05,
          5.58408792e-04,   2.09050399e-04,   3.10504751e-04,
          7.08066545e-06,   6.51864902e-05,   4.64069366e-04,
         -1.03915379e-04,  -2.09252365e-04,   9.58807232e-06,
         -3.70743481e-04,  -2.73781188e-04,   1.47478888e-03,
         -1.24523379e-02,  -1.38171474e-02,   1.42919633e-03,
          2.60417676e-03,  -9.49124712e-03,   1.84055939e-02,
          5.30609104e-04,  -2.02661729e-03,  -1.09214883e-03,
         -2.67810683e-04,  -9.33001807e-04,   1.57146193e-02,
          3.06987576e-02,  -2.89204344e-02,   8.31141882e-03,
         -5.22559392e-04,   9.57424170e-04,  -1.39959985e-02,
         -2.45519826e-04,   7.94889964e-03,  -2.45057382e-02,
          2.76992898e-02,   2.75033060e-03,   1.91110268e-03,
          2.65958859e-03,   4.22360376e-04,   2.87338579e-03,
          3.60440137e-03,  -6.81304885e-03,   1.19333845e-02,
          5.27647883e-03,  -8.81725773e-02,  -1.10511519e-02,
          1.67427063e-02,   4.18979749e-02,  -1.76561251e-02,
          1.40228057e-02,  -6.56250417e-02,   8.04386102e-04,
          6.77016005e-03,   8.95334259e-02,  -3.07568144e-02,
         -5.68932574e-03,   2.80798669e-03,  -1.94037147e-03,
         -6.80876488e-04,  -7.51503045e-04,   1.61860569e-03,
         -8.96663638e-04,   1.05839630e-03,   4.16457013e-04,
         -1.14849303e-03,   2.51941121e-04,   1.09347668e-04,
         -9.77083837e-05,  -9.70639754e-04,   1.23860082e-03,
         -5.82281128e-03,  -7.96582922e-03,   1.05014764e-01,
          8.55111331e-03,   1.02730282e-02,  -1.64158875e-03,
         -9.96976532e-03,  -1.54927105e-03,  -1.33159547e-03,
          2.07886100e-03,  -9.63974337e-04,   1.92957837e-03,
         -9.57471970e-03,   8.37739408e-02,  -2.46925298e-02,
          1.15760174e-02,   1.53850103e-02,   1.39159057e-02,
          7.28045590e-04,   1.28218243e-02,   2.47708824e-03,
          3.64710722e-05,   2.31177593e-03,  -3.88215925e-03,
          2.85943900e-03,   3.40921571e-03,   8.19356064e-04,
          1.31994265e-03,  -4.02768754e-04,  -3.73146904e-04,
         -2.45199517e-05,  -1.40402978e-03,  -4.53661755e-03,
         -8.06837995e-03,  -3.07087135e-03,   5.65649476e-04,
          8.99529332e-05,   9.43572959e-04,   1.52094246e-04,
         -9.59860045e-04,   2.72397720e-03,   1.27405506e-02,
         -9.37244575e-03,  -1.79420076e-02,   1.07235732e-02,
          2.84450967e-03,   4.49513178e-03,   2.41923026e-05,
         -3.13379533e-05],

最佳答案

来自librosa's documentation这是 util.frame() 返回的内容:

Returns:    
    y_frames : np.ndarray [shape=(frame_length, N_FRAMES)]
    An array of frames sampled from y: y_frames[i, j] == y[j * hop_length + i]

所以你得到的是一个二维数组。因此 raw_sounds[0] 是您加载的第一个声音文件，并且可以在二维中对其进行寻址。您应该使用 shape 来获取其大小:

print raw_sounds[0].shape

要获取一帧，请使用此表示法 result[0][:, nf]，其中 nf 是帧的编号。

当您请求 raw_sounds[0][0] 时获得的数字是帧数，它将取决于声音样本大小。所以它似乎工作正常。

关于python - 为什么每个帧的长度不相等？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40441199/

24

4

0

文章推荐： Python for 循环在迭代 CSV 行时不合理地中途停止

文章推荐： c# - 参数化 LINQ GroupBy

文章推荐： C# 应用程序找不到 .dll 引用文件，而两者都在同一文件夹中

文章推荐： php - Paypal 与 Laravel 5.1 的集成

java - 为什么自动装箱的整数和 .getClass() 值 == 相等，而不仅仅是 .equals() 相等？
也许我在 Java 上工作的时间太长而没有真正理解它的一些基础知识。我确实理解 == 用于对象引用相等，而 .equals() 用于对象值相等。比较整数: Integer x = 1, y = 1
javascript - boolean 相等
我是从一道考试题中得出这个答案的，但无法理解该解决方案的工作原理。如果值“x”和“y”相等，则此函数应该返回“true”，否则返回 False。解决方法: function equal_boolea
Mysql utf8mb4 相等
我将带有表情符号的文本存储在 mysql 数据库中。数据库、表和列设置为使用utf8mb4和utf8mb4_unicode_ci。我可以毫无问题地输入单元格值(数据类型是 VARCHAR)。但是
PHP DateTime 相等
如果两个 DateTime 对象具有相同的日、月和年，我该如何比较？问题是他们有不同的小时/分钟/秒。最佳答案对于 DateTime 对象，没有好的方法可以做到这一点。所以你必须做，比方说，不是那
c# - GetHashCode 相等
我一直想知道这个问题，所以我想我会问的。您将看到的大多数地方都使用相同的语义逻辑来覆盖 Equals 和 GetHashCode 以实现成员平等...但是它们通常使用不同的实现: publi
comparison - CoreGraphics 中的浮点比较(相等)
苹果 CoreGraphics.framework , CGGeometry.h : CG_INLINE bool __CGSizeEqualToSize(CGSize size1, CGSize s
python - 由于最新的python版本保留了dict的插入顺序，相等(==)的含义会改变吗？
在最新的python 版本中， dict 保留了插入的顺序。在平等方面是否有任何变化。例如，目前以下工作。既然广告顺序很重要， future 会不会发生这种变化？我问是因为有根本性的变化 - 以前
django 过滤器两个 ManyToManyField 相等
class VideoUserModel(models.Model): user = models.ManyToManyField(get_user_model()) viewlist
coq - 枚举类型的 COQ 相等
我在 COQ 中有一个有限枚举类型(比如 T)，我想检查元素是否相等。这意味着，我需要一个函数 bool beq_T(x:T,y:T) 我设法定义这样一个函数的唯一方法是逐个分析。这会导致很多匹配语
fortran - 测试 float 相等
我在 Windows 7(32 位)下的 MinGW 中使用 gfortran 来编译 Fortran 代码。这是文件 testequal.f 中包含的最少代码: program test
java - jsp。枚举比较/相等
我有以下 jsp 片段: ${campaign.moderated}
python - 如何测试两个稀疏数组是否(几乎)相等？
我想检查两个稀疏数组是否(几乎)相等。而对于 numpy 数组，你可以这样做: import numpy as np a = np.ones(200) np.testing.assert_array_
c# - 自定义对象的值是否与 List<> 相等
我有以下类(class): public class MyDocuments { public DateTime registeredDate; public
c - for循环中两个 float 相等
这个问题已经有答案了: Is floating point math broken? (33 个回答) 已关闭 5 年前。我在这里想做的是，我采用一个精度值(小于 1)并打印 1/n 类型的所有数字
C 检查字符串的最后一个字符是否与 X 相等
我正在为我的arduino写一个草图，我想检查我的字符串的最后一个字符。例如: 如果输入是 cats- 我想看看最后一个字符(在我的例子中是“-”)实际上是否 - 我使用的代码: 串行事件函数 vo
c# - RuntimeMethodInfo 相等 : bug?
让我们开始: using System; public class Program { class A { public virtual void Do() { }
java - 仅根据某些键将两个 HashMap 相等
我只需要根据几个键(不是全部)来确定两个 HashMap 的相等性除了单独访问每个字段并比较相等性之外，还有其他节省时间的方法吗？最佳答案我能想到的一种方法是在您的 HashMap 上存储某种“
java - 测试是否与 double 相等
在Java中，大写的Double可以为null。但是如果我有 double a 和 b 并且我这样做: if (a.equals(b)) 如果其中之一为空，它会崩溃。有没有更好的方法来比较它们？最
mysql - 使用选择选项从另一个数据库插入并且两个数据库表 ID 相等
我正在尝试从我的旧数据库中插入表格数据。 Id 在数据库表和选择特定列中都相等。这是我的数据库。旧数据库:sch -> 旧表:product (id, tag, url) (13, red, aaa
css - 在容器内拆分两个 div 相等
我正在开发一个应用程序，它在我的主视图中有一个侧边栏和两个 div。我试图在容器内平均分割两者的高度。我试过 height = 50% 但效果不太好。

首页

博学

6Ren·AI

商城

python - 为什么每个帧的长度不相等？