python - 需要 fit_generator() 的具体示例-6ren

python - 需要 fit_generator() 的具体示例

转载作者：行者123 更新时间：2023-11-30 10:00:01

26

4

我正在制作一个输入形状为 (56088,22050,1) 的语音识别模型，它作为一个整体可以从 .npy 文件(大小约为 5GB)加载到内存中，但我想弄清楚一个更好的方法。我遇到了 keras fit_generator() 方法，但大多数示例都是基于 mnist 并使用 ImageDataGenerator() 函数。我意识到我必须制作一个自定义生成器函数，但我不太确定如何制作。根据this线程中，我引用了他的生成器函数来制作类似的东西，但我仍然需要将整个数据加载到内存中，这需要很多时间。另外，我不确定这个程序是否会运行，因为在我运行它的前 20 分钟内它根本没有输出任何内容
还有其他出路吗？

import librosa
import glob
import tensorflow as tf
import os
import numpy as np


class_list, X_train, Y_train = [],[],[]
filename = "D:\\SpeechRecognitionData\\train\\audio\\"

class_names = os.listdir(filename)
print(class_names)

for classes in class_names:
    if classes == '_background_noise_':
        continue
    else:
        class_list.append(''.join(filename+classes))

print(class_list,"\n",len(class_list))


def create_X(address):
    wave,sr = librosa.load(address)
    wave.reshape(-1,1)
    yield wave


def getLabel(filename):
    base_name = os.path.basename(filename)
    return base_name

def onehot(Y_train):
    from sklearn import preprocessing
    enc = preprocessing.OneHotEncoder()
    Y_train = Y_train.reshape(-1,1)
    enc.fit(Y_train)
    Y_train = enc.transform(Y_train).toarray()
    return Y_train


def execute(X_train, Y_train):
    loop = 0
    for i in class_list:
        c=0
        loop+=1
        for file in glob.glob("".join(i+"\\*.wav")): # iterating through each .wav audio file in the directory to create training data
            if np.array(list(create_X(file))).shape[0] == 22050:
                c+=1
                Y_train.append(class_names.index(getLabel(i)))
                X_train.append(create_X(file))
                if c%100==0:
                    print("{} files processed in loop {}".format(c,loop))

    while 1:
        for i in range(1558): # 36*1558 = 56088
            if i%125==0:
                print("i= "+str(i))
            yield np.array(X_train[i*36:(i+1)*36]).reshape(X_train.shape[0],X_train.shape[1],1), onehot(np.array(Y_train[i*36:(i+1)*36]))


input_shape = (22050,1)

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv1D(16,activation='relu',input_shape=input_shape,kernel_size=(10)))
model.add(tf.keras.layers.MaxPool1D())
model.add(tf.keras.layers.Dropout(0.2))
model.add(tf.keras.layers.Conv1D(32,activation='relu',kernel_size=(10)))
model.add(tf.keras.layers.MaxPool1D())
model.add(tf.keras.layers.Dropout(0.2))
model.add(tf.keras.layers.Conv1D(16,activation='relu',kernel_size=(10)))
model.add(tf.keras.layers.MaxPool1D())
model.add(tf.keras.layers.Dropout(0.2))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(128,activation='relu'))
model.add(tf.keras.layers.Dense(64,activation='relu'))
model.add(tf.keras.layers.Dense(30,activation='softmax'))

model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'])
generator = execute(X_train,Y_train)
model.fit_generator(generator,steps_per_epoch=56088//36,shuffle=True)
model.save("model.h5")

最佳答案

所以我通过查看这里的示例找到了答案 - https://github.com/tjh48/keras_generators/blob/master/keras_generator_example.ipynb

如果有人遇到这个，他们可以引用我的笔记本 https://github.com/DarshanDeshpande/Speech-Recognition/blob/master/SpeechRecognitionWithGenerators.ipynb

谢谢!

关于python - 需要 fit_generator() 的具体示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59407563/

26

4

0

文章推荐： javascript - 如何将两个数据发送到ajax

文章推荐： java - BinarySearch 中的变量声明

文章推荐： java - 在没有插件的情况下从浏览器运行 Java 程序

文章推荐： Pandas:iloc 和 reset_index 在随机函数中定义时不会被执行

大语言模型提示技巧（一）－指令要清晰、具体
在与大语言模型对话时，应该提供尽可能清晰和具体的指令来表达希望模型执行的操作，这将有助于模型给出接近你所期待的输出，并降低得到无关或不正确回复的可能性。但需要注意的是，编写清晰的指令不意味着编写简短的
javascript - 检查日期是否已过(具体)
我是 Robert，我在使用 JavaScript 时遇到了一些问题。我得到了一个 (这是隐藏的)。我唯一想问你的是:我想检查日期是否在中已通过。如果通过了我想改变CSS中容器的背景颜色。不幸的
Java 跳过打印语句扫描器，具体
所以我的问题是我想要求输入使用扫描仪的信息，但它根本不打印出来。当它显示跳过的扫描仪的值时，Scanner CheeseType = new Scanner(System.in);，我得到 null。
mysql - 如何获得总和(具体)
Fe_Order_Items fe_order_items_id fe_order_specification_id fe_users_id fe_menu_items_id fe_order_ite
django - 什么是分布式消息系统？具体 'distributed'里面是什么？
人们普遍提到 - “Celery 是一个基于分布式消息传递的异步任务队列/作业队列”。虽然我知道如何使用 Celery 工作人员等。但内心深处我不明白分布式消息传递的真正重要性和意义以及任务队列在其中
c - 具体 C 字符未知
我试图理解下面的代码，但有一些我以前从未见过的东西，那就是:“\&\&” 这是代码: int main() { fork() \&\& (fork() || fork()); exit(EXIT_SU
python - Tkinter 屏幕删除，具体
您好，我是论坛新手。我有很多使用 python 的经验，但没有使用 tkinter 的经验。这是我的代码: from tkinter import * def Done(): celEn
c# - 具体 C# 类中是否需要可序列化属性？
在 C# 中，假设我们有一个通用类和一个具体类 [Serializable] public class GenericUser { ... [Serializable] public class Co
java - 实例化通用抽象类的子(具体)类，其构造函数需要其他参数类
我尝试使用的库有一个通用抽象类，其中有两个实现该基础的子类。我想编写一个类，它将根据构造函数参数的参数类型自动创建其中一个子级的实例。基类没有默认构造函数基类的构造函数也需要其他通用类的实例代码
javascript - 具体 $scope.apply();场景 :
我是 Angular 的新手，我一直在尝试了解它的工作原理。我正在制作一个简单的应用程序，其中有人可以通过简单的 html 界面添加用户并使用 SQLite 将其存储在数据库中，然后他们可以编辑或删除
c++ - 具体 "getter setter"专用对象
我想创建一个用于存储数据的对象，限制读/写访问。例如: OBJ obj1; OBJ obj2; // DataOBJ has 2 methods : read() and write() DataO
c# - 具体 .Net 类的依赖注入(inject)
注入(inject)/隔离密封在 dll 中且不实现接口(interface)的类的首选方法是什么？我们使用 Ninject。假设我们有一个类“Server”，我们想要注入(inject)/隔离“
php - 如何将 Android 应用程序连接到 mySQL *具体*
在花费了至少 10 个小时的时间浏览在线资源、视频和教程之后，我有两个关于将我的 Android 应用程序与 mySQL 数据库连接的问题。保存文件 1) 所有教程都将 php 文件保存在 C/WA
django - 我应该以任何方式避免 Django 中的多表(具体)继承吗？
许多有经验的开发人员建议不要使用 Django multi-table inheritance因为它的性能不佳: Django gotcha: concrete inheritance通过 Jacob
c# - 无法将类型 [具体] 隐式转换为 [接口(interface)]
我知道我冒着挨揍的风险，但我觉得我在这件事上要绕圈子。为了让模型可用于多个项目，我们已将模型移出到一个单独的项目(一个 DLL)中，作为一系列要实现的接口(interface)。我们的界面上有这一行:
unit-testing - 除了 "all of them"作为答案之外，什么类型的应用程序(具体)在单元测试中取得了真正的成功？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
css - 具体 Mac 显示 : inline-block issue
我遇到了一个特定 mac 的问题，它没有显示我正确构建的某个网站。我测试过的所有其他 mac 和 pc 都能正确显示网站，但是在所有浏览器中这个特定的 mac 显示不正确就像提到的那样，这在其他每台计
c# - 具有抽象(基)/具体(继承)类的 DataContractSerializer
给定这段代码 public override void Serialize(BaseContentObject obj) { string file = ObjectDataStoreFold
php - 具体 5.8.2 类 'finfo' 未找到
我已经搜索了网络和我的服务器，但我无法找到我网站的 php.ini。我的网站出现以下错误。 Class 'finfo' not found Details G:\inetpub\wwwroot\lan
mysql - 如何使用 View 执行复杂的 sql 查询，而不是依赖中间(具体)表
SQL 爱好者: 我正在尝试通过玩以下用例来挖掘我一些生疏的 sql 技能: 假设我们有一家有线电视公司，并且有跟踪的数据库表: 电视节目，观看我们节目的客户，以及观看事件(特定客户观看特定节目的

首页

博学

6Ren·AI

商城

python - 需要 fit_generator() 的具体示例