python - 尝试在烤宽面条基本示例(稍作修改)上使用自己的数据集来制作用于人脸识别的神经网络-6ren

python - 尝试在烤宽面条基本示例(稍作修改)上使用自己的数据集来制作用于人脸识别的神经网络

转载作者：行者123 更新时间：2023-11-30 09:21:24

我正在做基本的烤宽面条示例: https://github.com/Lasagne/Lasagne/blob/master/examples/mnist.py

我通过将其与另一个类似的示例结合起来对其进行了轻微修改。

我正在尝试运行 CNN 模型，我在 CNN def 中添加了一些额外的输入，但它不应该有任何不同。还将示例中输入层的默认值 28 更改为 60(对于高度和宽度)，稍后在代码中使用类，但代码“卡在”最后一个网络行，这意味着代码是仍在运行，但没有任何反应。 Output when running the code. input_var 在主循环中定义如下:

input_var = T.tensor4('input_var')

其余代码:

def build_cnn(classes, height, width, input_var=None):

    print("Input layer, with height: {}, width: {} and input var: {}".format(height, width, input_var))

    network = lasagne.layers.InputLayer(shape = (None, 1, height, width),
                                    input_var=input_var)


    print("Convolutional layer with 32 kernels of size 5x5")
    network = lasagne.layers.Conv2DLayer(network,
                                         num_filters = 32,
                                         filter_size = (5, 5),
                                         nonlinearity = lasagne.nonlinearities.rectify,
                                         W = lasagne.init.HeNormal(gain = 'relu'))

编辑:好吧，根据我迄今为止的尝试，问题似乎出在我自己的数据集上。我已经重新调整了我的数据集以匹配 MNIST 数据集(例如)。 X_train 的形状为 [图像、 channel 、高度、宽度]。其中 channel = 1，高度、宽度 = 60。检索这些的代码是:

def load_images():
    dataset_path = os.path.abspath("C:/Users/laende/Dropbox/Skole UiS/4. semester/Master/Master/data/test_database")
    [bilder, label, names] = read_images1(dataset_path, (28, 28))
    label = np.array(label)

    bilder = bilder / np.float32(256)
    bilder = bilder[:, newaxis, :, :]

    X_train1, X_test1, Y_train1, Y_test1 = train_test_split(bilder, label, test_size = 0.2)

    list_of_labels = list(xrange(max(label) + 1))
    classes = len(list_of_labels)

    return X_train1, X_test1, Y_train1, Y_test1, classes

其中 read_images1 是:

 def read_images1(path, sz = None, channel = None):
    c = 0
    X = []
    y = []
    folder_names = []
    for dirname, dirnames, filenames, in os.walk(path):
        for subdirname in dirnames:
            subject_path = os.path.join(dirname, subdirname)
            folder_names.append(subdirname)
            for filename in os.listdir(subject_path):
                try:
                    im = cv2.imread(os.path.join(subject_path, filename),     cv2.IMREAD_GRAYSCALE)

                    if (sz is not None):
                        im = cv2.resize(im, sz)

                    X.append(np.asarray(im, dtype = np.uint8))
                    y.append(c)

                except IOError, (errno, strerror):
                    print "I/O error ({0]): {1}".format(errno, strerror)
                except:
                    print "unexpected error:", sys.exc_info()[0]
                    raise
            c = c + 1
    return [X, y, folder_names]

main 中运行的代码:

def main(model='mlp', num_epochs=100):
    # Load the dataset

    print("Loading data...")
    mnist = 1
    if mnist == 1:
        classes = 10
        X_train, y_train, X_val, y_val, X_test, y_test = load_dataset()

        dataset = {
            'train': {'X': X_train, 'y': y_train},
            'test': {'X': X_test, 'y': y_test}}
        shape = dataset['train']['X'][0].shape

    else:
        X_train, X_test, y_train, y_test, classes = load_images()

        dataset = {
            'train': {'X': X_train, 'y': y_train},
            'test': {'X': X_test, 'y': y_test}}
        shape = dataset['train']['X'][0].shape

    input_var = T.tensor4('inputs')
    target_var = T.ivector('targets')

    print("Building model and compiling functions...")
    if model == 'mlp':
        network = build_mlp(height=int(shape[1]),
                            width=int(shape[2]),
                            channel=int(shape[0]),
                            classes=int(classes),
                            input_var=input_var)

如果 mnist = 1(在 main 中)，代码运行正常，如果我尝试使用自己的数据集，它会卡在 build_mlp 中(类似于 cnn 的原始问题):

def build_mlp(classes, channel, height, width, input_var=None):

    neurons = int(height * width)

    network = lasagne.layers.InputLayer(shape = (None, channel, height, width),
                                 input_var=input_var)

    network = lasagne.layers.DropoutLayer(network, p = 0.2)

   #Code gets stuck on this point, running forever, doing nothing.
   #No error messages received either.
    network = lasagne.layers.DenseLayer(
        network,
        num_units = neurons,
        nonlinearity = lasagne.nonlinearities.rectify,
        W = lasagne.init.GlorotUniform())

编辑2:经过一段时间的挣扎后，我发现在 read_images1() 中完成的图像大小调整导致了问题:

 def read_images1(path, sz = None, channel = None):
    c = 0
    X = []
    y = []
    folder_names = []
    for dirname, dirnames, filenames, in os.walk(path):
        for subdirname in dirnames:
            subject_path = os.path.join(dirname, subdirname)
            folder_names.append(subdirname)
            for filename in os.listdir(subject_path):
                try:
                    im = cv2.imread(os.path.join(subject_path, filename),     cv2.IMREAD_GRAYSCALE)
                    #This part caused the problems. 
                    if (sz is not None):
                        im = cv2.resize(im, sz)

                    X.append(np.asarray(im, dtype = np.uint8))
                    y.append(c)

                except IOError, (errno, strerror):
                    print "I/O error ({0]): {1}".format(errno, strerror)
                except:
                    print "unexpected error:", sys.exc_info()[0]
                    raise
            c = c + 1
    return [X, y, folder_names]

如果我没有通过任何大小调整并使用文件夹中的默认图像大小，神经网络就能够编译。有谁知道为什么吗？我将 read_images1() 更新为:

 def read_images1(path, sz = None, na = False):
    """

    :param path: sti til mappe med underliggende mapper tilhørende personer.
    :param sz: Størrelse på bildefilene
    :return: returnerer liste av bilder, labels og navn
    """
    c = 0
    X = []
    y = []
    folder_names = []
    for dirname, dirnames, filenames, in os.walk(path):
        for subdirname in dirnames:
            subject_path = os.path.join(dirname, subdirname)
            folder_names.append(subdirname)
            for filename in os.listdir(subject_path):
                try:
                    im = cv2.imread(os.path.join(subject_path, filename), cv2.IMREAD_GRAYSCALE)

                    if (sz is not None):
                        im = cv2.resize(im, dsize=sz, interpolation = cv2.INTER_LANCZOS4)

                    if (na == True):
                        im = im[newaxis, :, :]


                    X.append(np.asarray(im, dtype = np.uint8))
                    y.append(c)

                except IOError, (errno, strerror):
                    print "I/O error ({0]): {1}".format(errno, strerror)
                except:
                    print "unexpected error:", sys.exc_info()[0]
                    raise
            c = c + 1
    return [X, y, folder_names]

如果我使用 sz = None 和 na = True 运行程序，则它可以工作。如果为 sz 参数指定任何大小，则代码在尝试再次编译神经网络时会被卡住。

最佳答案

好吧，我想我可以在这里看到一些问题，不确定您遇到的是哪一个......

在 read_images1() 中，X 是 numpy 数组的 Python 列表。它在哪里转换为单个 numpy 数组？尝试添加 X = numpy.asarray(X) 。您还需要将其 reshape 为 (n_images, n_channels, width, height)，其中我假设 n_channels=1 表示灰度。网络需要 4D 输入而不是 3D。
此代码list_of_labels = list(xrange(max(label) + 1)); classes = len(list_of_labels) 假设标签是从 0 到 N 的连续数字。是吗？
您的 build_mlp(classes, height, width, input_var=None) 与原始示例 build_mlp(input_var=None) 非常不同。原始示例显然有效，因此无论出现什么问题都与差异有关。最大的区别之一是您不断分配给同一个变量，就像这样 network = lasagne.layers.DenseLayer(network, ...) ，其中原始的每一层都有不同的变量 l_hid1 = lasagne.layers.DenseLayer(l_in_drop, ...)
此外，如果它在 build_mlp() 期间挂起，那么显然问题不在于您如何读取图像。尝试将原始版本的 build_mlp() 与您的图像一起使用。尝试单独运行它。跳过图像读取，只需使用常量参数调用 build_mlp() 即可。

关于python - 尝试在烤宽面条基本示例(稍作修改)上使用自己的数据集来制作用于人脸识别的神经网络，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36556704/

文章推荐： machine-learning - 监督机器学习的历史标签

文章推荐： java - 如何在 Java 中更新 LookAndFeel？

文章推荐： java - 多态性 - 模棱两可的错误

MSSQL监控数据库的DDL操作(创建，修改，删除存储过程，创建，修改，删除表等)
前言：有时候，一个数据库有多个帐号，包括数据库管理员，开发人员，运维支撑人员等，可能有很多帐号都有比较大的权限，例如DDL操作权限(创建，修改，删除存储过程，创建，修改，删除表等），账户多了，管理
c - 下面的代码有什么问题？预期 X 由线程 Func 1 修改，随后 X 由线程 Func 2 修改
这个问题已经有答案了: Condition variable deadlock (2 个回答) 已关闭 5 年前。在研究多线程时，我编写了以下代码，但在屏幕上没有观察到输出。我在这里做错了什么？我期
修改.htaccess实现301域名重定向示例分享
复制代码代码如下: <IfModule mod_rewrite.c> RewriteEngineOn RewriteBase/ #将www.zzvips.com跳转到www.zzv
修改.htaccess实现子目录绑定示例分享
复制代码代码如下: <IfModule mod_rewrite.c> RewriteEngine On RewriteBase / # 把 www.zzvips.com
修改 Gateway和DNS的vbs脚本
复制代码代码如下: Const T_GATEWAY = "1.1.1.1" '网关 Const T_NEWDNS1 = "2.2.2.2" 'DNS1
ElasticSearch学习2 - 查询、修改
0. 修改索引大文本字段支持排序 PUT http://localhost:9200/lrc_blog/_mapping //请求体 { "properties": { "title": { "t
javascript - 修改 DOM
仅 react 当状态发生变化时重新渲染 . 那么为什么我会直接看到我对真实 DOM 所做的更改呢？我知道我正在修改真实的 DOM，但是当我根本没有改变状态时触发重新渲染的是什么。 import R
swiftui - 修改@FetchRequest
Xcode beta 5 推出 @FetchRequest对于 SwiftUI。我有一个 View ，它有一个 @FetchRequest . NSFetchRequest是在管理器中创建的，该管理
php - 修改/编译开源项目源代码的最佳方法是什么？
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
PHP preg_replace 修改
我有一个表达式[text][id]应替换为链接 text 解决方案是( id 是整数) $s = preg_replace("/\[([^\]]+)(\]*)\]\[([0-9]+)\]/","$1$
svn - 如何防止文件在颠覆中被提交/修改？
我在 repo 中有一个文件，我不想让任何人更新。我能做什么？最佳答案你想要svn锁:http://www.linxit.de/svnbook/en/1.2/svn.ref.svn.c.lock
powershell - 修改/转换选择对象中的数据
说我有项目 list 。我想导出到csv，但在此之前我想做一些计算/修改。基本上，设置如下所示: PS C:\Files> gci Directory: C:\Files Mode
Java API 修改
我有一个非常简单的问题 - 是否可以修改 Java API 的源代码，例如Junit，JABX ？我知道这似乎是一个非常愚蠢的问题，但它一直困扰着我一段时间。最佳答案如果您可以掌握源代码，那么请
r - 修改/添加列到嵌套的tibble
我有一个带有变量/列的小标题，其中包括不同形状的小标题列表。我想为其中一个变量中的每个(子)标题添加一个变量/列。例如此类数据 library("tibble") aaa aaa # A tibb
Javascript url 修改
我有几个菜单，可以在单击时向当前链接添加变量。这是一个例子: 1 2 3 x y z 我的问题是，如果我选择“y”2次，它会添加“&cord=y”2次。相反，我希望它替
.net - 修改.NET服务安装程序的安装路径
我有两个项目:一个服务项目和一个服务安装程序项目。服务项目具有适合我的产品的装配信息。它包括公司信息和正确的服务名称。一旦服务实际安装，所有这些似乎都会被忽略。安装服务时，它使用在服务安装程序的ini
perl - 修改$_的时候会出错吗？
以下代码何时可能产生副作用？ @some = map { s/xxx/y/; $_ } @some; perlcritic 将其解释为危险的，因为例如: @other = map { s/xxx/y/
java - 修改.class文件
我想知道以下哪种解决方案更好:我想修改一些 .class 文件，我意识到有两种方法可以做到这一点: 反编译.class文件，修改它，最后再次编译。 - 直接用十六进制编辑器修改。谢谢最佳答案在这
java - 修改 addMouseListener()
这是我的按钮代码 onclick 我希望我的程序等待用户单击一个 JPanel，并且当用户单击 JPanel 时，它应该在控制台上打印其名称。此按钮代码未显示输出 JPopupMenu popu
java - 修改/设置从访问器方法返回的字符串
我正在使用一个具有“getName()”方法的特定 API。 getName() 返回一个字符串。是否可以修改该字符串？ API 中不包含修饰符方法，并且 String getName() 返回的是私

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 尝试在烤宽面条基本示例(稍作修改)上使用自己的数据集来制作用于人脸识别的神经网络