python - 为什么我的 CNN 的准确性不可重现？-6ren

python - 为什么我的 CNN 的准确性不可重现？

转载作者：太空狗更新时间：2023-10-29 23:57:27

24

4

我希望我训练的 CNN 获得可重现的结果。因此，我将种子设置为 my script :

import tensorflow as tf
tf.set_random_seed(0)  # make sure results are reproducible
import numpy as np
np.random.seed(0)  # make sure results are reproducible

set_random_seed 的文档和 np.random.seed不要为 0 的种子报告任何特殊行为。

当我在几分钟内在同一台机器上运行相同的脚本两次并且没有进行更新时，我希望得到相同的结果。然而，事实并非如此:

运行 1:

0;0.001733;0.001313
500;0.390164;0.388188

运行 2:

0;0.006986;0.007000
500;0.375288;0.374250

如何让网络产生可重现的结果？

系统

$ python -c "import tensorflow;print(tensorflow.__version__)"                
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcublas.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcudnn.so.5 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcufft.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcurand.so.8.0 locally
1.0.0

$ python -c "import numpy;print(numpy.__version__)"
1.12.0

最佳答案

虽然我没有解决问题，但结果并不总是相同的可能原因如下(从最有可能/最容易修复到最不可能/最难修复大致排序)。问题出现后我也尝试给出解决方案。

人为错误 - 当您将结果从一个 shell 复制到纸上时，您读错了一个数字/打错了字:日志记录。为您运行的每个实验创建一个 2017-12-31-23-54-experiment-result.log。不是手动，但实验创造了它。是的，名称中的时间戳以便于再次找到它。对于每个单独的实验，以下所有内容都应记录到该文件中。
代码已更改:版本控制(例如 git)
配置文件更改:版本控制
伪随机数已更改:为随机/tensorflow/numpy 设置种子(是的，您可能需要设置多个种子)
数据加载不同/顺序不同:版本控制+种子(预处理真的一样吗？)
环境变量已更改:Docker
软件(版本)更改:Docker
驱动程序(版本)已更改:日志记录
硬件更改:日志记录
硬件/软件存在一些重现性问题。例如 floating point multiplication is not associative GPU 上的不同内核可能会在不同时间完成计算(我不确定)
硬件有错误

无论如何，多次运行“相同”的东西可能有助于对不同的东西有一个直觉。

写论文

如果你写一篇论文，我认为以下是可重复性的最佳实践:

添加指向所有代码的存储库(例如 git)的链接
代码必须容器化(例如 Docker)
如果有 Python 代码和 requirements.txt，您必须提供确切的软件版本，而不是像 tensorflow>=1.0.0 但是 tensorflow==1.2.3
添加您用于实验的版本的 git hash。如果您在两者之间进行了更改，则可能是不同的哈希值。
始终记录有关驱动程序(例如like this for nVidia)和硬件的信息。将此添加到论文的附录中。因此，如果以后发生更改，至少可以检查是否存在可能导致数字不同的更改。

为了记录版本，你可能想使用这样的东西:

#!/usr/bin/env python

# core modules
import subprocess


def get_logstring():
    """
    Get important environment information that might influence experiments.

    Returns
    -------
    logstring : str
    """
    logstring = []
    with open('/proc/cpuinfo') as f:
        cpuinfo = f.readlines()
    for line in cpuinfo:
        if "model name" in line:
            logstring.append("CPU: {}".format(line.strip()))
            break

    with open('/proc/driver/nvidia/version') as f:
        version = f.read().strip()
    logstring.append("GPU driver: {}".format(version))
    logstring.append("VGA: {}".format(find_vga()))
    return "\n".join(logstring)


def find_vga():
    vga = subprocess.check_output("lspci | grep -i 'vga\|3d\|2d'",
                                  shell=True,
                                  executable='/bin/bash')
    return vga


print(get_logstring())

它给出了类似的东西

CPU: model name    : Intel(R) Core(TM) i7-6700HQ CPU @ 2.60GHz
GPU driver: NVRM version: NVIDIA UNIX x86_64 Kernel Module  384.90  Tue Sep 19 19:17:35 PDT 2017
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5)
VGA: 00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM108M [GeForce 940MX] (rev a2)

关于python - 为什么我的 CNN 的准确性不可重现？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42326466/

24

4

0

文章推荐： python - 如何使用 python nltk 获取解析树？

文章推荐： c# - MVC ValidationMessageFor 无法正常工作

文章推荐： c# - 检查字符串是否多次包含子字符串

文章推荐： python - 主成分分析最重要的原始特征

scalacheck - 重现 ScalaCheck 测试运行
这是在 https://stackoverflow.com/questions/12639454/make-scalacheck-tests-deterministic 中作为“奖金问题”提出的，但没
javascript - Leaflet，重现/调用拖动事件
我的项目使用 Angular 6 和 Leaflet 1.2。我想重现当用户在 Leaflet map 上保持右键或左键单击时的拖动效果。例如，我希望在不断按下空格键时能够开始拖动 map 。我已
c# - 重现 SqlMembershipProvider 密码哈希
我们正在将我们的用户身份验证从提供的 .NET 实现迁移到我们自己的系统。我们希望能够支持存在于 aspNet_Membership 表中的旧密码。 Password 和 Salt 位于该表中，因此
c++ - 重现/调试一些多线程 hell
我有一个二进制文件，它在 99% 的时间里都运行良好。有时，我无法理解，它会因这个输出而崩溃。在我重新启动之后，一切正常。二进制是一个模板系统。它读取了一些带有占位符的模板，例如{%foo%} 或
c - 重现 strcpy 的行为
我试图在 c 中重现 strcpy 的行为，我的问题是该函数有效但它在末尾附加了额外的东西。 char *ft_strcpy(char * dst, const char * src) { in
c# - 重现 UserPreferenceChanged 事件以验证卡住问题已修复
我最近遇到了可怕的 UserPreferenceChanged 事件 UI 卡住问题，随后我解决了可能的原因，例如: 调用单个控件而不是主应用程序表单(参见 https://stackoverflow
scala - 我可以为 == 重现 Scala 的行为吗？
在 Scala 编程中，我可以读到 ==运算符的行为就像是这样定义的: final def == (that: Any): Boolean = if (null eq this) {null eq t
django - 复制/重现 Django 开发环境
我正在和我的 friend 一起开发 Django 项目。该项目依赖于一些 python 模块。我在 virtualenv 中安装了 django 和其他依赖项。 django 项目的代码位于一个存储
apache-spark - 重现 pyspark 示例的更方便的方法
关于spark的大多数问题都使用show作为代码示例，没有生成数据帧的代码，如下所示: df.show() +-------+--------+----------+ |USER_ID|locatio
java - 使用 -Xss 重现 OutOfMemoryError
我正在尝试重现 java.lang.OutOfMemoryError: unable to create new native thread但是使用 -Xss VM 参数。我猜想如果我们有大量线程，并
swift - 复制/重现 UIAlertView 模糊效果
我正在尝试在自定义 alertView 中插入表格 View 。我需要实现与默认警报相同的样式。从 Debug View Hierarchy 我几乎复制了样式，但我无法弄清楚 Apple 如何设置模糊
c++ - 重现 C++ 11 随机生成器的相同结果
标准是否保证如果 std::mt19937 被相同的数字播种，它会在所有平台上产生相同的数字序列？换句话说，它的实现是否由标准明确定义，或者像 std::rand() 一样被视为实现细节？最佳答案
javascript - 重现 github 404 效果
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的
javascript - 重现 BingPreview JavaScript 错误
我有一个网站可以从 BingPreview/1.0b* 获得访问，这很可能是 Bing 的机器人。我收到一个错误，它似乎无法找到我非常确定应该存在的 DOM 元素。我没有从任何其他浏览器(在所有主要
ios - 重现 iOS 11 笔记中的新扫描功能
有谁知道如何重现 new Notes new scanning feature在 iOS 11 中？？ AVFoundation 是否用于相机？摄像头如何检测纸张/文档/卡片的形状？他们如何实时放
iphone - 重现 iPhone SMS 应用程序用户界面的最简单方法？
您好! 作为使用 Objective-C 开发 iPhone 应用程序的初学者，我想知道重新创建 iPhone SMS 应用程序 UI(带有消息气泡等的用户界面)的最简单方法是什么我考虑过将 UIT
python - 如何实现可选的第一个参数(重现 slice() 行为)
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How can the built-in range function take a single argu
javascript - 重现 Chartjs v2 中的错误极坐标图未绘制所有提供的数据
虽然这很可能是我自己犯的错误，但有人可以帮助我。我有一个包含 6 个数据点的极坐标图，在绘制时仅显示 5 个数据点。如果这是一个问题，我会在 GitHub 上打开 1，但我在想，如果它归结于我糟糕的代
r - 使用 d3_sankey 重现 Sankey 图示例时出现问题
我正在尝试使用 rCharts 重现简单的示例绘图库 sankey图表。我发现this example from scratch并尝试重现它，但是，我遇到了一些问题。首先，我尝试在没有任何内容的情况
arrays - Haskell - 重现 numpy 的 reshape
进入 Haskell，我试图重现 numpy's reshape 之类的东西与列表。具体来说，给定一个平面列表，将其 reshape 为一个 n 维列表: import numpy as np a =

首页

博学

6Ren·AI

商城

python - 为什么我的 CNN 的准确性不可重现？

系统

写论文