- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我被授予访问一些高性能计算系统的权限,以进行一些机器学习实验。
该系统安装了 IBM 的 LSF 10.1。我被指示运行 bsub
命令将新的 ML 任务提交到队列。
我使用 Python+Keras+Tensorflow 来完成我的任务。
我的典型工作流程如下。我在 python 脚本 train.py
中定义神经网络架构和训练参数,将其提交到 git repo,然后运行它。然后我在 train.py
中进行一些更改,提交并再次运行。
我开发了以下 bsub
脚本
#!/bin/bash
#
#BSUB -P "project"
#BSUB -q queue
#BSUB -n 1
#BSUB -o %J.log
#BSUB -e %J.err
#BSUB -cwd "/home/user/my_project/nntrain"
module load cuda9.0 cudnn_v7 nccl_2.1.15
source /home/user/my_python/bin/activate
export PYTHONPATH=/home/user/my_project/lib
python train.py 2>&1 | tee ${LSB_JOBID}_out.log
现在问题来了。
我定义了一个网络,然后运行 bsub < batch_submit
。该作业被放入队列中并被分配一些标识符,例如 12345678。
当它没有运行时,等待下一个空闲节点,我对 train.py
进行了一些更改以创建一个新变体并以类似的方式再次提交:bsub < batch_submit
让新作业 ID 为 12345692。作业 12345678 仍在等待。
现在我有两个作业,正在等待它们的节点。
脚本 train.py 怎么样?
他们两个的情况会一样吗?
最佳答案
是的,会的。当您提交作业时,bsub
将仅查看以 #BSUB
开头的前几行,以确定您的作业需要哪些资源以及在哪个节点上( s) 使其运行得最好。
脚本的所有其他部分(不以 #BSUB
开头)仅在脚本停止挂起
并开始运行
时进行解释>。在某一特定行中,bash
将遇到命令 python train.py
,加载当前版本的 train.py
并执行它。
也就是说,bsub
不会以任何方式“卡住”环境;当作业开始运行时,它将运行最新版本的train.py
。如果您提交的两个作业都引用相同的 .py
文件,它们都将运行相同的 python 脚本(最新版本)。
如果您想知道如何使用数千个不同的设置运行数千个作业,我通常会这样做:
.py
脚本可以接受带有配置参数的命令行参数,或者可以从某个文件获取配置;不要依赖手动修改脚本来更改某些设置。创建一个 bsub 模板文件,该文件看起来与上面的 bash 脚本大致相似,但至少留下一个可以指定实验参数的元变量。我所说的“元变量”是指一个唯一的字符串,不会与 bash 脚本中的其他任何内容发生冲突,例如 NAME_OF_THE_DATASET
:
#!/bin/bash
#
#BSUB -P "project"
#BSUB -q queue
#BSUB -n 1
#BSUB -o %J.log
#BSUB -e %J.err
#BSUB -cwd "/home/user/project/nntrain"
module load cuda9.0 cudnn_v7 nccl_2.1.15
source /home/user/my_python/bin/activate
export PYTHONPATH=/home/user/my_project/lib
python train.py NAME_OF_THE_DATASET 2>&1 | tee ${LSB_JOBID}_out.log
创建一个单独的 bash 脚本,其中包含一个循环,为元变量插入不同的值(例如,将 NAME_OF_THE_DATASET
替换为 myDataset1.csv
,... ,myDatasetN.csv
使用sed
),然后通过bsub
提交修改后的模板。
这可能不是最简单的解决方案(人们可能可以使用 bsub 本身的设施来摆脱更简单的编号方案),但我发现它非常灵活,因为它同样适用于多个元变量以及各种标志和设置,它还允许您将不同的预处理脚本插入到 bsub
模板中。
关于python - 在 IBM Load Shareing Facility (LSF) 中训练神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51441358/
我正在 div 中加载一个 php 页面,该页面采用发布的变量来显示正确的内容。它的工作原理是这样的: $(".mainArea").load("page.php", {'folder': 'a'})
我是 AWS 新手。我开始学习 ALB 和 NLB。我知道 ALB 在第 7 层协议(protocol)中工作,而 NLB 在第 4 层协议(protocol)中工作。 谁能解释一下ALB和NLB的实
这是来自 this Article . filter(loaded => !loaded) 有什么作用?我没有在任何地方看到该变量的定义。 我明白这个方法的目的是什么,只是不是那一行。 canActi
我应该在 Constructor 还是 FormLoad() 中加载子表单? 我有一些代码调用在控件中嵌入表单的自定义类。我最初是在 Constructor 之外声明我的子窗体,然后在 FormLoa
目录 1、图解 2、json.loads()用法 3、json.load()用法 4、此外还有一种json.dumps 语法
我正在使用 PhoneGap 为 iPad 编写应用程序,我想在不触发 Safari 或使用 ChildBrowser 等内部 Web 浏览器的情况下加载外部 URL。 我正在使用 PhoneGap
人们经常在他们的(与优化和性能相关的)问题和答案中谈论“重载”。 我试图在典型服务器上的常规 Web 应用程序的上下文中量化这一点(以 SO 及其相当小的基础设施为例),假设它们立即返回(以简化和提高
有人可以写这段代码吗: this.Loaded += (s, e) => this.loaded = true; 分成几行代码以便我可以追溯其含义? 在我的代码示例中没有 s 或 e 吗? 最佳答案
我正在使用 jQuery 的 .load()方法和Loading Page Fragments 。以下是我当前的代码: $("#submit").click(function() { $("#
我想实现的是,当单击图像时,在该图像所在的 div 中,加载了一个包含来自另一个 .html 的其他内容的 div,但我无法完成。 如果我这样做,下面的代码将完美运行: $('#windows_lin
我使用 qt 开发了一个 c++ 库。在本文中,我使用 QSqlDatabase 从 SQLite 数据库中查询信息。注意:我的库在 qt 桌面应用程序中运行良好(我在 Linux 上开发)。 现在我
演示:http://jsfiddle.net/FyrRm/1/ 当我们向下滚动时,您会注意到...在滚动到文章标题到 之后我正在展示一个共享小部件。我正在使用 $(window).on("load"
我在 html(PC) 中使用的图像正确加载,我使用了 img 标签。我已将此文件连同图像一起保存并发送到我的手机,但它不会加载到手机上。我对图像大小或任何东西没有任何问题。我认为它与图像位置有关。
我将 .load() 广泛用于 AJAX 内容。很棒,但如果它做得更多一点,我会喜欢它: 如果为了响应用户操作,我多次调用同一个 div 上的 .load(),我可能会在 div 中得到错误的数据。当
我知道很多方法需要调用它的父类(super class)方法,有些方法不需要, 我正在寻找关于方法调配的东西。它在加载方法中初始化,并且在教程中没有[super load]。 我想知道是不是错了,还是
几个月来,我一直在使用pyGame 2.0.1。今天,我升级到最新版本(2.1.2)后,在尝试加载音频文件时开始出现以下错误:。到目前为止我尝试过的东西:。我使用的是Windows 10、Python
我有一个完整的 angular 应用程序,它使用预先加载。 我想将其转换为延迟加载,但是因为我对所有路线都有保护,而且所有路线都是到一条 protected 主路线的子路线,我不知道是否可以做到这一点
我有一个 React 应用程序,它在 useEffect 中调用我的 API,返回一个用作 imy 图像 src 的 URL 列表。 我正在使用 react-loader-spinner 在加载图像时
我正在使用 Slick.js 逐步加载我的图像我注意到有些图像要么部分加载,要么根本没有加载。 例如,在this site上,有两个画廊:建筑和设计(在导航中)。当用户单击任一图像时,他们会看到该图库
我在我的一个项目中收到此警告。这在调用我的后端 api 时会导致问题,因为它调用了 api 两次。我已经尝试过之前在论坛上发布的关于相同查询的解决方案,但我无法解决这个问题。如果有人能帮助我解决这个问
我是一名优秀的程序员,十分优秀!