- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
nvidia-smi 的输出显示了 GPU 上运行的 PID 列表:
Thu May 10 09:05:07 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.111 Driver Version: 384.111 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:0A:00.0 Off | N/A |
| 61% 74C P2 195W / 250W | 5409MiB / 11172MiB | 100% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 5973 C ...master_JPG/build/tools/program_pytho.bin 4862MiB |
| 0 46324 C python 537MiB |
+-----------------------------------------------------------------------------+
如何显示与每个进程关联的用户名?
这显示了单个 PID 的用户名:
ps -u -p $pid
最佳答案
我创建了一个脚本,它采用 nvidia-smi 输出并用更多信息丰富它:https://github.com/peci1/nvidia-htop .
这是一个Python脚本,用于解析GPU进程列表,解析PID,通过ps
运行它们以收集更多信息,然后替换nvidia-smi
'带有丰富列表的进程列表。
使用示例:
$ nvidia-smi | nvidia-htop.py -l
Mon May 21 15:06:35 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.25 Driver Version: 390.25 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:04:00.0 Off | N/A |
| 53% 75C P2 174W / 250W | 10807MiB / 11178MiB | 97% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:05:00.0 Off | N/A |
| 66% 82C P2 220W / 250W | 10783MiB / 11178MiB | 100% Default |
+-------------------------------+----------------------+----------------------+
| 2 GeForce GTX 108... Off | 00000000:08:00.0 Off | N/A |
| 45% 67C P2 85W / 250W | 10793MiB / 11178MiB | 51% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| GPU PID USER GPU MEM %MEM %CPU COMMAND |
| 0 1032 anonymou 10781MiB 308 3.7 python train_image_classifier.py --train_dir=/mnt/xxxxxxxx/xxxxxxxx/xxxxxxxx/xxxxxxx/xxxxxxxxxxxxxxx |
| 1 11021 cannotte 10765MiB 114 1.5 python3 ./train.py --flagfile /xxxxxxxx/xxxxxxxx/xxxxxxxx/xxxxxxxxx/xx/xxxxxxxxxxxxxxx |
| 2 25544 nevermin 10775MiB 108 2.0 python -m xxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
+-----------------------------------------------------------------------------+
关于cuda - 如何自定义 nvidia-smi 的输出以显示 PID 用户名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50264491/
我得到nvidia-smi得到Memory-Usage是这样的 $nvidia-smi -i 0,1 Wed Mar 4 16:20:07 2020 +-----------------
我得到nvidia-smi得到Memory-Usage是这样的 $nvidia-smi -i 0,1 Wed Mar 4 16:20:07 2020 +-----------------
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题,使其成为
允许 nvidia-smi 获取硬件级别详细信息的内部操作是什么?即使某些进程已经在 GPU 设备上运行,该工具也会执行并获取进程的使用详细信息、名称和 ID 等。是否可以在用户级别开发这样的工具?
允许 nvidia-smi 获取硬件级别详细信息的内部操作是什么?即使某些进程已经在 GPU 设备上运行,该工具也会执行并获取进程的使用详细信息、名称和 ID 等。是否可以在用户级别开发这样的工具?
例如,当我使用 nvidia-smi -l 60 时,我问自己是否: 给出的信息是每 60 秒使用一次时的快照 给出的信息是时间与+/- 60 秒之间的平均值 你知道答案吗?我还没找到。 谢谢。 最佳
我正在使用 Nvidia GTX Titan X 做深度学习实验。 我正在使用 nvidia-smi 来监控 GPU 运行状态,但是该工具提供的 perf(ormance) 状态没有意义。 我查看了
我想将有关机器可用 GPU 和状态的系统信息放入系统中以进行实时监控。我使用 XML 输出 GPU 信息 $ nvidia-smi -x -q 此命令将打印输出当前 GPU 状态(如使用情况、温度等)
我使用 export CUDA_VISIBLE_DEVICES=1 在 GPU id 1 上运行 tensorflow,nvidia-smi 中的一切看起来都不错,我的 python 进程在 gpu
我正在学习英特尔架构。到目前为止,我遇到了几种类型的中断: SCI:系统控制中断,硬件用来通知操作系统 ACPI 事件的系统中断。 SCI 是一个事件的、低的、可共享的电平中断。 SMI:系统管理中断
我在 GPU 中运行 tensorflow 代码。 下图显示了 nvidia-smi 信息:: 我想问一下 nvidia-smi 输出中的“关闭”是什么意思? 还有“C”类型在这里是什么意思?? 在这
从Windows 10 1809开始,OS会生成大量的软件SMI。 我们在单独的处理器内核上运行我们的实时应用程序,每个 SMI 都会产生不可预测的延迟。在 1809 年之前,始终可以在 BIOS 中
nvidia-smi在 Windows 的命令提示符 (CMD) 中执行会返回以下错误 C:\Users>nvidia-smi 'nvidia-smi' is not recognized as an
我目前正在使用 nvidia 驱动程序“nvidia-smi”附带的工具来监控 GPU 性能。当我们使用'nvidia-smi -a'时,它会给出当前GPU信息,包括GPU核心和内存使用情况,温度等,
我知道 nvidia-smi -l 1 会每秒给出 GPU 使用情况(类似于以下内容)。不过,我希望能解释一下 Volatile GPU-Util 的真正含义。是使用的 SM 数量除以 SM 总数,还
RFC 2578“管理信息结构版本 2 (SMIv2)”包含类型 TimeTicks,定义为 IMPLICIT INTEGER (0..4294967295) 并描述为“表示时间的非负整数,以 2^3
当我运行命令 nvidia-smi ,我得到以下两个按总线 ID 排序的 GPU: For GPU 0, 00000000:0A:00.0 For GPU 1, 00000000:41:00.0 但是
为了在系统上利用 GPU,我希望能够绘制框图并理解“nvidia-smi topo -m”输出表示的连接。 这是一个示例输出: 有人可以提供一个系统级框图吗?连接的描述也会很棒。我相信这会帮助很多人利
这是我的 nvidia-smi 的输出命令,我想解析它的输出并杀死在 GPU 上运行的所有 python 进程。我已经知道如何使用我编写的以下脚本杀死所有 python 进程。 kall () {
已关闭。这个问题是 not about programming or software development 。目前不接受答案。 这个问题似乎不是关于 a specific programming
我是一名优秀的程序员,十分优秀!