gpt4 book ai didi

linux - ctrl+c 不终止进程

转载 作者:太空宇宙 更新时间:2023-11-04 12:44:01 69 4
gpt4 key购买 nike

我有一个可以完美响应 CTRL+C 的流程在我的本地机器上。而且它似乎也有效。

但在 EC2 实例上,它卡住并成为一个已失效或僵尸进程。

kill -9 <PID>不会删除它,我必须重新启动 EC2 实例才能正确清理它。

当它运行时,它还会加载一个内部开发的共享库,我无法影响它,也无法访问其中的任何源代码以查看它在做什么。这个库也使用 CUDA 并且似乎启动了多个线程。

我尝试在主线程上安装一个信号处理程序,它确实安装了但调用了 _exit没有关闭整个进程,似乎还在等待。

为什么这里可能会阻止 CTRL+C从干净地退出过程?我可以覆盖或检查其他线程可能在做什么吗?

最佳答案

啊,我发现问题了。我会按原样保留问题,以防它对其他人有帮助。

事实证明,在我的 PC 上,我有一个 GTX 680,并且在安装 CUDA 时安装了驱动程序。 EC2上的卡是GRID K520,CUDA安装的驱动不工作。我下载并安装了最新的稳定卡特定驱动程序,然后它就可以工作了。

这个发现是在运行 nvidia-smi 之后发现的,它不会打印有关该卡的任何详细信息,而只会显示 Killed。再次运行 nvidia-smi,它会锁定控制台。

不幸的是,我没有测试 CUDA 应用程序是否正常工作,而是依赖于驱动程序似乎在日志中打印一条消息说它已加载并假设它正在工作。

更新驱动程序包括从 nvidia 下载最新的驱动程序(使用 .run 版本)。然后:

sudo modprobe -r nvidia_uvm
sudo modprobe -r nvidia

最后使用如下命令安装它:

sudo ./NVIDIA-Linux-x86_64-3xx.xx.xx.run

然后我重启了实例并用 nvidia-smi 验证了它

此链接很有见地 - CUDA 7.5 unstable on EC2

关于linux - ctrl+c 不终止进程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39322204/

69 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com