gpt4 book ai didi

linux - Sun Grid Engine 暂停而不是重新启 Action 业

转载 作者:太空宇宙 更新时间:2023-11-04 11:32:37 26 4
gpt4 key购买 nike

这可能是一个只能由管理员解决的特定于集群的问题,但是当我有一个低优先级的工作而一个高优先级的工作出现时,进程就会被终止。

当高优先级作业完成后,低优先级作业将重新启动。用户端有没有办法让它在最初通过 SIGSTOP 或其他方式启动的机器上暂停而不终止进程?不幸的是,检查点在这里不是一个选项,所以我希望能够在不丢弃内存中的内容的情况下完成这项工作。

我们确实有连接到这台机器的 ssh,所以如果一切都失败了,我很想做一个非常草率的脚本 hack 来获得所需的行为:

1. start the process locally
2. send a SIGSTOP
3. make the job script send SIGCONT and just spin watching the process
4. when the job gets suspended, send a SIGSTOP again
5. when the job gets resumed, it should just send a SIGCONT

但我更愿意在 SGE 内做所有事情以避免任何令人讨厌的意外

最佳答案

SGE 中的暂停/停止机制由属性 suspend_methodresume_methodterminate_method 在每个队列的基础上进行控制。默认值是:

  • suspend_method - 发送 SIGSTOP
  • resume_method - 发送 SIGCONT
  • terminate_method - 发送 SIGKILL

除了乱用默认值外,我看不出有其他理由让 SGE 杀死作业而不是停止它们。

关于linux - Sun Grid Engine 暂停而不是重新启 Action 业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10185154/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com