应用介绍
(1)下线节点(禁止运行新作业)
(2)上线节点(允许运行新作业)
(3)节点清空(清理已运行作业)
(4)节点恢复(恢复Idle或Alloc状态)
账户关联
所谓关联(association),是指由每个作业可以唯一确定一个四元组: 。关联的信息保存在系统记账数据库中。
cluster 是作业所在的高性能计算机系统的名字,即系统配置文件中 ClusterName 参数的值。多个高性
能计算机系统可以使用一个记账数据库,cluster 用于区分不同系统上的关联。
account 即作业所使用的帐号。帐号用于对系统中的用户进行组织,以进行利用统计、收费等。
user 即提交作业的用户。在确定关联时,使用用户的名字而不是用户 UID 进行识别。同一个用户的不同
作业可以使用不同的帐号。
partition 即作业所在的分区。如果关联的 partition 域为空,表示任意分区。
预期的操作模式是启动sacctmgr命令,添加,删除,修改和/或列出关联记录,然后提交更改并退出。
scontrol update nodename=gv21 state=drain reason=“hardware error”
scontrol update nodename=gv21 state=idle
scontrol update nodename=gv21 state=down reason=“debug”
scontrol update nodename=gv21 state=resume
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处:
apollocode »
slurm常用命令
文件列表(部分)
名称 |
大小 |
修改日期 |
slurm常用命令.pdf | 938.20 KB | 2021-09-19 |
发表评论 取消回复