我想在Ubuntu 16.04上模拟SLURM。 我不需要认真的资源pipe理,我只想testing一些简单的例子。 我不能以通常的方式安装SLURM ,我想知道是否还有其他的select。 其他的东西,我试过了:
Docker镜像 。 不幸的是, docker pull agaveapi/slurm; docker run agaveapi/slurm docker pull agaveapi/slurm; docker run agaveapi/slurm给我错误:
/usr/lib/python2.6/site-packages/supervisor/options.py:295:UserWarning:Supervisord以root用户身份运行,并在默认位置(包括当前工作目录)中searchconfiguration文件。 您可能希望指定一个“-c”参数,指定configuration文件的绝对path以提高安全性。 'Supervisord以root身份运行,正在search'2017-10-29 15:27:45,436以超级用户身份运行的CRIT Supervisor(configuration文件中没有用户)2017-10-29 15:27:45,437信息supervisord以pid 1开头2017 -10-29 15:27:46,439信息产生:'slurmd'与PID 9 2017-10-29 15:27:46,441信息产生:'sshd'与PID 10 2017-10-29 15:27:46,443信息产生: 'munge'with pid 11 2017-10-29 15:27:46,443信息产生:'slurmctld'与pid 12 2017-10-29 15:27:46,452信息退出:munge(退出状态0;未预期)2017-10-29 -29 15:27:46,452 CRIT收获了未知的pid 13)2017-10-29 15:27:46,530 INFO放弃了:munge进入FATAL状态,太多开始重试太快2017-10-29 15:27:46,531 INFO退出:slurmd(退出状态1;预计不会)2017-10-29 15:27:46,535 INFO放弃了:slurmd进入FATAL状态,太多启动重试太快2017-10-29 15:27:46,536 INFO退出:slurmctld退出状态0;预计不到)2017-10-29 15:27:47,537 INFO成功:sshd进入RUNNING状态,进程已经停顿> 比起1秒(startsecs)2017-10-29 15:27:47,537 INFO放弃了:slurmctld进入了FATAL状态,太多的启动重试太快
本指南通过Vagrant启动SLURM VM 。 我试了一下,但是复制了我的密钥超时。
在Windows中使用多个inputstream到文件
在Windows PC上的vagrant version> = 1.8.1上安装libvirt插件
Vagrant'EnableSendfile off'不起作用
stream浪汉中带有简单LAMP的多个虚拟主机
在Windows上安装Docker工具箱后,Vagrant不起作用
sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant / ssh:连接主机服务器端口22:连接超时丢失连接
用stream浪汉在windows上设置PHP环境variables
正则expression式增量parsing
Vagrant无法在Windows 7上使用VirtualBox Guest Additions在Linux guest虚拟机上安装
静态文件在从Go提供服务时不会更新
我仍然更喜欢本地运行SLURM,但是我放弃了Debian 9.2虚拟机。 在这里看到我的努力解决本机安装。 这里的方向工作顺利,但我需要对slurm.conf进行以下更改。 下面, Debian64是hostname , wlandau是我的用户名。
ControlMachine=Debian64
SlurmUser=wlandau
NodeName=Debian64
这里是完整的slurm.conf 。 类似的slurm.conf在我的本地Ubuntu 16.04上不起作用。
# slurm.conf file generated by configurator.html. # Put this file on all nodes of your cluster. # See the slurm.conf man page for more @R_563_4045@ion. # ControlMachine=Debian64 #ControlAddr= #BackupController= #BackupAddr= # AuthType=auth/munge #CheckpointType=checkpoint/none CryptoType=crypto/munge #disableRootJobs=NO #EnforcePartLimits=NO #Epilog= #EpilogSlurmctld= #FirstJobId=1 #MaxJobId=999999 #GresTypes= #GroupUpdateForce=0 #GroupUpdateTime=600 #JobCheckpointDir=/var/lib/slurm-llnl/checkpoint #JobCredentialPrivateKey= #JobCredentialPublicCertificate= #JobFileAppend=0 #JobRequeue=1 #JobSubmitPlugins=1 #KillOnBadExit=0 #LaunchType=launch/slurm #Licenses=foo*4,bar #MailProg=/usr/bin/mail #MaxJobCount=5000 #MaxStepCount=40000 #MaxTasksPerNode=128 MpiDefault=none #MpiParams=ports=#-# #PluginDir= #PlugStackConfig= #PrivateData=jobs ProctrackType=proctrack/pgid #Prolog= #PrologFlags= #PrologSlurmctld= #PropagatePrioProcess=0 #PropagateResourceLimits= #PropagateResourceLimitsExcept= #RebootProgram= ReturnToService=1 #SallocDefaultCommand= SlurmctldPidFile=/var/run/slurm-llnl/slurmctld.pid SlurmctldPort=6817 SlurmdPidFile=/var/run/slurm-llnl/slurmd.pid SlurmdPort=6818 SlurmdspoolDir=/var/lib/slurm-llnl/slurmd SlurmUser=wlandau #SlurmdUser=root #SrunEpilog= #SrunProlog= StateSaveLocation=/var/lib/slurm-llnl/slurmctld SwitchType=switch/none #TaskEpilog= TaskPlugin=task/none #TaskPluginParam= #TaskProlog= #TopologyPlugin=topology/tree #TmpFS=/tmp #TrackWCKey=no #TreeWidth= #UnkillableStepProgram= #UsePAM=0 # # # TIMERS #BatchStartTimeout=10 #CompleteWait=0 #EpilogMsgTime=2000 #GetEnvTimeout=2 #HealthCheckInterval=0 #HealthCheckProgram= InactiveLimit=0 KillWait=30 #MessageTimeout=10 #ResvOverRun=0 MinJobAge=300 #OverTimeLimit=0 SlurmctldTimeout=120 SlurmdTimeout=300 #UnkillableStepTimeout=60 #VSizefactor=0 Waittime=0 # # # SCHEDULING #DefMemPercpu=0 FastSchedule=1 #MaxMemPercpu=0 #SchedulerRootFilter=1 #SchedulerTimeSlice=30 SchedulerType=sched/backfill SchedulerPort=7321 SelectType=select/linear #SelectTypeParameters= # # # JOB PRIORITY #PriorityFlags= #PriorityType=priority/basic #PriorityDecayHalfLife= #PriorityCalcPeriod= #PriorityFavorSmall= #PriorityMaxAge= #PriorityUsageResetPeriod= #PriorityWeightAge= #PriorityWeightFairshare= #PriorityWeightJobSize= #PriorityWeightPartition= #PriorityWeightQOS= # # # LOGGING AND ACCOUNTING #AccountingStorageEnforce=0 #AccountingStorageHost= #AccountingStorageLoc= #AccountingStoragePass= #AccountingStoragePort= AccountingStorageType=accounting_storage/none #AccountingStorageUser= AccountingStoreJobComment=YES ClusterName=cluster #DebugFlags= #JobCompHost= #JobCompLoc= #JobCompPass= #JobCompPort= JobCompType=jobcomp/none #JobCompuser= #JobContainerType=job_container/none JobAcctGatherFrequency=30 JobAcctGatherType=jobacct_gather/none SlurmctldDebug=3 SlurmctldLogFile=/var/log/slurm-llnl/slurmctld.log SlurmdDebug=3 SlurmdLogFile=/var/log/slurm-llnl/slurmd.log #SlurmSchedLogFile= #SlurmSchedLogLevel= # # # POWER SAVE SUPPORT FOR IDLE NODES (optional) #SuspendProgram= #ResumeProgram= #SuspendTimeout= #ResumeTimeout= #ResumeRate= #SuspendExcNodes= #SuspendExcParts= #Suspendrate= #SuspendTime= # # # COmpuTE NODES NodeName=Debian64 cpus=1 RealMemory=744 CoresPerSocket=1 ThreadsPerCore=1 State=UNKNowN PartitionName=debug Nodes=Debian64 Default=YES MaxTime=INFINITE State=UP
所以…我们在这里有一个现有的集群,但是它运行的是一个较旧的Ubuntu版本,与运行17.04的工作站没有很好的配合。
所以在我的工作站上,我只是确定我slurmctld (后端)和slurmd安装,然后设置一个简单的slurm.conf
ControlMachine=myBox # ... NodeName=DEFAULT cpus=4 RealMemory=4000 Tmpdisk=50000 State=UNKNowN NodeName=myBox cpus=4 RealMemory=16000
之后我重新启动slurmcltd ,然后slurmd 。 现在一切都很好:
root@myBox:/etc/slurm-llnl$ sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST demo up infinite 1 idle myBox root@myBox:/etc/slurm-llnl$
这是一个退化的设置,我们真正的设置有dev和prod机器和适当的分区的组合。 但是这应该回答你的“可以后台真的是客户端”的问题。 另外,我的机器不是真的叫myBox但在任何情况下都不是真正的问题。
使用Ubuntu 17.04,所有股票,与munge沟通(这是默认情况下)。
编辑 :机智:
me@myBox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^ii ii slurm-client 16.05.9-1ubun amd64 SLURM client side commands ii slurm-wlm-basic- 16.05.9-1ubun amd64 SLURM basic plugins ii slurmctld 16.05.9-1ubun amd64 SLURM central management daemon ii slurmd 16.05.9-1ubun amd64 SLURM compute node daemon me@myBox:~$
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。