我们软件在非 lsf、slurm 等调度软件的环境中,在运行时会用到一批服务器,比如 100 台,每四台一组,每一组的这四台服务器之间通过定义好的端口进行 tcp 通信。
问题:
1. 是否可以将以上的场景用 lsf、slurm 这样的调度软件进行调度,比如是否可以实现,四台服务器通过调度软件来进行组合?或者有没有其他更好的方案来最大化的利用服务器资源?
2. 加入某一个节点上出错,其他节点是否还会继续运行,如果修正错误后,是否可以不用全部从头再来跑一次?
3. 通过调度软件按照四台一组的方式进行组合之后,每一个组都有自己的任务,在调度的过程中会不会把不属于当前组的任务给调度过来?
根据以上问题,可以给出一个调度方案。可以留下您的联系方式,电话沟通。
该外包需求信息来源于站外平台,本站仅提供公开信息部分字段展示与订阅服务,更多请查看免责声明。