InfiniBand集群可视化监控系统的研究与实现

集群是近年来发展迅速的一种高性能计算机解决方案,可用于科学计算、负 载均衡服务器和海量存储等,在国防、航天、气象、石油、地质及科研等领域均 有广泛应用。集群的构建方式非常灵活,不同结构的计算机如普通的PC机或者 专用服务器都可以作为节点机使用。而对网络系统的选取也有多种方式,从百兆 以太网,发展到千兆以太网、Myrinet,到目前带宽可达20G的hifiniBnad无限带 宽网络,都可以作为集群理想的互连方式

应用介绍

集群是近年来发展迅速的一种高性能计算机解决方案,可用于科学计算、负

载均衡服务器和海量存储等,在国防、航天、气象、石油、地质及科研等领域均

有广泛应用。集群的构建方式非常灵活,不同结构的计算机如普通的PC机或者

专用服务器都可以作为节点机使用。而对网络系统的选取也有多种方式,从百兆

以太网,发展到千兆以太网、Myrinet,到目前带宽可达20G的hifiniBnad无限带

宽网络,都可以作为集群理想的互连方式。

集群的构建除了节点机、网络与存储设备等主要硬件之外,软件配置与对软

件的二次开发是极其重要的工作,它将直接影响到系统的运行效率。MPI和PVM

函数库是目前集群用于高性能科学计算的基本软件之一,而尤为重要的是集群的

系统监控软件。虽然BIM和HP等大公司都提供了与自己集群产品捆绑销售的监

控软件,但它们往往并不适用于其它厂商的产品,尤其是用户自己构建的集群。

这就需要我们去开发更适合我们自己集群特点并且可移植性和可扩展性较好的

集群监控软件。

PC集群系统的成本低,并行程序设计也是目前炙手可热得程序设计方法,

很多计算己经抛弃了低效的串行化设计,改为可在集群上高效运行的并行设计,

但是如何得知集群系统和并行软件的运行情况是否与预期的效果一致,就需要借

助于监控软件的监测和控制,在这一方面,集群发展较早的国家研发了不少各色

各样的监测系统,国内外市场上,象BIM、HP、曙光这样的集群供应商推出的

大型集群系统也都配备了比较完善的监控系统,但通常其绑定价格都比较高,普

通的集群用户难于接受,并且这些工具也多为专门的硬件系统开发,并不通用。

本文根据目前监控系统的发展趋势,设计三层结构的监控系统,介绍了集群

监控系统的基本内容和基本步骤,根据nIfiniBnad集群的系统结构,设计监控系

统数据收集法,结合目前的应用状况,分析集群系统安全监控的策略和方向,结

合实际设计实现窗口界面和图形方式显示检测结果的可视化监控,并介绍W七b监

控实现方法。研究结果适用于大多数PC机构建的集群系统和网格,监测结果有

助于集群系统的升级和改造,并且对需要在固定集群上运行的并行程序的设计提

出合理的设计要求,对集群使用的透明性、改进用户的并行程序运行效率以及方

便集群管理员管理集群和用户使用集群等方面都有着重要意义。

文件列表(部分)

名称 大小 修改日期
InfiniBand集群可视化监控系统的研究与实现_陈荟慧.caj2,588.06 KB2019-01-06

立即下载

相关下载

[InfiniBand集群可视化监控系统的研究与实现] 集群是近年来发展迅速的一种高性能计算机解决方案,可用于科学计算、负 载均衡服务器和海量存储等,在国防、航天、气象、石油、地质及科研等领域均 有广泛应用。集群的构建方式非常灵活,不同结构的计算机如普通的PC机或者 专用服务器都可以作为节点机使用。而对网络系统的选取也有多种方式,从百兆 以太网,发展到千兆以太网、Myrinet,到目前带宽可达20G的hifiniBnad无限带 宽网络,都可以作为集群理想的互连方式

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部