应用介绍
Mellanox HPC-X 是一个综合软件包,其中包括MPI和SHMEM通信库。 HPC-X还包括各种加速程序包,以改善运行在这些库之上的应用程序的性能和可伸缩性,包括UCX(统一通信X),该程序可加速底层的发送/接收(或放置/获取)消息。 它还包括HCOLL,它可以加速MPI / PGAS语言使用的基本的集合操作。
为了满足科学研究和工程仿真的需求,超级计算机正以无懈可击的速度增长。随着超级计算机的大小从数千个处理器内核增加到数十万个,新的性能和可伸缩性挑战已经出现。过去,并行应用程序的性能调整可以通过分别优化其算法,通信和计算方面来轻松实现。但是,随着系统继续扩展到更大的机器,这些问题变得更加复杂,必须全面解决。集体通信执行全局通信操作以耦合系统中的所有进程/节点,因此必须尽快且高效地执行。实际上,大多数科学和工程应用程序的可伸缩性都受所采用的集体例程的可伸缩性和性能的约束。当前,大多数集体操作的实现都会受到极端规模的系统噪声的影响(系统噪声会通过放大集体进行过程中随机发生的小的OS中断的影响来增加集体操作的延迟。)此外,集体操作会消耗一个CPU周期的很大一部分,这些周期最好用于进行有意义的计算。 Mellanox Technologies通过将通信卸载到主机通道适配器(HCA)和交换机,解决了这两个问题,即CPU周期损失和性能受系统噪声影响而损失。 SHARP(可伸缩分层聚合和缩减协议)和CORE-Direct®(集体卸载资源引擎)的技术提供了可用于处理集体操作的最先进解决方案,从而确保了最大的可扩展性,最小的CPU开销,并提供了重叠通信的能力通过计算进行的操作允许应用程序最大化异步通信。此外,HCOLL还支持构建运行时可配置的分层集合体。 HCOLL利用硬件多播功能来加速集体操作。在HCOLL中,充分利用了“ ucx_p2p” BCOL形式的UCX点对点库的性能和可伸缩性。这使用户可以透明地并以最小的努力利用Mellanox硬件卸载。 HCOLL是一个独立的库,可以集成到任何MPI或PGAS运行时中。当前已将对HCOLL的支持集成到Open MPI 1.7.4及更高版本中。 HCOLL版本当前支持“ Allgather”,“ Allgatherv”,“ Allreduce”,“ AlltoAll”,“ AlltoAllv”,“ Barrier”和“ Bcast”的阻塞和非阻塞变体。
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处: apollocode » HPC-X 2.7
文件列表(部分)
名称 | 大小 | 修改日期 |
---|---|---|
Nvidia® Mellanox HPC-X® Software Toolkit__11_15_2020.pdf | 382.36 KB | 2020-11-15 |
发表评论 取消回复