一种ARM处理器面向高性能计算的性能评估
应用介绍
为探索ARM 架构在高效能“绿色计算”领域中,面向高性能计算的应用价值,对一款ARM 指令集处理器进行性能评估,并将其与主流商用处理器Intel Xeon 进行性能对比。在微架构上,测试了该处理器的浮点数计算能力、访存带宽及延迟。实验结果显示,该处理器的双精度浮点计算能力约为475 GFLOPS,相较于Xeon E5-2680v3,低了33%,访存带宽约为105 GB/s,优于Xeon 平台。在应用层面,选取4 个高性能计算领域的典型应用,包含Stencil 并行计算方法等,在该处理器实现移植和编译,并采用线程绑定的运行方法,提升缓存局部性,优化计算性能。实验结果显示,ARM 指令集处理器的应用移植简单,其优化思路与主流商用处理器(如Intel Xeon)类似,但在计算密集和随机访存型应用上存在提升空间,在Stencil 应用上性能近似,结合低功耗特点,在“绿色计算”领域具有竞争力。后续将持续基于最新的ARM 指令集芯片做相关研究。
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处: apollocode » 一种ARM处理器面向高性能计算的性能评估
文件列表(部分)
名称 | 大小 | 修改日期 |
---|---|---|
一种ARM处理器面向高性能计算的性能评估.pdf | 2,863.77 KB | 2020-07-13 |
发表评论 取消回复