2019年尾声,国际芯片巨头英伟达、英特尔、AMD等在高性能计算(HPC)上新动作连连,升级市场竞争,在本周举办2019国际超级计算大会(SC19)上,芯片巨头们便展开了正面交锋。
巨头们认为,随着人工智能时代的到来和数据科学的爆发,HPC市场的增长趋势将不容忽视,必先占领高地。
(来源:英伟达)
英伟达宣布几项重要动作,以推进HPC上的布局:包括发布一款参考设计平台,将CUDA加速带入到Arm架构当中,帮助企业能够快速构建GPU加速的Arm服务器;和微软合作构建搭载在Microsoft Azure云上的新型GPU加速超级计算机,将超快的计算能力带到了Azure系统;推出软件套件Magnum IO,专为解决存储和输入/输出(I/O)遇到瓶颈这一问题进行了优化,可以更好地帮助数据科学家和AI研究人员解决数据瓶颈问题。
据介绍,此次发布的全新NDv2实例是Azure上规模最大的一次部署,该产品专为处理要求苛刻的AI和高性能计算应用而设计,是全球速度最快的超级计算机之一,可在一个Mellanox InfiniBand后端网络上提供多达800个互联的NVIDIA V100 Tensor Core GPU。
另外,对于用户来说,他们将可以在自己的桌面中租用整台AI超级计算机,其性能与那些需要数月时间才能完成部署的大型本地超级计算机相匹配。
英伟达副总裁兼加速计算总经理Ian Buck表示:“这款在Microsoft Azure上推出的新产品实现了AI的大众化,使更多人能够获得基础工具,来解决一些全球最大的挑战。”
(来源:英伟达)
而英伟达CEO黄仁勋称:“高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,英伟达GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。”
同样在SC19的场合上,英特尔也高调宣布其推出的首款为高性能计算设计的GPU。英特尔推出的“Ponte Vecchio”,是一款专为高性能计算建模、模拟工作任务和人工智能训练而设计的GPU,将基于英特尔新一代7纳米工艺进行制造。
(来源:英特尔)
与英伟达的CUDA接口类似,英特尔还推出了面向开发者的onEAPI编程接口,以帮助开发者实现跨不同计算体系结构的软件开发。
Ponte Vecchio有望整合到美国能源部(DOE)计划于2021交付的下一代百亿亿次超级计算机Aurora中。据称Aurora配备了两个Intel Xeon Sapphire Rapids处理器和六个Intel Xe Ponte Vecchio图形卡。
今年以来,AMD在高性能计算领域也吸引了一些新客户,包括将负责打造世界最强超级计算机之一Frontier(同样于2021年交付),以及亚马逊AWS正在扩大AMD Epyc处理器使用规模。在SC19上,AMD同样宣布将超算能力带到云上,将推出两个新的Amazon Elastic Compute Cloud(Amazon EC2)计算优化实例。
如今,GPU在这些大型计算机中越来越重要,正在成为完成大型计算任务的必需品。近日发布的最新一期全球超级计算机榜单top 500也显示,有越来越多的超级计算机系统都配备了图形处理加速芯片。
最新一期TOP 500榜单,美国超算的整体性能仍是第一,中国在数量上的领先优势进一步扩大
目前,全球排在前4位的超算为:橡树岭国家实验室的IBM超算Summit运算速度148.6 petaflops;劳伦斯利物莫国家实验室的IBM超算Sierra运算速度94.6 petaflops,中国的神威太湖之光第三运算速度93 petaflops;天河二号A以61.4 petaflops排名第四。
Wells Fargo分析师在一份报告中写道:“随着核心增速的放缓,2019年11月的排行榜再次凸显了GPU在保持计算机性能增长方面日益重要的作用,行业可以通过增加加速器的使用来保持计算机性能提升,目前加速器占所有部署核心的27%,而2018年11月这一比例为24%。”