开启辅助访问 切换到窄版

打印 上一主题 下一主题

AMD为何成为超算应用“新势力”?

[复制链接]
作者:xubo鹤 
版块:
MCU单片机技术 ARM 发布时间:2020-7-2 22:33:50
9600
楼主
跳转到指定楼层
| 只看该作者 回帖奖励 |倒序浏览 |阅读模式
日前,第55届全球超级计算机TOP500榜单的发布再一次牵动了业界的神经。
TOP500榜单一直被视为超算乃至整个IT产业发展的风向标。因为超级计算机的特殊性,无论是各国还是各家公司都将自己最领先、最强大的技术应用于此,这种基于技术的良性竞争也加速了产业技术、应用的不断进步。

最新榜单TOP10(标黄为新上榜系统)
因此,每一届榜单的TOP10竞争尤为激烈,也一直保持在30%甚至40%的更替率。这一次,除了冠军从领先多年的美国Summit换成日本Fugaku之外,包括排名第六的HPC5、排名第七Selene乃至排名第九的Maroni-100都是全新上榜的系统,也说明TOP10经历了一场“大换血”。

目前世界排名第一的Fugaku超算
冠军一直是引人瞩目的,特别是这次的冠军Fugaku完全基于ARM平台更是引起了业界的惊呼,甚至有人喊出了“ARM替代”的说法。但其实,这种说法完全是误读。如果看过整个TOP500榜单就会发现,其中x86平台依然占据481套之多,处于绝对主导地位。其实一直以来,TOP500榜单都融合了x86、ARM、Power等多种架构,但是这一次Fugaku夺得冠军并非是ARM的胜利,更多是代表了日本设计与工匠精神的胜利。

说到x86架构,其实这次上榜的四套新系统中,排名第七的Selene更值得我们关注,因为这是一款基于AMD平台的超级计算机,更因为它采用的是基于ZEN2架构的AMD EPYC 7742处理器,这也是AMD在2012年借助Titan赢得TOP500冠军之后,时隔8年获得的最佳成绩。
在此之前,基于AMD平台的最好成绩是第54届全球超算TOP500榜单中,来自于法国原子能委员会研究中心的超级计算机“JOLIOT-CURIEROME”,它的排名是第59位。从第59到第7位,仅仅半年的实现AMD就实现了如此巨大的跨越,不得不说这与业界的关注与广泛采用是分不开的,也说明AMD ZEN2一路走来都是靠实力,赢得没有半分侥幸。

说到实力,AMD EPYC 7742处理器依然是目前核心数量最多的x86架构处理器。得益于7nm工艺,AMD EPYC 7742处理器最高可以支持64个核心,这也就代表着在单位的空间密度内,AMD可以提供超过竞争对手一倍的核心数量,也带来了成倍的性能提升。如此一来,那些超算平台的大规模应用也就更能够流畅的运行,并且在最短的时间内输出结果。

采用AMD平台的E级超级计算机Frontier
正如我们前面提到的,在全新的ZEN2架构推出之后,AMD处理器多核心、高性能的优势就被超算领域所看重,并迅速被应用于超级计算机的研发中。因此,这次AMD平台的Selene超算入围TOP10可谓是众望所归。其实美国能源部早就安排在未来三大E级超算中,有两套(Frontier、El Capitan)都基于AMD平台实现,包括采用AMD提供的CPU和GPU等全套设备,这从侧面印证了AMD在性能与市场上的双重成功。
其实除了Selene超算之外,其他几套基于AMD平台的系统也有不错的排名:
第30名,Belenos——是法国气象局的两台BullSequana XH2000超级计算机之一,由第二代AMD EPYC处理器提供动力。

JOLIOT-CURIEROME超级计算机
第34名,Joliot-Curie——这个我们刚刚提到过,是来自法国国家高性能计算组织GENCI,利用基于第二代AMD EPYC处理器的BullSequana XH2000系统重新提交后实现了更高的排名。排名升级也说明这套系统在最近半年又得到升级或者优化。
第48名,Mahti——来自芬兰科学信息技术中心(Finland’s Center for Science Information Technology),是一台搭载第二代AMD EPYC处理器的BullSequana XH2000超级计算机。
一直以来,欧洲的超算用户规模都不大,受限于能源和规划,他们不太可能与美国或者中国这样建造大型的超级计算机,但是欧洲人是以软件和应用见长的,上述我们列举的几款超算也都是各自领域的应用精英。借助于AMD ZEN2平台,这些超算在性能上都获得了飞跃,同时得益于x86架构的生态系统,使得超算中心或者用户不需要繁重的代码迁移工作,大大提升了效率,降低了成本。
如今的AMD在欧洲已经得到了用户的充分认可与支持,据悉全球最大的粒子物理实验室欧洲核子研究组织(CERN)也在近期选择使用第二代AMD EPYC处理器来处理其最新的大型强子对撞机(LHC)实验中的大量数据,以利用这些数据快速检测被称为美夸克的亚原子粒子。

一直以来,大型强子对撞机(LHC)都被认为是物理学特别是高能物理科研的“大杀器”,每一次进行对撞研究都会产生大量的数据,通过对这些分析就可以帮助我们更好的了解微观世界。但是在以往的数据分析中,受限于计算能力的问题,科学家们不得不等待数据分析结果的产生。
而如今借助于第二代AMD EPYC处理器,这种等待的过程明显缩短了。借助AMD平台在x86架构上特有的PCIe 4.0传输通道,数据分析可以实现更快的传输效率。同时得益于DDR4内存速度和64核的AMD EPYC 7742处理器,研究人员每秒都可以接收来自于LHC发生的40TB原始数据流,这个效率相比以往可以用“飞跃”两个字来形容。
伴随着云计算应用的普及,超算云化也是业界不可阻挡的趋势,无论是超算云还是云超算,在本质上都是将超算能力放之云平台,并提供给广大用户。借助于云的广泛性,超算也迎来了新的发展,同时也让算力得到最大限度的发挥。
但受限于计费模式的困扰,业界目前都采用核心/小时的收费模式(即“核时”),而以往处理器核心数量不足也造成了超算中心服务能力的降低。于是,许多云服务商都将目标转移到AMD ZEN2平台上来。正因为第二代AMDEPYC处理器可以提供高达64个物理核心,也就意味着最多可以实现64个虚拟机或容器,自然也为云服务商提供了最大化的虚拟化能力。

这些核心的具体表现如何呢?根据SPEC测试平台公布的VMMARK 3VIRTUALIZATION测试项目结果,第二代AMD EPYC处理器平台以12.78的成绩获得了第一名,超过竞争对手41.6%,这也就意味着如果进行超算云应用的话,基于第二代AMD EPYC处理器所搭建的虚拟机能够提供41.6%的性能优势,再加上专业团队的调优,甚至可以达到原有性能的200%以上。
这也解释了为什么AMD ZEN2平台去年刚刚发布就赢得了众多超算中心的应用,也解释了为什么AMD ZEN2平台能够入围TOP10榜单,更解释了为什么美国能源局能够放手将两大E级超算授权AMD平台。这背后,是对AMD在技术发展和产品能力的无限信任,也是对AMD公司发展的长期看好。
更多的处理器核心,更强的计算性能,更适用的生态系统,这就是AMD ZEN2为整个超算行业带来的应用体验,同时也是AMD能够赢得业界肯定的关键性所在。如今,AMD还在与AWS、Google等一众云服务商开展更紧密的合作,帮助行业领导者在HPC和云计算新时代不断创新记录。
未来,AMD平台正为产业打开超算应用的新世界。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表