ARM风袭来!盘点那些基于ARM架构的服务器厂商-嵌入式-
在美国加州举办的Arm TechCon 2018技术峰会上,Arm公司正式发布了面向全球合作伙伴的ServerReady服务器认证计划。近年来,Arm与完整的基础设施供应链合作,包括芯片供应商,独立固件供应商,操作系统和虚拟机管理程序供应商,OEM,ODM,独立硬件供应商和云基础设施供应商。 Arm与合作伙伴共同定义了服务器基础架构规范(Server Base System Architecture - SBSA)中的最低硬件要求,以及服务器基本启动需求(Server Base Boot Requirements - SBBR)规范中的最低固件要求,并尽可能利用行业标准和创建新的Arm规范,以实现互操作性。Arm ServerReady服务器认证计划旨在帮助用户安全、合规地部署Arm服务器系统。该计划所涉及的标准操作系统引导和架构合规性套件(ACS),将由供应商自主或在Arm支持团队的协助下运行。通过ACS的服务器被授予Arm ServerReady证书。
下面我们来盘点一下基于ARM的服务器厂商
华芯通
华芯通第一代服务器处理器昇龙4800 (StarDragon 4800)已在今年5月的 “数博会”期间正式亮相,产品将于今年年底前投入市场。昇龙4800是兼容ARMv8架构的48核处理器芯片,采用目前国际上最先进的10纳米工艺,在性能上媲美国际市场中高端服务器主流芯片产品水平。此外,产品携带遵照我国“商用密码算法”标准开发的密码模块及软件解决方案,在保证产品高性能、低功耗特点的同时,大大提高了应用中的系统安全性及可控性。华芯通正在针对智慧城市、大数据应用、高性能计算、安全应用方案、云计算和云存储等核心应用进行拓展,持续推动ARM服务器解决方案在多个领域的应用部署。
此外,由北京东大金智推出的基于华芯通昇龙4800处理器的FM-A5460S高性能服务器,以及由UIT创新科推出的搭载华芯通昇龙4800处理器的DCServer H2000,均成功通过Arm ServerReady服务器认证计划,成为全球首批、国内最早获得此认证的整机厂商。
Kaleao推出基于ARM的服务器Kmax
Kaleao是一家开发基于ARM服务器和超融合设备的初创公司,其品牌为KMAX。MAX产品的形式有服务器和应用设备两种。服务器用的是64位兼容ARMv8的CPU(中心处理器)并采用big.LITLE架构,所谓的big.LITLE架构是指ARM的CPU分层形式用了一个或多个用于处理繁重工作负载的强壮内核以及用于处理其他工作的较轻量级内核(因而无需太大的功率)。另外还用到可编程逻辑芯片FPGA,Kaleao称,用到的FPGA“可以创建虚拟功能网卡,用作实际PCI设备。每个虚拟机可以直接将独特的虚拟功能映射为PCI设备,因此每个虚拟机都有可以像虚拟资源一样动态地改变真正的硬件资源。”
Kaleao认为KMAX对于内容交付和存储、网站托管,数据分析、物联网元件等有颇大的意义,另外KMAX亦将在通信基础架构和相应的企业IT架构方面产生影响,这些企业正在考虑从现有的基础架构迁移到基于ARM、OpenStack的基础架构里。
PHYTEC ——ZT Systems// R1801e服务器
PHYTEC于1986年由Karl Neubecker创立,是一个多数股份由家族拥有的企业,同时其少数股份由德国,北美,法国和印度公司的运营部门经理持有。他们的产品已被广泛应用于成千上万个各个工业领域,比如控制与自动化,医疗,测试与测量,汽车,能源,交通运输等等。我们向需要全面产品开发支持的公司提供端到端的解决方案,使得他们能够缩短上市时间,减少开发成本,规避产品开发过程中的设计风险。
R1801e 1U服务器由多达16个ARM Cortex-A9处理器核心来驱动。在满配8个服务器模块,8个SSD,双千兆位以太网开关和IPMI服务器管理的情况下,服务器最大功率仍然只有不到80瓦。作为软件开发平台,这一具有突破性的,可升级的解决方案突出了ARM服务器的巨大的节能潜力。PHYTEC设计开发了基于ST Microelectronics 的SPEAR1810双核Cortex-A9微处理器的服务器模块。
飞腾FT-2000
FT-2000plus这款芯片是以FT2000为基础的改进版本,虽然在单核性能上和Intel还存在一定差距,但在多核性能上,已经达到Intel服务器CPU E5 主流产品的水平。FT-2000采用28nm制造工艺,可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache,扩展支持128MB三级cache。支持16个DDR3-1600存储控制器,可提供204.8GB/s访存带宽。
最新的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz。为了提高集成度,抛弃了L3cache,将DDR4内存控制器集成到了片内。最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降,把集成DDR4等改进带来的提升抹平了,使FT-2000Plus在同主频下与FT-2000的性能相差不大。
诚然,FT-2000/FT-2000plus还是存在一些短板的,比如单线程性能偏弱。无论是FT2000,还是FT-2000plus,虽然在多线程性能上达到了Intel中高端服务器CPU的性能,但在单线程性能上,还是有不小的差距。不过,万事开头难,迄今为止,湖南长城银河公司、湘计海盾公司、航天706所已经推出了基于新一代飞腾微处理器的自主可控产品。
(飞腾CPU整机产品)
ZStack与华芯通合作推出基于ARM国产芯片服务器的云平台
“做轻量、敏捷、产品化的云”,ZStack公司创始人&CEO张鑫与华芯通合作推出基于ARM国产芯片服务器的云平台时还这样说。在2018贵阳“数博会”上,记者亲眼见到、亲手触碰到了世界上最小的基于ARM处理器平台的云计算应用:一台华芯通ARM国产芯片服务器加上ZStack的云平台,上面跑了三个核心应用。需要特别指出的是,记者在华芯通展台和阿里云展台,看到了从核心关键技术、解决方案和实际应用场景等不同侧面所展示的“一台ARM国产芯片服务器一朵云”。眼见为实,张鑫没有“吹牛”。
一台ARM服务器“一朵云”
华芯通在“云上贵州”项目建设中,需要一个既能满足国产化需求,又可以快速交付落地的IaaS平台。核心自主开源、高度产品化的ZStack,因其优秀的自研架构、无缝对接阿里公共云、完整的一体化产品交付等诸多优势,成了华芯通的最佳拍档。如今我们看到的正是由ZStack与华芯通、阿里云携手打造的国内首个可以规模化复制并商用的全国产云平台,包含国产芯片、国产服务器和国产云平台。该方案以“云上贵州大数据精准扶贫云”为开端和突破口,已经在贵州当地的电子政务、精准扶贫等项目中发挥作用。该方案的落地具有标杆性意义,它证明了ARM处理器同样可以胜任在云计算环境中对性能的苛刻要求,同时由国产芯片、国产服务器和国产云平台组成的全国产化的云解决方案是切实可行的。
据了解,下一步还将以ZStack为云平台底座,陆续上线云上贵州门户App、贵州省电子政务网(国产ARM版本)等项目,进一步推动基于华芯通ARM国产芯片服务器在云上贵州系统平台上的大规模商用。
“ZStack是一家轻量、敏捷、高度产品化的云计算公司,简单易用,并支持一体化的产品交付。这是我们选择ZStack的关键原因。”对于为什么选择与ZStack合作,华芯通CEO汪凯博士袒露了心声,“ZStack自主研发的技术架构,契合了华芯通的核心诉求,即快速落地。另外,ZStack新推出的一些产品功能,例如大屏显示等,可以清晰直观地展示IT基础资源的使用状况。以上种种,使得ZStack成了华芯通ARM生态中的关键一环。”
戴尔正式宣布基于ARM架构服务器——Copper
戴尔正式宣布,它已经推出了基于ARM架构的服务器,代号“Copper”。我们知道,x86 CPU的性能要远远超过ARM CPU,而且服务器软件基本都是基于x86架构,ARM在这方面几乎是空白,戴尔为什么要用这么一种看起来很弱小的CPU来搭建服务器呢?答案只有一个字:钱。
x86服务器的搭建成本已经越来越高,一颗英特尔Xeon志强处理器价格就高达数千美元,它的能耗可能高达上百瓦,与之相称的电源、主机板、散热器价格都不会便宜。用这样的处理器来搭建服务器,最终肯定价格不菲。而ARM CPU在这方面就要好得多,戴尔“Copper”单个计算节点(包含CPU、内存、主机板等所有配件)的典型热功耗仅为15瓦特,一个完整的服务器集群功耗很可能小于750W。“Copper”也具备自己的高速总线,节点之间互联性能很强,在戴尔提供的视频里,“Copper”很轻易就构建了一个48节点的计算集群。
此外,体积小巧也是ARM服务器的重要优势,戴尔表示,传统的PC机架里可以放进4个ARM计算节点,总共48计算节点的服务器集群可以塞进一台单一的3U C5000机柜。虽然每一个ARM CPU的运算能力都大大逊色于x86 CPU,但用同样的钱可以买更多的ARM CPU,搭建更多的节点,最终得到相同的性能。而戴尔认为,ARM服务器的每瓦特性能要优于x86服务器,好汉架不住人多就是这个道理。
核心芯片是Marvell's Armada XP 78460 variant.
凭借着Marvell全方位的云服务和基础架构的专业性,Copper 在安全、网络、计算、内存和存储方面实现了集成度最高、平衡度最好的完美结合,大大提升了系统利用率,同时大幅降低运营成本和总拥有成本。随着ARM CPU性能的不断提升,越来越多的客户开始关注ARM技术,基于ARM的服务器正在被业界快速接受并部署。Marvell基于ARM的的ARMADA XP片上系统(SoC)专为企业级云计算应用而设计,为业界首款四核ARM处理器--能将服务器CPU的利用率提升了95%,为服务器虚拟化提供了一个基于需求的扩容选择,从而为数据中心和企业带来更低的功耗、更高效的服务器解决方案,大大节约了成本。[page]
亚马逊云服务AWS推出基于ARM架构的计算服务
得益于采用节能的ARM处理架构服务器芯片,亚马逊云服务AWS推出了更便宜的计算服务。AWS是公共云基础设施的市场领导者,也是第一个推出基于ARM架构计算资源的大型云供应商。微软、谷歌、IBM等其他公司与亚马逊竞相为企业提供公共云基础设施,这些企业通过公共云基础设施存储数据和运行应用程序。尽管亚马逊的大部分营收仍来自商品销售,但AWS已成为该公司财务健康的关键。第三季度,亚马逊超过一半的营业利润来自AWS。亚马逊在线商店的收入本季度同比增长10%,而AWS服务的营收增长了46%。AWS现在有超过125种服务可供客户使用,包括核心的EC2计算服务。
华为自研64核ARM服务器处理器,采用7nm工艺
对于一般人来说提到华为芯片第一反应便是智能手机上的麒麟系列,很多人却并不了解华为服务器,而如今海思半导体已经可以自研ARM架构服务器处理器,最新的Hi1620将用7nm工艺,最多64核,频率达3.0GHz,48核版SPECint性能堪比英特尔Xeon Platium 8180处理器,功耗却低了20%。,后者是英特尔Skylake Scalabe架构的28核56线程处理器。
华为的服务器品牌叫泰山,早在2016年的十二五-科技创新成就展上,华为就展示了Hi1612 ARM架构64位处理器,虽然是自主研发,但并不是自研架构。但是在2018全联接大会上,华为的全栈全场景AI解决方案并且发布两款AI芯片——昇腾910与310正式亮相。据介绍,昇腾910半精度算力达到256 TFLOPS,比目前最强的英伟达V100的125T高出一倍,其最大功耗为350W,采用7nm工艺。昇腾310则主打终端低功耗AI场景,拥有8 TFLOPS半精度计算力,最大功耗为8W,采用12nm工艺。
两款AI芯片均采用自研AI架构达芬奇。此次大会上还发布了华为自研的ARM 处理器Hi1620,据之前报道称Hi1620处理器是基于ARMv8 64位指令集自己研发的架构,使用了当前最先进的7nm工艺打造,支持PCIe 4.0及CCIX,有32核、48核及64核的版本,最高支持2.6/3.0GHz频率。
联想交付Ampere eMAG服务器平台
Ampere推出面向数据中心的第一代Armv8-A 64位处理器。Ampere eMAG处理器已被联想及几家ODM厂商选中,可提供极低的总体拥有成本(TCO)、高性能计算、海量内存和丰富的I/O来支持云工作负载,可应用于大数据、Web层和内存(in-memory)数据库。同时,Ampere还发布了自己的多代技术路线图,包括开发采用7nm工艺的下一代产品——该产品将提供多插槽和单一插槽两种版本,并在2019年正式上市。
Ampere eMAG平台可提供较低的总体拥有成本(TCO),可为大业务量主流服务器和用于边缘、存储和Web应用的服务器提供极具竞争力的边际性能。
32个Ampere设计的ARM v8-A内核,以3.3 GHz的超频(Turbo)模式运行
8个DDR4-2667内存控制器
42个PCIe 3.0通道,支持高带宽I/O
125W的TDP,确保最高的能效
TSMC 16nm FinFET工艺
Cadence基于低功耗、高性能Arm服务器的SoC验证解决方案
在芯片制造之前, SoC芯片功能正确性验证占用了整个项目70%的EDA软件使用资源,这一需求促进了数据中心的增长。运行于ARM服务器的Xcelium仿真可带来功耗显著降低和仿真容量的显著提升,可执行高吞吐和长周期测试,缩减了整个SoC验证的时间和成本。
楷登电子(美国Cadence 公司)与Arm联合发布基于Arm 服务器的Xcelium 并行逻辑仿真平台,这是电子行业内首个低功耗高性能的仿真解决方案。
作为Cadence验证套件(Cadence Verification Suite)的产品之一,Xcelium仿真平台凭借优化的单核仿真和多核仿真技术创新有效提升了运行效率。较之前的仿真软件平台,Xcelium的单核性能提高2倍,多核仿真性能提高3到10倍,缩减了长周期SoC测试程序的时间,缩短产品上市时间。在基于Arm的服务器上运行Xcelium仿真平台可以帮助系统和半导体厂商高效利用服务器核心,满足高阶节点设计对快速验证的需求。另外,Xcelium仿真平台自动分离设计和验证测试平台代码,可在多核服务器上快速并行执行。
基于Arm的服务器搭载运行Xcelium仿真平台所必需的高密度核心,帮助设计师加快验证进度。运行单核工作负载时,它们可以提供更多的内核来执行并行仿真。对于众多长周期测试程序,基于Arm的服务器可以为Xcelium仿真平台的并行仿真任务分配更多的处理器核。Xcelium仿真平台和基于Arm服务器的强强联合可以用于尖端SoC的开发,并减少数据中心的总体成本。
技嘉ThunderXStation,搭载ARM处理器
这款技嘉双槽位的ARMv8工作站系统——ThunderXStation除了处理器架构之外,这个工作站和其他同类设备并没有什么区别—它能够运行单颗或者两颗ThunderX2处理器,并且每颗处理器都支持八通道的DRR4内存。ThunderX2芯片集的强悍之处在于高速输入输出——ThunderXStation具备6个PCIe 3.0卡槽,包括2个Type-1 OCP-compliant x16卡槽,2个由QLigic主控驱动的10-Gigabit Ethernet端口,还可以装载4个NVMe混合磁盘和2个2.5英寸磁。此外,它还配备了GeForce GT710,支持双显示器,并有80 Plus Platinum认证的1600-W电源可供选择。
汇集384个ARM运算核心的技嘉高密度2U服务器
技嘉的MT270-HD0半宽型主板及可容纳4个运算节点的H270-T70 2U机架式服务器搭配了Cavium的ThunderX ARMv8处理器,每个处理器支持48个实体运算核心,让2U 4节点的H270-T70汇聚了高达384个实体运算核心于一身,是市场上第一款适用在Scale-out架构中的ARM产品平台,MT270-HD0及H270-T70可让使用者进行集中管控节点的运作,有利于企业的扩充和配置数据处理中心资源。
MT70-HD0主板搭配了两颗48核心2.5GHz的ThunderX ARMv8处理器,可装配在技嘉的多节点服务器或其他符合OCP规范的系统里。每一片MT70-HD0可提供96个运算核心,支持1TB 2400MHz的DDR4内存,板载2个整合在系统单芯片(SoC)中控制的40Gb/s网络端口,并内建完整的IPMI远程监控功能。低功耗的ARM产品特性,结合了高速内存与网络连接,提供了高密度应用需求,给客户一个无可比拟的高性价比平台。
“没有不需要验证的规范”——Arm ServerReady
随着Arm正是宣布了认证计划——Arm ServerReady,旨在帮助用户放心地部署Arm服务器系统。Arm ServerReady计划所涉及的标准操作系统引导和ACS运行,将由供应商自主或在Arm支持团队的协助下运行,并通过ACS的服务器获授Arm ServerReady证书。
目前,已有多家芯片供应商的系统获得了Arm ServerReady 1.0版证书,包括:Ampere,HXT(华芯通),Marvell和Qualcomm以及ODM Femrice (北京东大金智),Gigabyte(技嘉)和UIT(创新科)。
查看评论 回复