嵌入式开发交流网论坛

标题: 【硬件资讯】这位朋友,你听说过黄家刀吗?Nvidia首发A100并非完整版,老黄 ... [打印本页]

作者: 先知的失误    时间: 2020-5-19 05:26
标题: 【硬件资讯】这位朋友,你听说过黄家刀吗?Nvidia首发A100并非完整版,老黄 ...
新闻1:黄氏刀法 眼花缭乱 NVIDIA官方确认7nm安培首发割了一刀
近日,NVIDIA正式揭晓了全新一代GPU架构“安培”(Ampere),其庞大的规模、精妙的架构令人惊叹,同时不出意外、一如既往,首发核心又被割了一刀。首先需要注意的是,不同于此前首发帕斯卡架构的Tesla P100、伏特架构的Tesla V100,这次的新计算卡被简单地叫做“A100”,并没有冠以Tesla的品牌序列,具体原因不详,可能是想用于更广泛领域。
与此同时,新的核心则被叫做“A100 Tensor Core GPU”,突出张量核心的关键作用,而核心代号按惯例延续为GA100。
GA100设计了8组GPC(GPU处理集群),每一组GPC里又分为8组TPC(纹理处理集群),而每组又分为两组SM(流式多处理器),然后每组SM包含64个FP32 CUDA核心(流处理器)。
[attach]43579[/attach]
这样一来,一颗完整的GA100芯片就一共有128组SM、8196个流处理器,而这种分组结构和以往的NVIDIA GPU架构是一致的。
同时,每一组SM里还有4个第三代Tensor核心,整颗芯片内共计512个,外部则搭配六颗HBM2显存,每颗8GB,12个512-bit控制器,总位宽6144-bit。
另外,二级缓存从6MB猛增至40MB,每组SM单元的共享内存从最多96KB增至164KB、寄存器容量还是256KB,但整颗芯片寄存器达到27MB。
GA100芯片采用台积电第一代7nm(N7)工艺制造,核心面积达826平方毫米,相比上代12nm GV100仅增大了11平方毫米(0.13%),但晶体管数量从211亿个猛增至542亿个,多了接近1.6倍,同时功耗控制在400W(增加33%),可见新架构和新工艺的威力。
如此庞大的核心在量产初期显然会受制于良品率问题,所以实际使用的A100核心未达成完整规格,但和以往简单屏蔽整组计算单元不同,这次砍得略有些复杂。
GPC单元屏蔽了整整一组,但剩余的也并未全部开启,其中两组GPC也各自屏蔽了一个TPC(两组SM),导致总的SM单元为108个、流处理器为6912个、Tensor核心为432个。
核心加速频率1410MHz,比前两代其实都低了,但整体性能在飞跃。
显存也没有逃过刀法,只开启了五组HBM2,所以总容量为40GB,总位宽为5120-bit,频率1215MHz,带宽1555GB/s,比上代增加73%。
[attach]43580[/attach]
具体到每个SM单元,其中的Tensor核心数量虽然从8个减少到4个,但每一个每时钟周期都支持多达256个FP16FP FMA操作,合计就是1024个,相比伏特、图灵架构翻了一番。
新的Tensor核心还支持对所有数据类型加速,包括FP16、BF16、TF32、FP64、INT8、INT4、Binary。
更精细的专业细节这里就不展开了,你们也没啥兴趣。
[attach]43581[/attach]
[attach]43582[/attach]
三代架构首发核心规模对比
转自:http://www.cnbeta.com/articles/tech/980237.htm

这神奇的刀法……其实我们都是先入为主了,认为Nvidia第一时间首发的安培GPU总不会是阉割版,而且GA100这个核心代号又确确实实是属于完整大核心的。我们也说过,之后游戏卡的GA102、104这些也会是GA100的变体,但很显然GA100的挨刀之旅最初就已经开始……现在想来老黄的预热视频就是在厨房拍摄的,这是不是早有预谋呢?亦或者Nvidia特地留了一手,未来会在某个场合公开完整版的GA100核心?还是让我们静观其变吧!
新闻2:ARM笔记本即将支持x64代码,微软的Surface Pro X将更具竞争力微软在去年国庆假期期间更新了旗下搭载ARM处理器的二合一笔记本产品Surface Pro X,上一款应该是2013年推出的Surface 2(Nvidia Tegra 4)。微软Surface Pro X搭载基于高通骁龙8cx处理器定制的Surface SQ1处理器,集成了AI加速器,功率由ARM处理器通常的2W提升到7W,集成重新设计的GPU。
[attach]43583[/attach]
对于微软的Surface Pro X笔记本产品,它运行的是Windows 10 ARM。对于普通消费者来说,如果它被定义为一款笔记本产品,那么我们就会默认它是能够运行所有Win32程序的。其实不然,由于Windows 10 ARM的Win32仿真环境不完善,在这款产品上是无法运行x64代码的,而一些性能要求更高的游戏,基本上就不用指望了。
但是,Windows 10 ARM的仿真环境可能马上就会迎来升级,解决无法运行x64代码的问题。微软已经在GitHub上提交了新的代码,明确指出ARM64设备对于x64代码的仿真支持。微软Windows团队工程师Kenny Kerr在今年3月份在GitHub提交了相关分支,在ARM64上运行的仿真器增加支持x64代码,被称为ARM64EC。
其实微软在今年3月份的时候就提交了新的代码,但是直到最近才有Twitter用户Longhorn发现。微软在ARM64仿真环境上所取得的工作进展,意味着ARM笔记本将具备更多的能力,和英特尔处理器设备竞争的优势会有所提升。同时,这也意味着搭载ARM处理器的Surface Pro X能够用在更多的场景下。
转自:http://www.expreview.com/74256.html
ARM处理器在一些方面上确实要比X86强上一些,包括网络的续航、蜂窝网络的支持,以及更低的功耗。但是在应用生态上……虽然说是在使用完整版的Win10系统,但是应用的表现真是不敢恭维,Win10的UWP应用几乎完蛋,主流的EXE程序又大多在向64位程序转移,对于仅支持的32位程序,支持性也不算很完美……不过,Win10 For ARM也即将支持X64程序了,这对其应用生态的改善还是有一些帮助的,但就连先前的32位程序的支持性都不算完美,64位的话……还是期待微软更进一步的完善吧……
新闻3:中国长城:推出我国首台半导体激光隐形晶圆切割机 中国长城科技集团股份有限公司(以下简称中国长城)近日宣布,旗下郑州轨道交通信息技术研究院和河南通用智能装备有限公司科研人员历时一年联合攻关最终实现了最佳光波和切割工艺,成功研制我国首台半导体激光隐形晶圆切割机,填补国内空白,打破相关装备依赖进口的局面,在关键性能参数上处于国际领先水平。
根据中国长城介绍,晶圆切割是半导体封测工艺中不可或缺的关键工序。中国长城副总裁、郑州轨交院院长刘振宇介绍,与传统的切割方式相比,激光切割属于非接触式加工,可以避免对晶体硅表面造成损伤,并且具有加工精度高、加工效率高等特点,可以大幅提升芯片生产制造的质量、效率、效益。
中国长城介绍称,该装备通过采用特殊材料、特殊结构设计、特殊运动平台,可以实现加工平台在高速运动时保持高稳定性、高精度,运动速度可达 500mm/S ,效率远高于国外设备。在光学方面,根据单晶硅的光谱特性,结合工业激光的应用水平,采用了合适的波长、总功率、脉宽和重频的激光器,最终实现了隐形切割。
在影像方面,采用不同像素尺寸、不同感光芯片的相机,配以不同功效的镜头,实现了产品轮廓识别及低倍、中倍和高倍的水平调整。该装备还搭载了同轴影像系统,可以确保切割中效果的实时确认和优化,实现最佳切割效果。
转自:http://www.expreview.com/74263.html
还是我们昨天谈到的问题,美方新的出口管制对于我们现在的半导体芯片发展影响会很大,这种情况下我们更需要尽快的自给自足。而在不久之前的全球十大封测厂排名中,我国厂商占据三席之位,自主的激光晶圆切割机意义会非常大。现在看来我们的半导体芯片发展真的可以算是如有神助,在这个阶段美方突然加强技术封锁不知道是福是祸,一方面会激励自主研发的进程,另一方面又对一些依赖授权与代工的项目造成了不小的影响,或许这就是中国芯的机遇与挑战吧!
大问题↓


欢迎加入电脑吧官方四群:808157532。
欢迎电脑吧二手硬件交流群:1079537679。
关注B站@电脑吧评测室,@翼王或微博@渐缜JZ,@DDAA117
备注

文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。




欢迎光临 嵌入式开发交流网论坛 (http://www.dianzixuexi.com/bbs/) Powered by Discuz! X3.2