您现在的位置: 主页 > 资讯 > intel英特尔&微软Microsoft > 如何看待这个19岁少年想做出在目前Intel的同等计算性能下降低80%
本文所属标签:
为本文创立个标签吧:

如何看待这个19岁少年想做出在目前Intel的同等计算性能下降低80%

来源:net 网络用户发布,如有版权联系网管删除 2018-07-15 

我去!居然有这个问题!必须我来答!!!!

因为机缘巧合,我和新闻中这个少年的创业公司一起工作了两周,对他们的思路也算有一定了解。

事情是这样的,这个少年在某学术会议上发言,由于思路和我导师比较相近,就被引荐给了我导师。由于我导师对memory方面很在行,而他们的长处在于微处理器架构,于是就导师把他们邀请到我们课题组工作了两周,双方取长补短。新闻中的这个Thomas和他的CTO Paul两个人过来的。他们昨天的飞机刚飞回加州,这两周有不少有意思的事儿,暂且不表。先认真答题。

首先他们的Target是High Performance Computing(高性能计算,以下简称HPC,主要应用于超算),而不是我们日常用的General Purpose Computing(通用计算)。而HPC这个领域做芯片的一大优势,就是很少用考虑向前的兼容性(对比于x86),而且可以针对大多数HPC应用的特点对架构进行特别的优化。夸张点说,就是根据软件的行为设计硬件,砍掉一切不需要的部件,从而达到效率最大化。另外他们所说的指标,应该是从系统层面来比较的,而非单个芯片进行比较

下面根据他们公开过的资料说一下他们一些独特的思路。

  • 采用VLIW (Very Long Instruction Word)架构。简单来说就是几条并行的流水线,可以同时执行多条指令。由于超算应用中有大量的并行运算(矩阵向量运算等),因此非常适合并行化,采用VLIW流水线利用率比较高。相比于multi-issue,out of order的通用芯片,硬件逻辑可以更简单。很多DSP芯片都是采用VLIW架构,可以达到很高的(浮点)性能功耗比,已经完爆现在的Intel产品了,但要让他们跑Windows什么的一样抓瞎。。所以题主在这里用Intel的芯片和VLIW架构比较是不太恰当的,毕竟设计目的不一样,就好像比较超跑和拖拉机哪个更好一样。。耕地当然用拖拉机了~~
  • 完全摆脱虚拟内存!这个听起来好像疯了,但其实在超算领域反而make sense,因为超算一般一次只跑一个程序,或者很少的程序,很少需要context switching。因此一个地址空间够用了。而传统的通用芯片因为支持虚拟内存,不知要做多少无用功。去掉虚拟内存和paging,硬件上就不用TLB了,系统层面也不用再不停维护page table了。这是很大的开销,尤其是超算集群,相互访问内存是很麻烦的。
  • 砍掉Cache,采用软件管理Scratchpad Memory。这个听起来也是疯了。。传统的芯片都是有Cache的,cache miss和coherence是架构设计者永远的痛。而超算领域,写超算应用的人一般都是知道自己在干嘛(know what they're doing)。于是他们的芯片里会有一部分访问速度会很快的Scratchpad Memory代替cache,但只不过是由程序员手动管理而非交给硬件管理的。这样也可以砍掉相当多的硬件电路,效率也更高。
  • 采用2D-Mesh,static routed网络。这一点是他们的初始思路,但讨论过后发现可能会有问题,所以他们现在其实也还不是很确定以后会不会这么做。所以这点也不展开了。

如果以上几点能做到的话,比现在采用Intel CPU+Nvdia GPU的超算超算省电真心不是一点半点。当然他们的思路比较激进,不知道后面会遇到怎么样的问题,不过现在看来还是很可行的。

最后默默感叹一下,虽然这两位少年都很谦虚且平易近人,但是那种智商和能力上的碾压让我真正体会到了人和狗的差距T T

              查看评论 回复



嵌入式交流网主页 > 资讯 > intel英特尔&微软Microsoft > 如何看待这个19岁少年想做出在目前Intel的同等计算性能下降低80%
 芯片 这个 他们

"如何看待这个19岁少年想做出在目前Intel的同等计算性能下降低80%"的相关文章

网站地图

围观()