一探究竟!ARM,不仅仅是移动端,还有高端服务器CPU!

2020-05-12 11:33:08浏览:414 来源:萤火工场   
核心摘要:说到ARM,很多人第一反应是在移动端的广泛应用,如手机。全球所有的手机品牌,不管哪一家,包括苹果在内,全部采用ARM架构设计CPU。
 说到ARM,很多人第一反应是在移动端的广泛应用,如手机。全球所有的手机品牌,不管哪一家,包括苹果在内,全部采用ARM架构设计CPU。

ARM是在英国成立的一家公司,早期人员较少,只有十来个工程师,办公场地是在一个谷仓,比较简陋。但是ARM公司的股东比较厉害,包括现在的苹果公司就是他们早期的一个大股东。1990年11月27日,苹果公司出资150万英镑,芯片厂商VLSI出资25万英镑,Acorn(ARM的前身)本身则以150万英镑的知识产权和12名工程师入股。 

1978年12月5日,物理学家赫尔曼·豪泽(Hermann·Hauser)和工程师Chris·Curry,在英国剑桥创办了CPU公司(Cambridge·Processing Unit),主要业务是为当地市场供应电子设备。1979年,CPU公司改名为Acorn公司。这就是ARM公司历史和由来。

ARM采用的指令集是RISC的方式,那为什么不采用像intel那样的复杂指令集(Complex Instruction Set Computing,CISC)呢?毕竟CISC在当时(80、90年代)是较好的指令集,当然现在也是。其实并不是他们不想使用CISC,非要另辟蹊径使用RISC,他们也没有预见几十年之后将会有这么大一个应用市场等着ARM发挥其架构的特殊性(低功耗)。因为在当时ARM采用CISC设计CPU是有门槛的,技术难度高,资金也有限,所以就转而采用相对简单的RISC去设计CPU了。但是早期采用RISC设计的CPU在性能方面和intel采用CISC设计的产品差距很大,所以一度在服务器领域,甚至普通桌面计算机领域都没有ARM的身影。

 

随着市场对高性能、低功耗产品的呼声不断提高,ARM终于开始尝试了,在架构方面自从在ARMv8推出之后,终于有了真正意义上支持64位的架构了,在服务器领域有了应用的希望。而通过合作,ARM合作伙伴们共同加速64位生态系统的开发,在许多情况下,这可视为是对现有支持基ARMv7架构产品的广泛生态系统的自然延伸。

 

对于ARMv8的推出,当时一些巨头是这么评价的:微软总经理KD·Hallman表示:“ARM是微软的一个重要合作伙伴。对于ARM及其所倡导的生态系统,ARM支持64位架构的演进是一个巨大的进步。对于这项技术将能给未来基于ARM的解决方案所带来的提升,我们拭目以待。”

NVIDIA高级副总裁Dan·Vivoli表示:“NVIDIA在功耗效率和高性能处理方面的领先技术与全新的ARMv8架构相结合,将带来革命性的突破,影响到从智能手机到超级计算机在内的计算领域的所有设备。”


早期试水服务器的有华芯通半导体。华芯通成立于2016年1月,由贵州省人民政府与美国芯片巨头高通公司共同出资设立,主要从事ARM服务器技术的设计、开发和销售,面向几乎被英特尔垄断的服务器芯片市场。可惜的是合资公司很快就关门了,具体原因比较敏感国产观察就不细说了,简而言之,国外巨头是绝不会笨到把关键技术真的拱手相送的,这一点国内的ZF招商部门、企业永远需要牢记的!如果有,那就是希望我们不要自己搞了,直接采用他们的,给我们一些现成的,然后我们就失去自我研发的动力了,因为他们会慢慢的输出一点技术,我们一直在他们后面跟,无法突破。

 

回归技术话题,自从ARM支持64位指令集的架构出来之后,跟进的国内外有影响力的巨头就慢慢多了,因为他们从各自业务角度和商业角度考虑,的确希望有这么一款新的,能兼顾性能和能耗的产品出来。这个时候亚马逊出来了,亚马逊这个企业可不仅仅是一个买产品的平台公司,这个公司技术实力属于全球顶尖的,其市值更是在18年突破1万亿美元!推出了亚马逊云等具有远见卓识的革命性IT技术。

 

当然巨头就是巨头,当外部市场或合作伙伴无法满足他们的需求的时候,他们就会自己来,最好的一个例子是苹果!其实苹果最早的时候并没有想到自己去设计手机的,老乔有这么一个想法,想做一个不带按键的手机,于是想到了和第三方合作开发,可惜的是第三方始终无法满足乔布斯的要求,所以一怒之下,乔布斯决定自己来设计!于是有了后来惊天地且后来彻底改变整个手机世界格局的iphone!诺基亚、黑莓一不小心就这么没了。因为好比人类一旦有了电报电话的通信方式,就不会再采用800里加急的骑马送信的方式了。所以一批新兴的科技产品兴起,就意味着一批旧有的产品没落。

苹果改变了手机世界,亚马逊等公司估计要采用ARM技术改变服务器市场规则了,因为这一次亚马逊带来了Graviton2服务器处理器,采用7nm工艺,内部集成惊人的300亿个晶体管!

 

图3:对比图

上图右边是AWS的第一款基于ARM架构的处理器,相比第一代,Graviton2在工艺、性能方面有了极大的提升。

 


图4:带外壳的实物


 

图5:不带外壳的实物

主要技术参数:
Graviton2的内核
• Arm Neoverse N1 内核
• Arm v8.2指令集
• ARM N1 架构的经典实现
• 每vCPU 64KB 1级指令与数据缓存,1MB 2级缓存
• 指令缓存连贯性
• 中断,虚拟化,与上下文切换的低开销
• 4-wide front-end, with 8-wide dispatch/issue
• 双倍 SIMD 单元
• 使用 int8, fp16 指令加速机器学习
• 每个 vCPU 都是物理核心
• 无超线程设计 (SMT)

 

可能大家会问,怎么没有超线程呢?是的,这一款没有,AWS计划后续推出带超线程的ARM处理器。目前比如X86的超线程技术实际上是会出现争抢部分CPU资源的情况出现的,比如浮点单元,这样效率也会受到一定影响。

 

Graviton2的互联
• 64 个核心通过 mesh 结构互联
• ~2 TB/s 对分带宽
• 32 MB LLC 三级缓存
• 近 100 MB 用户可使用缓存
• 无 NUMA 设计
• 每个内核访问其它内核与内存的路径一致
• 64 通道 PCIe gen4

 

当前X86处理器单个CPU最高支持128通道的PCIE4.0,是由AMD的EPYC系列处理器创造的,同样的,EPYC系列处理器核数众多,高达64个核心,不过整体内部互联架构没有Graviton2来的先进,EPYC的Rome系列采用多die的方式,一个优点是制造的成本能降低很多,同样的缺点也比较明显那就是延迟比较高。所以总体来说Graviton2还是相当不错的!

 

Graviton2的系统参数
• 8x DDR4-3200 通道 →超过 200GB/s
• 使用临时密钥与 AES-256 加密算法加密内存访问
• 所有 CPU 核心访问内存享有一致性延迟
• 1Tbit/s 压缩算法加速器
• 2xlarge 配置以上的实例将包含硬件级加密器
• 发布前 DPDK 与 Linux 内核已经成功发布
• 压缩效率高达 15GB/s 解压效率高达 11GB/s


通过以上这些参数可以了解到,基于ARM开发的处理器也可以做到性能非常强大!前面有AWS,现在MARVELL也来了,推出了第三代ARM片“ThunderX3”。其第二代产品ThunderX2已经被20多家终端客户部署在大规模云计算、高性能计算市场,包括微软Azure、HPE、Cray、Atos、洛斯阿拉莫斯国家实验室、桑迪亚国家实验室、劳伦斯利弗莫尔国家实验室、橡树岭国家实验室、布里斯托大学、莱彻斯特大学等等。

 

ThunerX3采用台积电7nm DUV工艺制造,基于Marvell自主研发架构,指令集兼容ARM-v8.3+,最多96个核心,而且继续支持4线程,也就是最多384个线程,是上一代的整整三倍,而且支持双路并行,此时单系统可提供128个核心、768个线程。

 

所以单从技术角度出发,ARM的产品还是值得期待的,可以在服务器领域替代X86的产品的!其他架构也是不错的,尽管用的人少,比如MIPS,龙芯在其基础上加入自我创新,一点一点慢慢迭代,脚踏实地干出来不错的成绩。国产其实不管使用谁家的架构,只要能消化掉,再融入自己的新技术、新想法并实现二度创新、持续创新的都是好国产!

 

国内使用ARM架构的还有飞腾和海思!海思有鲲鹏920,后续将推出930。今年飞腾将推出国产FT2500处理器,支持多路互联。当然后续还有新的服务器产品推出,敬请期待!


内容来源:国产观察

图片来源:Arm官网

(责任编辑:小编)
下一篇:

重磅,2019年度中国电子元器件分销商TOP35出炉!

上一篇:

天津飞腾,芯片研发“国家队”来了!丨IAIC—信创安全专题篇

  • 分享到
免责声明
• 
本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们