目前最强大的 Arm 处理器是富士通的48 核 A64FX 处理器(Fujitsu A64FX:继承SPARC64架构的Arm超级处理器),它是为日本 RIKEN 实验室的“Fugaku”超级计算机创建的高度矢量化计算引擎。Nvidia 正准备推出其72 核“Grace”Arm CPU,该 CPU 尚未给出产品名称,但 CG100 似乎合乎逻辑。但两者都将面临来自印度新来者的激烈竞争。
下载链接:

1、印度Arm处理器曝光,5nm工艺,Arm架构96核,性能接近富士通A64FX两倍

来自印度高级计算发展中心(C-DAC)设计的 Aum HPC 处理器有非零的机会超越 A64FX 和 Grace,甚至在与亚马逊的 64 核 Graviton3 芯片和Ampere Computing 的 Altra、Altra Max 和AmpereOne 处理器于通用的工作负载上相比,更物有所值。
C-DAC此前曾表示,正在为印度国内应用开发多种类型的处理器,将可应用于从智能型装置、物联网、AR/VR 、HPC及数据中心领域。其中就包括了基于双核心和四核心架构设计的 Vega CPU 系列,主要针对需要低功耗和低成本芯片的入门级客户,将涵盖印度至少 10% 的芯片需求。该机构还计划在未来 3 年内推出八核心的芯片,做为之前 Dhruv 和 Dhanush Plus 芯片的后续升级产品。此外,还有面向HPC及服务器领域的处理器AUM ,这款芯片也将作为印度国家超级电脑 (NSM) 计划的一部分。
根据最新曝光的资料显示,AUM 的CPU核心采用的是代号为 Zeus 的 Arm Neoverse V1内核,共有 96 个核心,但分为两个小晶片进行封装,每个小晶片包含 48 个 V1 核心,并且每个小芯片都有自己的内存、I/O、C2C/D2D互联、缓存、安全和 MSCP 子系统等,两个小芯片共计包括 96 MB 的二级缓存和 96 MB 的系统内存。两个采用A48Z 的小芯片使用同一中介层上的 D2D 小芯片互连技术连接在一起。
C-DAC还将AUM与富士通的A64FX处理器进行了对比,AUM不仅支持更先进,核心数量核主频更高,HBM内存容量翻倍,支持高达64路的PCIe Gen5接口,整体的性能达到了A64FAX的近2倍,TDP为320W。
2、Arm新CPU性能提升22%,最高可组合12核,GPU首配硬件光追
Arm去年3月发布全新v9架构、5月发布第一代基于v9架构产品后的第二次更新。这次,一共发布了两款新CPU,全面转向64位,以及三款新GPU,其中一款首次支持硬件光追。
Arm今年发布的第一款新CPU为Cortex-X3。Cortex-X3作为超大核,主打性能提升:
与最新安卓旗舰机上运行的上一代Cortex-X2相比,提升了22%;与最新主流笔记本上的处理器(Intel Core i7 1260p 28w,而非Cortex-X1或X2)相比,性能预计提升34%。此外,与使用相同工艺的Cortex-X2相比,Cortex-X3的IPC提高了11%。
具体指标上,Cortex-X3的解码器每周期指令从5个提升到6个,乱序执行窗口从288提升到320个,整数ALU单元从4个提升到6个,L2缓存容量也从512KB提升到了1MB。
功耗方面,从下表来看,Cortex-X3在大多数情况下比Cortex-X2消耗更少,但随着性能的攀升,Cortex-X3看起来确实也不是“省油的灯”。
第二款新CPU为Cortex-A715,这款中核讲究的是性能和功耗平衡。作为Cortex-A710的继任者,它在相同的功率水平和制造工艺下,功耗节省了20%,性能只提升了5%,比当初Cortex-A710的提升少多了(Cortex-A710相比Cortex-A78涨了10%)。不过,Arm表示,这个水平也能抵得上2020年的重磅级产品Cortex-X1了。
这对中端处理器厂商来说是个好兆头,能在不增加功耗的情况下提升性能。需要重点提一下的是,Cortex-A715和Cortex-X3一样,都已经放弃了aarch32指令集,只支持64位了。
除了这两款新CPU,Arm此次还对去年发布的Cortex-A510小核做了一点更新,使其功耗减少了5%,最多支持12核架构,也是唯一支持32位兼容的CPU。另外,这一代的Cortex处理器面向智能手机、平板及笔记本等平台,按照Arm所说,新的大小核调度架构最多可以做到8+4+0,也就是12核。
在GPU方面,第一款是全新命名的Immortalis-G715,它最大的特点是首次在手机端支持硬件光追。
Arm称,这款GPU上用于光追的着色器核心区域只占不到4%,与基于软件加速的光追相比,性能提高了300%。相比上一代Mali-G710,Immortalis-G715性能提升15%,能耗节省15%。剩下两款新GPU分别为Mali-G715和Mali-G615。

3、众多科技巨头涌入ARM,国内外产品研发进展及厂商介绍

根据ICVTank公布的数据显示,2019年全球智能座舱行业市场规模达364亿美元,2022年有望达到461亿美元;中国2019年中国智能座舱行业市场规模达441.1亿元,2022年有望达到739亿元。
2019年,Arm携手通用汽车、丰田、DENSO、博世、大陆集团、英伟达、恩智浦共同成立自动驾驶汽车计算联盟(AVCC),开拓ARM自动驾驶布局,目前已经发展到19名成员。
众多IT巨头在ARM行业的布局
据Geekbench 跑分显示,搭载 M1 芯片、配备 8GB RAM 的 MacBook Air 单核得分为 1687,多核得分为 7433。与现有设备相比,MacBook Air 的 M1 芯片性能优于所有 iOS 设备。
苹果后续的芯片研发计划
根据彭博社的消息,苹果正在研发M1芯片的后续产品,新版MacBook Pro、新款iMac和新Mac Pro将会使用,最早将于明年推出。目前的M1芯片配备了8个GPU 核心,苹果正在测试16个GPU核和32个GPU核心的型号,将会用于计划在2021年晚些时候推出的高端台式电脑,以及计划在2022年推出的全新小尺寸Mac Pro。苹果还计划在2021年底或2022年开发128核的芯片。
苹果后续的M1X设计为12核、M2为16核,包括12颗高性能核心(大核)和4颗效率核心(小核),性能将是当前M1的四倍强,M1X则是M1的两倍强。
AMD/谷歌/微软正在研发ARM芯片
2020年11月,根据Twitter用户@Mauri QHD的报道,在苹果发布M1芯片之后,AMD已经在设计ARM的芯片原型,包含集成RAM和没有集成RAM的两个版本。
2020年12月,根据外媒Axios报道,谷歌正在研发基于ARM的移动处理器,命名为Whitechapel,它将应用在未来的Pixel智能手机和Chromebook笔记本。该芯片基于三星的5nm制程,包含八个ARM内核,并能提高Google Assistant应用的性能。
2020年12月,根据彭博报道,微软计划制造ARM芯片,用于Azure 云平台和Surface设备。目前微软旗下的云服务Azure和Surface大多主要使用基于x86架构的Intel芯片,不过微软已经在慢慢从英特尔转向其他公司,例如在其Surface Pro X设备中就尝试使用和高通合作生产的基于ARM的芯片SQ1。
亚马逊云计算AWS已经使用ARM处理器
2020年6月,据Silicon ANGLE报道,亚马逊云计算部门宣布第六代亚马逊弹性计算服务(EC2)现在开放服务,其中三种计算资源产品由公司自己研制的基于ARM架构的Graviton2处理器支持。和x86的同类产品相比,亚马逊使用自家ARM处理器的三款产品(通用M6g、计算优化C6g和内存优化R6g)的性价比高出40%。 
2020年12月,ARM宣布将利用AWS为其云计算使用,包括将大部分电子设计自动化(EDA)工作负载迁移到云端。Arm正在利用基于AWS Graviton2的实例(由Arm Neoverse核心提供支持)将EDA工作负载迁移到AWS,在AWS上可以实现工作流时间以及吞吐量极大的改进,从而提升整体工作流程效率。

Ampere发布了首款80核的ARM服务器处理器
2020年3月,Ampere发布了Ampere Altra处理器,是首款80核的ARM服务器处理器,提供强大性能的同时拥有高能效。Ampere Altra处理器拥有80个核心,功耗为210 W,采用了台积电的7nm工艺,适用于数据分析、人工智能、数据库、存储、边缘计算、网络托管和云本地应用等用例。根据VentureBeat报道,Ampere认为该芯片比64核的AMD EPYC处理器和英特尔28核的高端Xeon“Cascade Lake”芯片速度更快。
2020年,众多合作伙伴和客户已经宣布对Ampere Altra的支持,正在提供样品,已开发平台或已构建解决方案。Oracle建立了一个基于Ampere Altra的平台并优化了其软件;NVIDIA宣布将GPU和DPU加速带入Arm生态系统,并与Ampere合作扩展了两个插槽的Ampere AltraMt。
Arm新型Cortex-A78C CPU发布专为笔记本电脑设计
Cortex-A78C支持多达8个大型CPU内核集群的更均质的多大内核计算。与Cortex-A78相比,八核配置可带来更多可扩展的多线程性能改进,还可以将L3高速缓存的内存增加到8MB,进一步提高性能。Cortex-A78C提供了有关数据和设备安全性的更新以确保设备上的数据保持安全。
ARM 全新Neoverse 平台推出
NeoverseV1和Neoverse N2全新推出,Neoverse性能指标再度升级。NeoverseV1作为V系列的第一个平台,与N1相比,其单线程性能可提升超过50%,为高性能云、高性能计算与机器学习等市场带来庞大的应用潜力。Neoverse N2被定位为可提供更高性能计算的解决方案,用来满足横向扩展的性能需求,相比于N1单线程性能提升了40%。
ARM中国-玲珑
2020年12月3日,ARM中国发布了首款多媒体产品线,命名为“玲珑”,同时推出了首款产品“玲珑”i3/i5 ISP处理器。玲珑ISP处理器可广泛适用于安防监控、AIoT及智能汽车等领域的视频、图像处理工作,满足不同场景的数据处理需求。该产品线是ARM中国继“周易”、“星辰”、“山海”之后的第四条自主IP产品线。
ARM中国-周易
“周易”是一个开放通用的人工智能平台,拥有软件框架Tengine和人工智能处理单元(AIPU),能够带来最高达0.256TOPS的运算能力。
ARM中国-星辰
“星辰”处理器是安谋中国CPU设计团队设计的一款嵌入式处理器,基于最新的Armv8-M架构,可用于微控制器或者集成片上系统等芯片类型。“星辰”处理器针对物联网设备的需求进行了优化,能够充分满足物联网设备在实时控制,数字信号处理,安全运行,极低功耗,极小面积等方面的需求。
ARM中国-山海
“山海”是面向物联网设备的信息安全方案,通过一系列的固件和硬件组合,“山海”安全方案为物联网设备提供了全面而完整的安全防护,用户数据,算法和驱动程序等敏感信息都能得到完整的防护。
ARM发展远景
从移动端到PC端、服务器端再到汽车端、IoT端,ARM架构正在逐步走向一个庞大的生态系统。预计到2035年,将有超过1万亿台智能电子设备实现互联,从各种传感器、门禁卡、手机、家电、汽车,到工业机械、通信基站、数据中心、云服务器,基于Arm架构的芯片无处不在。
飞腾腾锐D2000/S2500/DCS
在2020年12月29日飞腾的生态发布会上,飞腾发布了全新一代基于ARM的腾锐D2000,性能大幅跃升。腾锐D2000 集成了 8 个飞腾自主研发的高性能处理器内核 FTC663,兼容 64 位 ARMv8 指令集,主频 2.3~2.6GHz,TDP 功耗 25W,支持飞腾自主定义的处理器安全架构标准 PSPA 1.0,满足更复杂应用场景下对性能和安全可信的需求。
在2020年7月,飞腾发布了腾云S2500处理器,最多64个FTC663架构的核心,提供128-512核心配置。在ARMv8指令集兼容的现有产品中,S2500在单核计算能力、单芯片并行性能、单芯片cache一致性规模、访存带宽等指标上都处于国际先进水平。S2500主要应用于高性能、高吞吐率服务器领域,如对处理能力和吞吐能力要求很高的行业大型业务主机、高性能服务器系统和大型互联网数据中心等。
2020年,基于飞腾CPU自主研发的、首套百分之百全国产化的100万千瓦级分散控制系统(DCS)华能“睿渥”,在华能玉环电厂成功投运,这标志着我国高参数、大容量发电领域核心控制设备实现完全自主可控,相关技术成果也进入大规模推广应用阶段,可从根本上消除电力网络安全的重大隐患。
华能“睿渥”DCS CPU采用了天津飞腾的FT-2000+/64、FT-2000/4、FT-1500A/4。
腾讯微服务框架TARS成功移植至Arm架构
2020年3月,腾讯宣布TARS微服务开发框架已成功移植至ArmCPU架构。TARS是一个成熟的高性能微服务开发框架,支持多种编程语言,如今已广泛应用于腾讯的在线社交、金融服务、边缘计算、汽车、游戏和安全等数百项核心业务中。
统信软件支持ARM架构

统信 UOS 推出 ISO 定制工具,支持 amd64、mips64、arm64 架构。这是专为厂商打造的镜像制作工具,用于满足厂商对硬件适配、产线安装等需求,既支持对程序和驱动 deb 包的二次定制,也支持对脚本的重新配置。统信 UOS 官网显示,运行 ISO 定制工具须同时满足以下几点:必须在统信 UOS 操作系统上运行;必须在 amd64、mips64、或 arm64 架构上运行。
百度云智峰会发布ARM私有云
2020年12月17日 “2020 ABC SUMMIT百度云智峰会”上,百度智能云ARM云总经理沈鹏飞分享了百度ARM云生态布局,重磅发布了主打“端云同构”的ARM私有云一体机与ARM私有容器云一体机。
字节跳动拟布局ARM服务器
在字节跳动的官网上,目前开放了大量的ARM相关职位,包括ARM服务器系统的性能和功耗优化,ARM服务器产品架构端到端设计和优化等,涉及到ARM的应用、建模、仿真、系统分析等诸多环节。这是在继苹果、三星、微软、谷歌等巨头之后中国互联网巨头进入ARM行业,产业趋势进一步得到加强。
下载链接:
ARM的体系结构与编程.pdf
ARM架构参考手册.pdf
ARM架构参考手册ARM V9.pdf
CPU之战:ARM vs Intel.pdf
推荐阅读:
或者获取全店资料打包,后续免费获取全店所有新增和更新。
申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。
推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情

继续阅读
阅读原文