1. ARM公司简介

ARMAdvanced RISC Machines)有三种含义:它是一个公司的名称、它是一类微处理器的通称、它是一种技术的名称

  • ARM 公司是微处理器行业的一家知名企业,它是知识产权供应商,设计基于ARM体系的处理器;公司并不生产芯片,也不出售芯片,它转让设计方案给半导体厂商,由半导体厂商生产soc,并销售,同时提供一些其他设计服务,比如物理IP,图形内核和开发工具的设计。

2. ARM指令集

2.1 指令集的概念

  • 处理器能够识别并执行的指令集合
  • 每一条指令可处理一个简单或复杂操作(加乘…);每一条指令对应一条或几条汇编指令

2.2 指令集常见分类

复杂指令集(CISC):包含处理复杂操作的特定指令,指令长度不固定,执行需要多个周期
精简指令集(RISC):指令简单而有效,格式和长度通常是固定的,大多数指令在一个周期内可以执行完毕。ARM的内核是基于RISC体系结构的。

2.3 cpu与主流架构

  • 大家熟悉的服务器或者台式机都是X86架构的CPU,X86架构的CPU特点是性能高,并且软件的兼容性很好

  • 大家平常工作中使用的大部分是英特尔等提供的X86架构的CPU,对于英特尔AMD大家都不陌生,这两家厂商专门生产X86架构CPU

  • 另外X86 64位这种架构的CPU存在别名,例如x86_64或者amd64都代表X86架构的64位CPU

  • 与X86不同的是还有另一种称为ARM的架构,这是本文的主题,那么ARM架构的CPU和X86架构的CPU相比有何不同?

  • 它的制造成本更低,ARM架构的芯片的功耗也很低,代表性的厂商和使用者是苹果华为

  • 苹果将生产的ARM芯片用到笔记本IMAC上,ARM架构的CPU越来越普及。

  • 国内的华为会生产基于ARM架构的服务器,64位ARM架构CPU也有别名,例如arm64aarch64,这两种叫法表达同一个意思

3 ARM架构与ARM内核

3.1 ARM架构与内核简述

  • 目前ARM体系架构共定义了8个版本V1-V8
    V1-V3 :最早的版本,目前已废弃
    V4-V6 : 经典处理器中运用的比较
    V7 : 目前Cortex系列处理器主要是这种架构、支持Thumb-2的32位指令集
    V8 : 兼容ARMv7架构的特性,并支持64位数据处理
  • 目前为止,ARM总共发布8种架构ARMv1ARMv2、ARMv3ARMv4、ARMv5ARMv6ARMv7ARMv8,这是ARM架构指令集的多个v版本
  • 基于不同的ARM架构可以设计出不同特点的内核处理器。比如基于ARMv3架构设计出的处理器ARM6ARMv7 这两款处理器适用于不同的场景硬件可能不同,但是架构指令集是一样的
  • 好比盖房子,刚开始因为水平低流行盖平房,这就是一种架构(ARMv5),然后这种平房架构你可以设计出一款独立卫生间的款式, 这叫ARM7内核。 然后其他人(芯片设计公司)想盖房子的就买你这个图纸去盖,接着过一段时间,有人觉得光独立卫生间还不够啊, 我还想有个小院子! 好吧,那ARM就满足你们的要求,出个带小院子的款式(ARM9)。
  • ARMv1/2/3等是指令集的架构ARM7/9等是基于架构设计出的内核处理器ARM的架构都是基于RISC指令集而设计的,内核是实现这一指令集的硬件架构的基础

3.2 ARM处理器家族

  • 早先经典处理器
    包括ARM7ARM9ARM11家族。
    体系结构定义指令集和基于这一体系结构下处理器的编程模型基本数据类型工作模型寄存器组)。基于同种体系结构可以有多种处理器、每个处理器的性能不同,面向的应用领域也不同

    ARMv1架构
  • 1985年,ARMv1架构诞生,该版架构只在原型机ARM1出现过,只有26位的寻址空间(64MB),没有用于商业产品。
    ARMv2架构
  • 1986年,ARMv2架构诞生,首颗量产的ARM处理器ARM2就是基于该架构,包含了对32位乘法指令和协处理器指令的支持,但同样仍为26位寻址空间。其后还出现了变种ARMv2a,ARM3即采用了ARMv2a,是第一片采用片上Cache的ARM处理器。
    ARMv3架构
  • 1990年,ARMv3架构诞生,第一个采用ARMv3架构的微处理器是ARM6(610)以及ARM7,其具有片上高速缓存、MMU和写缓冲,寻址空间增大到32位(4GB)。
    ARMv4架构
  • 1993年,ARMv4架构诞生,这个架构被广泛使用,ARM7(7TDMI)、ARM8、ARM9(9TDMI)和StrongARM采用了该架构。ARM在这个系列中引入了T变种指令集,即处理器可工作在Thumb状态,增加了16位Thumb指令集。
    ARMv5架构
  • 1998年,ARMv5架构诞生,ARM7(EJ)、ARM9(E)、ARM10(E)和Xscale采用了该架构,这版架构改进了ARM/Thumb状态之间的切换效率。此外还引入了DSP指令和支持JAVA。
    ARMv6架构
  • 2001年,ARMv6架构诞生,ARM11采用的是该架构,这版架构强化了图形处理性能。通过追加有效进行多媒体处理的SIMD将语音及图像的处理功能大大提高。此外ARM在这个系列中引入了混合16位/32位的Thumb-2指令集。
    ARMv7架构
  • 2004年,ARMv7架构诞生,从这个时候开始ARM以Cortex来重新命名处理器,Cortex-M3/4/7,Cortex-R4/5/6/7,Cortex-A8/9/5/7/15/17都是基于该架构。该架构包括NEON™技术扩展,可将DSP和媒体处理吞吐量提升高达400%,并提供改进的浮点支持以满足下一代3D图形和游戏以及传统嵌入式控制应用的需要。
    ARMv6-M架构
  • 2007年,在ARMv6基础上衍生了ARMv6-M架构,该架构是专门为低成本、高性能设备而设计,向以前由8位设备占主导地位的市场提供32位功能强大的解决方案。Cortex-M0/1/0+即采用的该架构。
    ARMv8架构
  • 2011年,ARMv8架构诞生,Cortex-A32/35/53/57/72/73采用的是该架构,这是ARM公司的首款支持64位指令集的处理器架构
    ARMv9架构
  • 2021年,ARMv9架构诞生,10年磨一剑,Armv9架构采用Arm机密计算架构(ConfidentialCompute Architecture, CCA),专为 Armv9 打造 SVE2,增强 AI 能力,首先Armv9 架构是基于 Armv8 既往成功的基础,增添了针对矢量处理的 DSP、机器学习、安全等这三个技术特性。目前 64 位上的 v8 架构中的所有功能均将在 v9 架构中得到支持,且 v9 架构将支持在 32 位上的 v8 架构功能。

3.2.1 Cortex-Mx处理器

Cortex-M 系列产品主要包括 Cortex-M0Cortex-M1Cortex-M3Cortex-M4Cortex-M7 等,其中 Cortex-M0 主打低功耗和混合信号的处理,Cortex-M3 主要用来替代 ARM7,重点侧重能耗与性能的平衡,而 Cortex-M7 则重点放在高性能控制运算领域。

3.2.2 STM32平台

  • STM32,从字面上来理解,ST意法半导体MMicroelectronics 的缩写,32 表示32 位,合起来理解,STM32 就是指 ST 公司开发的 32 位微控制器。在如今的 32 位控制器当中,STM32 可以说是最璀璨的新星,它大受工程师和市场的青睐,无芯能出其右。

STM32产品分类:


4 ARM各架构之间区别

4.1 ARM版本Ⅰ:V1版架构

  • 该版架构只在原型机ARM1出现过,只有26位的寻址空间,没有用于商业产品。其基本性能有:
    基本的数据处理指令(无乘法)
    基于字节、半字和字的Load/Store指令;
    转移指令,包括子程序调用及链接指令;
    供操作系统使用的软件中断指令SWI;
    寻址空间:64MB(226)。

4.2 ARM版本Ⅱ:V2版架构

  • 该版架构对V1版进行了扩展,例如ARM2和ARM3(V2a)架构。包含了对32位乘法指令和协处理器指令的支持。
  • 版本2a是版本2的变种,ARM3芯片采用了版本2a,是第一片采用片上Cache的ARM处理器。同样为26位寻址空间,现在已经废弃不再使用。V2版架构与版本V1相比,增加了以下功能:
    乘法和乘加指令;
    支持协处理器操作指令;
    快速中断模式;
    SWP/SWPB的最基本存储器与寄存器交换指令;
    寻址空间:64MB。

4.3 ARM版本Ⅲ: V3版架构

  • ARM作为独立的公司,在1990年设计的第一个微处理器采用的是v3ARM6。它作为IP核独立的处理器、具有片上高速缓存MMU写缓冲的集成CPU。
  • 变种版本有3G和3M。版本3G是不与版本2a向前兼容的版本3,版本3M引入了有符号无符号数乘法乘加指令,这些指令产生全部64位结果。V3版架构( 目前已废弃 )对ARM体系结构作了较大的改动:
    寻址空间增至32位(4GB);
    当前程序状态信息从原来的R15寄存器移到当前程序状态寄存器CPSR中(Current Program Status Register);
    增加了程序状态保存寄存器SPSR(SavedProgram Status Register);
    增加了两种异常模式,使操作系统代码可方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常。;
    增加了MRS/MSR指令,以访问新增的CPSR/SPSR寄存器;
    增加了从异常处理返回的指令功能。

4.4 ARM版本Ⅳ: V4版架构

  • V4版架构在V3版上作了进一步扩充,V4版架构是目前应用最广的ARM体系结构,ARM7ARM8ARM9StrongARM都采用该架构。
  • V4不再强制要求与26位地址空间兼容,而且还明确了哪些指令会引起未定义指令异常。指令集中增加了以下功能:
    符号化和非符号化半字及符号化字节的存/取指令;
    增加了T变种,处理器可工作在Thumb状态,增加了16位Thumb指令集;
    完善了软件中断SWI指令的功能;
    处理器系统模式引进特权方式时使用用户寄存器操作;
    把一些未使用的指令空间捕获为未定义指令

4.5 ARM版本Ⅴ: V5版架构

  • V5版架构是在V4版基础上增加了一些新的指令ARM10Xscale都采用该版架构。这些新增命令有:
    带有链接和交换的转移BLX指令;
    计数前导零CLZ指令;
    BRK中断指令;
    增加了数字信号处理指令(V5TE版); 为协处理器增加更多可选择的指令
    改进了ARM/Thumb状态之间的切换效率;
    E---增强型DSP指令集,包括全部算法操作和16位乘法操作;
    J----支持新的JAVA,提供字节代码执行的硬件和优化软件加速功能。

4.6 ARM版本Ⅵ: V6版架构

  • V6版架构是2001年发布的,首先在2002年春季发布的ARM11处理器中使用。在降低耗电量的同时,还强化了图形处理性能。通过追加有效进行多媒体处理的SIMD (Single Instruction, Multiple Data,单指令多数据 )功能,将语音及图像的处理功能提高到了原型机的4倍。此架构在V5版基础上增加了以下功能:
    THUMBTM:35%代码压缩;
    DSP扩充:高性能定点DSP功能;
    JazelleTM:Java性能优化,可提高8倍;
    Media扩充:音/视频性能优化,可提高4倍

5 ARM产品型号

5.1 ARM-v内核产品型号

  • 基于各ARM架构设计的内核型号如下图所示:
  • 目前常见的指令集的说明:ARMv7之前均为32位总线位宽,从ARMv8开始扩展为64位总线位宽(数据总线、地址总线、控制总线位宽均为64位,一般寻址空间不会用满)。

5.2 ARM处理器命名规则

ARM处理器命名规则和格式:ARM x y z T D M I E J F -S
x:序列
y:2:带MMU, 4带MPU,6没有
z:0:标准cache,2:减小的cache, 6可变的cache
T:处理器支持Thumb指令集
D:支持JTAG调试器
M:支持长乘法指令
I:有嵌入式跟踪宏单元
E:支持增强指令(基于TDMI)
J:支持JAVA硬件加速(Jazelle)
F:支持向量浮点单元
S:可综合版本

5.3 ARM v7架构细分

ARM6:ARMv3架构
ARM7、ARM8、RAM9:ARMv4架构
ARM10:ARMv5架构
ARM11:ARMv6架构
ARM-Cortex 系列:ARMv7架构
ARM7没有MMU(内存管理单元),只能叫做MCU(微控制器),不能运行诸如LinuxWinCE等这些现代的多用户多进程操作系统,因为运行这些系统需要MMU,才能给每个用户进程分配进程自己独立的地址空间ucOSucLinux这些精简实时的RTOS不需要MMU,当然可以在ARM7上运行。
ARM9ARM11:是嵌入式CPU(处理器),带有MMU,可以运行诸如Linux等多用户多进程的操作系统,应用场合也不同于ARM7。
到了ARMv7架构的时候开始以Cortex来命名,并分成Cortex-ACortex-RCortex-M三个系列。三大系列分工明确:

5.3.1 Cortex-A系列

  • A-Profile,即“Application”-Profile,侧重于应用功能的场合,A系列面向尖端的基于虚拟内存的操作系统和用户应用;针对开放式操作系统的高性能处理器,进行海量数据处理高性能计算;应用于智能手机数字电视智能本等高端运用。主要支持分页内存管理单元MMU,linux需要MMU的支持才能运行

5.3.2 Cortex-R系列

  • R-Profile,即”Real-Time”-Profile,侧重于实时系统的场合。R系列针对实时系统;针对实时系统、满足实时性要求高的控制需求;应于汽车制动系统动力系统等。

5.3.3 Cortex-M系列

  • M-Profile,即"Microntroller"- Profile,侧重微控制器单片机方面的场合。M系列对微控制器。简单的说Cortex-A系列是用于移动领域的CPUCortex-RCortex-M系列是用于实时控制领域的MCU。为单片机驱动的系统提供的低成本优化方案;应用于传统的微控制器市场智能传感器汽车周边部件等。