一文深入搞懂ARM处理器架构

1、嵌入式处理器基础

典型的微处理器由控制单元、程序计数器（PC）、指令寄存器（IR）、数据通道、存储器等组成。

指令执行过程一般分为：

取指：
从存储器中获得下一条执行的指令读入指令寄存器；
PC: 程序计数器, 总是指向下一条将要执行的指令；
IR: 指令寄存器，用于保持已取得指令；如图：

译码：
解释指令，决定指令的执行意义；如图：

执行：
从存储器向数据通道寄存器移动数据；
通过算术逻辑单元ALU进行数据操作；如图：

存储：
从寄存器向存储器写数据。如图：

在一些微处理器上，如ARM系列处理器、DSP等，指令实现流水线作业，指令过程按流水线的数目来进行划分。如5级流水线的处理器将指令分5个阶段执行。

（1）按存储结构分：冯·诺依曼体系结构和哈佛体系结构

冯·诺伊曼结构也称普林斯顿结构，是一种将程序指令存储器和数据存储器合并在一起的存储器结构。

处理器，经由同一个总线传输来访问程序和数据存储器，程序指令和数据的宽度相同。如X86系列、ARM7等，如图：

哈佛结构是一种将程序指令存储和数据存储分开的存储器结构，目的是为了减轻程序运行时的访存瓶颈。哈佛结构的微处理器通常具有较高的执行效率。

Microchip公司的PIC系列芯片，摩托罗拉公司的MC68系列、Zilog公司的Z8系列、ATMEL公司的AVR系列和ARM公司的ARM9、ARM10和ARM11
等。如图：

按指令类型可分为：复杂指令集（CISC）处理器和精简指令集（RISC）处理器。

CISC：复杂指令集（Complex Instru

ction Set Computer）；

具有大量的指令和寻址方式，那么就需要更多的解释器。

8/2原则：80%的程序只使用20%的指令；

大多数程序只使用少量的指令就能够运行。

CISC具有如下显著特点：

(1) 指令格式不固定，指令长度不一致，操作数可多可少；

(2) 寻址方式复杂多样，以利于程序的编写；

(3) 采用微程序结构，执行每条指令均需完成一个微指令序列；

(4) 每条指令需要若干个机器周期才能完成，指令越复杂，花费的机器周期越多。

RISC：精简指令集（Reduced Instruction Set Computer)：指令数目少，在通道中只包含最有用的指令；执行时间短，确保数据通道快速执行每一条指令；使CPU硬件结构设计变得更为简单；每条指令都采用标准字长。

资料直通车：Linux内核源码技术学习路线+视频教程内核源码
学习直通车：Linuxc/c++高级开发【直播公开课】
零声白金VIP体验卡：零声白金VIP体验卡（含基础架构/高性能存储/golang/QT/音视频/Linux内核）

2、ARM处理器体系架构

ARM即Advanced RISC Machines的缩写。

1985年4月26日，第一个ARM原型在英国剑桥的Acorn计算机有限公司诞生。

20世纪80年代后期，ARM很快开发成Acorn的台式机产品，形成英国的计算机教育基础。

1990年成立了Advanced RISC Machines Limited。

20世纪90年代，ARM32位嵌人式RISC（Reduced Instruction Set Computer）处理器扩展到世界范围，占据了低功耗、低成本和高性能的嵌入式系统应用领域的领先地位。

目前己经占有75%以上的32位嵌入式产品市场。

32位RISC处理器受到青睐，领先的是ARM嵌入式微处理器系列。

ARM公司虽然只成立20多年，但在1999年因移动电话火爆市场，其32位RISC处理器占市场份额超过了50%，2001年初，ARM公司的32位RISC处理器市场占有率超过了75%。ARM公司是知识产权供应商，是设计公司。由合作伙伴公司来生产各具特色的芯片。

ARM处理器特点：

（1）ARM指令是32位定长的（除AArch64架构部分增加指令为64位外）
（2）寄存器数量丰富（37个寄存器）
（3）普通的Load/Store指令
（4）多寄存器的Load/Store指令
（5）指令的条件执行
（6）单时钟周期中的单条指令完成数据移位操作和ALU操作
（7）通过变种和协处理器来扩展ARM处理器的功能
（8）扩展了16位的Thumb指令来提高代码密度

ARM的命名规则, 大致分成两类类：

基于ARM Architecture版本的“处理器系列”命名规则；

基于ARM Architecture版本的“处理器型号”命名规则。

ARMv6 架构，引进了包括单指令多数据(SIMD)运算在内的一系列新功能。

ARMv6-M 架构，为低成本、高性能设备而设计，向以前由8位设备占主导地位的市场提供32位功能强大的解决方案。如Cortex™-M0和Cortex-M1。

ARMv7架构，所有ARMv7架构处理器都实现了Thumb-2 技术（一个经过优化的16/32位混合指令集），此架构分为3类处理器：Cortex-A -应用处理器、Cortex-R – 实时处理器、Cortex-M – 微控制器。

ARMv8架构，ARMv8-A将64位体系结构支持引入ARM体系结构中，其中包括：64位通用寄存器、SP（堆栈指针）和 PC（程序计数器），64位数据处理和扩展的虚拟寻址，兼容32位处理。

ARMv9架构，最重大的升级在于AI和安全，在兼容ARMv8的基础上，提升了安全性，增加了矢量计算、机器学习和数据信号处理等多方面能力，性能表现也将得到极大幅度的提升。

1）ARM数据类型

（1）双字节（Double-Word）：64位

（2）字（Word）：在ARM体系结构中，字的长度为32位。

（3）半字（Half-Word）：在ARM体系结构中，半字的长度为16位。

（4）字节（Byte）：在ARM体系结构中，字节的长度为8位。

2）ARM处理器存储格式

作为32位的微处理器，ARM体系结构所支持的最大寻址空间为4GB。

ARM体系结构可以用两种方法存储字数据，分别为大端模式和小端模式。

大端模式（高地高低）：字的高字节存储在低地址字节单元中，字的低字节存储在高地址字节单元中。

3）ARM处理器工作状态

从编程的角度来看，ARM微处理器的工作状态一般ARM和Thumb有两种，并可在两种状态之间切换。

（1）ARM状态：此时处理器执行32位的字对齐ARM指令，绝大部分工作在此状态。

（2）Thumb状态：此时处理器执行16位的半字对齐的Thumb指令。

THUMB指令的特点：

THUMB代码所需空间为ARM代码的70%；
THUMB代码所使用的指令数比ARM代码多40%；
用32位存储器，ARM代码比THUMB代码快40%；
用16位存储器，THUMB代码比ARM代码快45%；
使用THUMB代码，外部存储器功耗比ARM代码少30%

4）ARM处理器工作模式

5）ARM Cortex-A处理器工作模式

6） Cortex-A寄存器组

34个通用寄存器，包括各种模式下的R0-R14和共用的R15程序计数器(PC)，这些寄存器都是32位的。8个状态寄存器，Hyp模式独有一个ELR_Hyp寄存器。

7）程序状态寄存器CPSR和SPSR

和其他处理器一样，ARM有程序状态存储器来配置处理器工作模式和显示工作状态。ARM处理器有两个程序状态寄存器CPSR （Current Program Status Register，当前程序状态寄存器）和SPSR （Saved Program Status Register，备份的程序状态寄存器）。

CPSR可在任何运行模式下被访问，它包括条件标志位、中断禁止位、当前处理器模式标志位以及其他一些相关的控制和状态位。

每一种运行模式下都有一个专用的物理状态寄存器，称为SPSR为状态寄存器。