ARM汇编基础
1 GNU语法
1.1 GNU汇编
GNU 汇编语法适用于所有的架构,并不是 ARM 独享的,GNU 汇编由一系列的语句组成,每行一条语句,每条语句有三个可选部分,如下:
label: instruction @ comment
- label: 即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到指令的地址,标号也可以用来表示数据地址。注意 label 后面的“:”,任何以“:”结尾的标识符都会被识别为一个标号。
- instruction:即指令,也就是汇编指令或伪指令。
- @符号:表示后面的是注释,就跟 C 语言里面的“/”和“/”一样,其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。
- comment: 就是注释内容。
举例:
add:
MOVS RO, #0X12 @设置R0=0X12
“add:”就是标号,“MOVS R0,#0X12”就是指令,最后的“@设置 R0=0X12”就是注释。
1.2 段
用户可以使用.section伪操作来定义一个段,汇编系统预定义了一些段名:
.text:代码段
.data:初始化的数据段
.bss:为初始化的数据段
.rodata:只读数据段
也可以自己使用.section来定义一个段,每个段以段名开始,以下一段名或文件结尾结束,比如:
.section .testsection @定义一个testsection段
汇编程序的默认入口标号为_start,也可以在链接脚本中使用ENTRY指明其它的入口点,下面的代码使用_start作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
.global 是伪操作,表示_start 是一个全局标号,类似 C 语言里面的全局变量一样,常见的伪操作有:
- .byte:定义单字节数据,比如.byte 0x12。
- .short:定义双字节数据,比如.short 0x1234。
- .long:定义一个 4 字节数据,比如.long 0x12345678。
- .equ:赋值语句,格式为:
.equ 变量名,表达式,比如.equ num, 0x12,表示 num=0x12。 - .align:数据字节对齐,比如:.align 4 表示 4 字节对齐。
- .end:表示源文件结束。
- .global:定义一个全局符号,格式为:.global symbol,比如:.global _start。
1.3 函数
GNU汇编支持函数,函数格式为:
函数名:
函数体
返回语句 @ 不是必须的
返回语句不是必须的。
2 Cortex-A7常用汇编指令
参考:《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的A4章节
2.1 处理器内部数据传输指令
处理器内部传输数据,常见的操作有:
- 将数据从一个寄存器传递到另外一个寄存器。
- 将数据从一个寄存器传递到特殊寄存器,如CPSR和SPSR寄存器。
- 将立即数传递到寄存器。
数据传输常用的指令有3个:MOV、MRS、MSR,用法如下:
| 指令 | 目的 | 源 | 描述 |
|---|---|---|---|
| MOV | R0 | R1 | 将R1里面的数据复制到R0中 |
| MRS | R0 | CPSR | 将特殊寄存器CPSR里面的数据复制到R0中 |
| MSR | CPSR | R1 | 将R1里面的数据复制到特殊寄存器CPSR中 |
- MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄存器里面,使用示例如下:
MOV RO, R1 @将寄存器R1中的数据传递给R0寄存器
MOV R0, #0X12 @将立即数0X12传递给R0寄存器
- MRS 指令用于将特殊寄存器(如 CPSR 和 SPSR)中的数据传递给通用寄存器,要读取特殊寄存器的数据只.能使用 MRS 指令,使用示例如下:
MRS R0, CPSR @将特殊寄存器 CPSR 里面的数据传递给 R0,即 R0=CPSR
- MSR 指令和 MRS 刚好相反,MSR 指令用来将普通寄存器的数据传递给特殊寄存器,也就是写特殊寄存器,写特殊寄存器只能使用 MSR,使用示例如下:
MSR CPSR, R0 @将 R0 中的数据复制到 CPSR 中,即 CPSR=R0
2.2 存储器访问指令
ARM 不能直接访问存储器,比如 RAM 中的数据,用汇编操作RAM需要借助存储器访问指令,一般先将要配置的值写入到 Rx(x=0~12)寄存器中,然后借助存储器访问指令将 Rx 中的数据写入到RAM,读取过程相反。
常用的存储器访问指令有两种:LDR 和 STR:
| 指令 | 描述 |
|---|---|
| LDR Rd, [Rn, #offset] | 从存储器 Rn+offset 的位置读取数据存放到 Rd 中 |
| STR Rd, [Rn, #offset] | 将 Rd 中的数据写入到存储器中的 Rn+offset 位置 |
- LDR 主要用于从存储加载数据到寄存器 Rx 中,LDR 也可以将一个立即数加载到寄存器 Rx中,LDR 加载立即数的时候要使用“=”,而不是“#”。在嵌入式开发中,LDR 最常用的就是读取 CPU 的寄存器值,比如 I.MX6UL 有个寄存器 GPIO1_GDIR,其地址为 0X0209C004,我们现在要读取这个寄存器中的数据,示例代码如下:
LDR R0, =0X0209C004 @将寄存器地址0X0209C004加载到R0中
LDR R1, [R0] @读取地址0X0209C004中的数据到R1寄存器中
读取寄存器 GPIO1_GDIR 中的值,读取到的寄存器值保存在 R1 寄存器中,上面代码中 offset 是 0,也就是没有用到 offset。
- STR 就是将数据写入到存储器中,同样以 I.MX6UL 寄存器GPIO1_GDIR 为例,现在我们要配置寄存器 GPIO1_GDIR 的值为 0X20000002,示例代码如下:
LDR R0, =0X0209C004 @将寄存器地址0X0209C004加载到R0中
LDR R1, =0X20000002 @R1保存要写入到寄存器的值
STR R1, [R0] @将R1中的值写入到R0中保存的地址中
LDR 和 STR 都是按照字进行读取和写入的,也就是操作的 32 位数据,如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H,比如按字节操作的指令就是 LDRB 和 STRB,按半字操作的指令就是 LDRH 和 STRH。
2.3 压栈和出栈指令
函数调用时,在调用函数之前,需要将调用者的当前处理器信息保存起来(也就寄存器),当被调用函数执行完之后需要恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作,恢复现场就要进行出栈操作。
压栈的指令为 PUSH,出栈的指令为 POP,PUSH 和 POP 是一种多存储和多加载指令,即可以一次操作多个寄存器数据,他们利用当前的栈指针 SP 来生成地址,PUSH 和 POP 的用法如下:
| 指令 | 描述 |
|---|---|
| PUSH <reg_list> | 将寄存器列表存入栈中 |
| POP <reg_list> | 从栈中恢复寄存器列表 |
- 假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈,当前的 SP 指针指向 0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
PUSH {R0~R3, R12} @将R0~R3和R12压栈
压栈完成后的堆栈如图:

- 出栈的就是从栈顶,也就是 SP 当前执行的位置开始,地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。比如:
POP {R0~R3, R12} @恢复R0~R3,R12
PUSH 和 POP 的另外一种写法是“STMFD SP!”和“LDMFD SP!”,上面的代码可以改为:
STMFD SP!, {R0~R3, R12} @将R0~R3和R12压栈
LDMFD SP!, {R0~R3, R12} @出栈,恢复R0~R3和R12
STMFD 可以分为两部分:STM 和 FD,同理LDMFD 也可以分为 LDM 和 FD。STM 和 LDM 就是多存储和多
加载,可以连续的读写存储器中的多个连续数据(区别于STR和LDR)。
FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈,SP 指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长的堆栈,因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址,编号高的对应高地址。
2.4 跳转指令
有多种跳转操作,比如:
- 直接使用跳转指令 B、BL、BX 等。
- 直接向 PC 寄存器里面写入数据。
上述两种方法都可以完成跳转操作,但是一般常用的还是 B、BL 或 BX,用法如下:
| 指令 | 描述 |
|---|---|
| B <label> | 跳转到label,如果跳转范围超过了+/-2KB,可以指定B.W <label>使用32位的跳转指令 |
| BX <Rm> | 间接跳转,跳转到存放于Rm中的地址处,并且切换指令集 |
| BL <label> | 跳转到标号地址,并将返回地址保存到LR链接寄存器中 |
| BLX <Rm> | 跳转到Rm指定的地址,并将返回地址保存到LR中,切换指令集 |
使用较多的是B指令和BL指令。
- B指令:B 指令会将 PC 寄存器的值设置为跳转目标地址, 一旦执行 B 指令,ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处,那就可以用 B 指令,如下示例:
_start:
ldr sp, =0x80200000 @设置栈指针
b main @跳转到main函数
上述代码就是典型的在汇编中初始化 C 运行环境,然后跳转到 C 文件的 main 函数中运行。
- BL指令:在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值,所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行,这是子程序调用一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的,主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数,处理函数执行完毕后需要返回,恢复现场,比如:
push {r0, r1} @ 保存r0, r1
cps #0x13 @ 进入SVC模式,允许其它中断再次进入
bl system_irqhandler @加载C语言中断处理函数
cps #0x12 @ 进入IRQ模式
POP {r0, r1} @ 出栈
str r0, [r1, #0x10] @ 中断执行完成,写EOIR
2.5 算术运算指令
汇编进行算术运算,比如加减乘除,常用运算指令如下:

2.6 逻辑运算指令
汇编语言也可以使用逻辑运算指令,常用的运算指令用法:

ARM汇编基础的更多相关文章
- GNU ARM 汇编基础
ARM GNU汇编基础 0 前言 全文补充提醒: 笔者在阅读ARM官方文档及查阅实际的u-boot源码中的汇编代码后,发现了一些不同于ARM官方文档中的汇编语法,查阅相关资料后,才发现主要由于汇编器的 ...
- iOS程序破解——ARM汇编基础
原文在此:http://www.cnblogs.com/mddblog/p/4951650.html 一.Thumb指令与ARM指令 Thumb指令为16位,因此存储代码的密度高,节省存储空间.但是功 ...
- ARM汇编基础指令
Cortex-A7 常用汇编指令 一.处理器内部数据传输指令 1.mov 将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄存器里面 MOV R0,R1 @将寄存器 R1 中的数据传递给 ...
- Arm寄存器介绍及汇编基础
一.ARM处理器支持7种工作模式 ① 用户模式(USR): 用于正常执行程序(The normal ARM program execution state) ② 快速中断模式(FIQ): 用于高速数据 ...
- 入门 ARM 汇编(一)—— 知识铺垫
我读着史铁生的散文,零碎的牵扯起我生命中不曾出现过的记忆,一如北方的黄山厚土之中悠忽而来的忧伤的信天游,那些灿若信仰一样的阳光以及阳光下虔诚的子民.我想有一次远行,于细碎流淌的时光与路途之中,观察所有 ...
- iOS 逆向之ARM汇编
最近对iOS逆向工程很感兴趣. 目前iOS逆向的书籍有: <Hacking and Securing IOS Applications>, <iOS Hacker's Handboo ...
- 12 ARM汇编
Android系统采用java作为平台软件基础开发语言,NDK使Android平台可以运行C/C++代码这些代码汇编成ARM的elf可执行文件. 原生程序生成过程 经历4步:1.预处理2.编译3.汇编 ...
- ARM汇编指令特点
根据朱有鹏老师课程笔记整理而来: (汇编)指令是CPU机器指令的助记符,经过编译后会得到一串1 0组成的机器码,由CPU读取执行. (汇编)伪指令本质上不是指令(只是和指令一起写在代码中),它是编译器 ...
- 生成ARM汇编
使用ndk即可生成arm汇编 1.首先写好hello.c 2.编写makefile #ndk根目录 NDK_ROOT=E:\Android\android-ndk-r10b #编译器根目录 TOOLC ...
- ARM汇编指令调试方法
学习ARM汇编时,少不了对ARM汇编指令的调试.作为支持多语言的调试器,gdb自然是较好的选择.调试器工作时,一般通过修改代码段的内容构造trap软中断指令,实现程序的暂停和程序执行状态的监控.为了在 ...
随机推荐
- Flutter笔记-基础组件
图片和Icon 加载网络图片以及本地图片 Image( image: NetworkImage( "https://img-s-msn-com.akamaized.net/tenant/am ...
- 浏览器端实现类似input限制输入两位小数,输入时光标从输入位置移动到最后
1.问题描述展示 示例代码所做限制为不允许输入字母d,其他限制规则可以根据需求自己调整,使用React编写,其他框架或原生均可根据该代码理解原理进行转变,特意使用了中文键盘可以看到输入框下面白色框闪出 ...
- C++ 构造函数实战指南:默认构造、带参数构造、拷贝构造与移动构造
C++ 构造函数 构造函数是 C++ 中一种特殊的成员函数,当创建类对象时自动调用.它用于初始化对象的状态,例如为属性分配初始值.构造函数与类同名,且没有返回值类型. 构造函数类型 C++ 支持多种类 ...
- 力扣506(java)-相对名次(简单)
题目: 给你一个长度为 n 的整数数组 score ,其中 score[i] 是第 i 位运动员在比赛中的得分.所有得分都互不相同 . 运动员将根据得分 决定名次 ,其中名次第 1 的运动员得分最高, ...
- 力扣38(java)-外观数列(中等)
题目: 给定一个正整数 n ,输出外观数列的第 n 项. 「外观数列」是一个整数序列,从数字 1 开始,序列中的每一项都是对前一项的描述. 你可以将其视作是由递归公式定义的数字字符串序列: count ...
- 基于 OPLG 从 0 到 1 构建统一可观测平台实践
简介: 随着软件复杂度的不断提升,单体应用架构逐步向分布式和微服务的架构演进,整体的调用环境也越来越复杂,仅靠日志和指标渐渐难以快速定位复杂环境下的问题.对于全栈可观测的诉求也变得愈加强烈,Trace ...
- Serverless Devs 的官网是如何通过 Serverless Devs 部署的
简介: 只有自己吃自己的狗粮,自己做的东西才不"".Serverless Devs 自发展之处到现在,已经经历了几个月的时间,在这几个月,Serverless Devs 的成长是迅 ...
- [Blockchain] Cosmos Starport 安装的三种方式
官方二进制包方式: # 下载 starport 二进制到 /usr/local/bin $ curl https://get.starport.network/starport! | bash # ...
- 网站访问速度优化实战:CDN源/Nginx压缩/全站CDN加速
前言 接触到CDN的起因: 我自己搭建的网站https://price.monitor4all.cn/网页打开的速度一直比较慢,经查证是我的网站有很多静态js大文件,通过浏览器读取这些js比较耗时间. ...
- 11、操作系统安全加固-Windows 加固
1.账号管理与认证授权 1.1.按用户类型分配账号 目的:根据系统要求,设定不同账户和组,管理员.数据库sa.审计用户.来宾用户等 实施方法: 打开本地用户和计算机管理器 或 打开运行,输入 lusr ...