android ARM 汇编学习—— 在 android 设备上编译c/cpp代码并用objdump/readelf等工具分析

adb putty 连上手机,用busybox vi 写一个 helloworld c

root@HM2014813:/data/local/tmp # busybox vi hello.c

#include <stdio.h>

int main(int argc, char* argv[])
{
  printf("Hello ARM World\n");
  return 0;
}

用 gcc 编译成汇编,并查看

root@HM2014813:/data/local/tmp # gcc hello.c -S && cat ./hello.s

  .arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 34, 0
.eabi_attribute 18, 4
.file "hello.c"
.section .rodata
.align 2
.LC0:
.ascii "Hello ARM World\000"
.text
.align 2
.global main
.type main, %function
main:
@ args = 0, pretend = 0, frame = 8
@ frame_needed = 1, uses_anonymous_args = 0
stmfd sp!, {fp, lr}
add fp, sp, #4
sub sp, sp, #8
str r0, [fp, #-8]
str r1, [fp, #-12]
ldr r3, .L3
.LPIC0:
add r3, pc, r3
mov r0, r3
bl puts(PLT)
mov r3, #0
mov r0, r3
sub sp, fp, #4
@ sp needed
ldmfd sp!, {fp, pc}
.L4:
.align 2
.L3:
.word .LC0-(.LPIC0+8)
.size main, .-main
.ident "GCC: (GNU) 4.8.2"
.section .note.GNU-stack,"",%progbits

下面开始分析:

.arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 34, 0
.eabi_attribute 18, 4
.file "hello.c"

开始这几行是给 ARM cpu 的声明,.arch 指明体系架构类型, .fpu 指明 Floating Point Unit  浮点运算单元的运算模式,接下去几行是  ARM Embedded Application Binary Interface EABI 的 option, 最后一行指明文件名称

 .section        .rodata
.align 2
.LC0:
.ascii "Hello ARM World\000"

c code 里的字符串 "Hello ARM World\n" 编译后存入 .rodata section 。

 .text
.align 2
.global main
.type main, %function
main:

上面这几行是函数声明,在 .text section , 函数名是 main

.LC0:
.ascii "Hello ARM World\000" ; label .LC0 对应的内存地址存放字符串,或者说 .LC0 存放的是字符串的首地址
.text
.align 2
.global main
.type main, %function
stmfd   sp!, {fp, lr}   ; 压栈,栈向地地址生长,sp 保存着栈顶地址, fp 是帧指针,lr 是返回地址
               ; fp : 在C程序编译过程中,函数局部变量被分配在一个连续存储区内,这个连续存储区就是该函数的帧
               ; 这句指令效果是,帧指针被保存在栈顶位置,lr 指针被保存在地址为 (fp - 4Byte) 的位置上(因为一条指令是4Byte),然后sp生长2个指针长度,即往低地址移动 8 个字节 add fp, sp, #4 ; fp = sp + 4
sub sp, sp, #8 ; sp = sp - 8, 这一句和接下来给 r0,r1赋值的两句都没看懂
str r0, [fp, #-8]
str r1, [fp, #-12]
ldr r3, .L3 ; 将 label .L3 的值赋给 r3 , .L3 是一个label, 可以理解为一个地址, 这个地址是这么算的 .LC0-(.LPIC0+8)
              ; .LC0 是要打印的字符串的地址, .LPIC0 其实是指令 ‘add r3,pc,r3’ 的地址, +8 即往前越2条指令,所以其实是指令 'bl puts(PLT)' 的地址,即调用printf函数的地址
              ; 结合起来看, .L3 保存的是要打印的字符串的地址和跳转指令的地址的 offset, 这个 offset 的作用是? 这个 offset 加上 pc 之后就是字符串的地址
.LPIC0:
add r3, pc, r3 ; ArmV5 的流水线是3,意味着执行这条指令的时候,pc 的值指向的指令是 bl puts(PLT), r3 即 .L3 , 加起来就是要打印的字符串的地址
mov r0, r3 ; 将字符串地址保存在 r0
bl puts(PLT) ; 打印
mov r3, #0
mov r0, r3 ; return 0
sub sp, fp, #4
@ sp needed
ldmfd sp!, {fp, pc} ; 恢复pc寄存器,跳出函数
.L4:
.align 2
.L3:
.word .LC0-(.LPIC0+8)
.size main, .-main
.ident "GCC: (GNU) 4.8.2"
.section .note.GNU-stack,"",%progbits

上面这个过程比较难理解的是,传给printf的字符串的地址是动态算出来的,  .LC0-(.LPIC0+8) + pc ,为什么这么做,网上找了个大概靠谱的解释:http://tieba.baidu.com/p/2983668645

ARM立即数在我的印象里最大是4096再大就只能相对寻址,显然所有的指针都只能间接寻址,也就是需要一个内存来存地址那就是L3。。。。L3是个常量,存LPIC0到字符串LC0的相对位置,只要PC+该相对位置就是字符串位置,因为ARM9是3级流水线一次区取条指令,你当前的PC位置并不是紧接的下一条,而是下3条的位置,通常单片机是1级流水线当前PC就是下条的位置,不用加减任何数,但ARM9需要+8 如果是ARM11的五级流水线加的更多。。。。
ARM不能像单片机那样,想取某个标签地址,就可以 mov r1,#标签 因为ARM立即数寻址有限制。。。所有的指针都会超过限制,所以会用另一种方式直接算出寻址位置的地址和
全局变量位置的相对地址,在调用时用PC+相对地址即可 但要 PC+(相对地址-8), 因为
仪的在减号后面的括号里面所以 按结合律规则 -8编程+8

参考 :

Android ARM Assembly: Registers, Memory and Addressing Modes

ARMv7匯編代碼分析

android ARM 汇编学习 —— hello world的更多相关文章

  1. android ARM 汇编学习—— 在 android 设备上编译c/cpp代码并用objdump/readelf等工具分析

    学习 android 逆向分析过程中,需要学习 Arm 指令,不可避免要编写一些 test code 并分析其指令,这是这篇文档的背景. 在目前 android 提供的开发环境里,如果要编写 c / ...

  2. arm汇编学习(五)

    新增个手写GNU语法arm的方法,以后可以狂逆狂写 hello.S文件 .data msg: .ascii "Hello, ARM!\n" len = . - msg .text ...

  3. arm汇编学习(四)

    一.android jni实现1.静态实现jni:先由Java得到本地方法的声明,然后再通过JNI实现该声明方法.2.动态实现jni:先通过JNI重载JNI_OnLoad()实现本地方法,然后直接在J ...

  4. arm汇编学习(三)

    一.ndk编译android上运行的c程序 新建个hello目录,底下要有jni目录,下面就是Android.mk文件 1.Android.mk文件内容如下: LOCAL_PATH:= $(call ...

  5. ARM汇编学习笔记

    ARM  RISC  (Reduced Instruction Set Computers) X86   CISC  (Complex Instruction Set Computers)      ...

  6. Android ARM指令学习

    在逆向分析Android APK的时候,往往需要分析它的.so文件.这个.so文件就是Linux的动态链接库,只不过是在ARM-cpu下编译的.所以学习Android下的ARM指令很重要.目前,市面上 ...

  7. arm汇编学习(六)---跳转到thumb状态

    通常函数返回使用 pop {r7,pc}或bx lr等方式(bx,b类似jmp为跳转指令,但bx可以指定跳转区域究竟为thumb还是arm指令.thumb指令指令的时候,直接填写该地址却总是产生SIG ...

  8. ARM 汇编学习笔记

  9. ARM学习笔记11——GNU ARM汇编程序设计

    GNU ARM汇编程序设计中,每行的语法格式如下: [<label>:] [<instruction | directive | pseudo-instruction>] @c ...

随机推荐

  1. BZOJ1270[BJWC2008]雷涛的小猫

    雷涛同学非常的有爱心,在他的宿舍里,养着一只因为受伤被救助的小猫(当然,这样的行为是违反学生宿舍管理条例的).在他的照顾下,小猫很快恢复了健康,并且愈发的活泼可爱了. 可是有一天,雷涛下课回到寝室,却 ...

  2. 3.爬虫 urlib库讲解 总结

    urllib库的总结: 用ProcessOn(安利这个软件,够用了)根据前面的几节内容做了个思维导图. urllib库一共有四个模块: request:它是最基本的模块,可以用来模拟发送请求 erro ...

  3. Linux下的命令行

    一.文件传输(两种方式) 1. 使用CRT传输 1. 一定要修改编码为UTF-8类型 1. 按住alt + p 切换成传输文件的窗口,然后拖拽文件进来即可 2. 使用类似xftp这种软件传输 这种软件 ...

  4. restFul介绍及其使用规范

    什么是REST和RESTful API? REST:(英文:Representational State Transfer,简称REST)表征性状态转移,是一种软件架构风格. RESTful : RE ...

  5. wutianqi 博客 母函数

    母函数(Generating function)详解 — Tanky Woo 在数学中,某个序列的母函数(Generating function,又称生成函数)是一种形式幂级数,其每一项的系数可以提供 ...

  6. online community

    online community spectrum https://spectrum.chat/xgqfrms https://community.xgqfrms.xyz/ https://spect ...

  7. CTSC2018 & APIO2018 颓废 + 打铁记

    CTSC2018 & APIO2018 颓废 + 打铁记 CTSC 5 月 6 日 完美错过报道,到酒店领了房卡放完行李后直接奔向八十中拿胸牌.饭票和资料.试机时是九省联考的题,从来没做过,我 ...

  8. POJ3415 Common Substrings 【后缀数组 + 单调栈】

    常见的子串 时间限制: 5000MS   内存限制: 65536K 提交总数: 11942   接受: 4051 描述 字符串T的子字符串被定义为: Ť(我,ķ)= Ť 我 Ť 我 1 ... Ť I ...

  9. React context基本用法

    React的context就是一个全局变量,可以从根组件跨级别在React的组件中传递.React context的API有两个版本,React16.x之前的是老版本的context,之后的是新版本的 ...

  10. bcc

    #include<bits/stdc++.h> using namespace std; #define mxn 510 struct E{ int from,to; }; int dfn ...