Linux Debugging(二): 熟悉AT&T汇编语言
没想到《Linux Debugging:使用反汇编理解C++程序函数调用栈》发表了收到了大家的欢迎。但是有网友留言说不熟悉汇编,因此本书列了汇编的基础语法。这些对于我们平时的调试应该是够用了。
1 AT&T与Intel汇编语法对比
本科时候大家学的基本上都是Intel的8086汇编语言,微软采用的就是这种格式的汇编。GCC采用的是AT&T的汇编格式, 也叫GAS格式(Gnu ASembler GNU汇编器)。
1、寄存器命名不同
| AT&T | Intel | 说明 |
| %eax | eax | Intel的不带百分号 |
2、操作数顺序不同
| AT&T | Intel | 说明 |
| movl %eax, %ebx | mov ebx, eax | Intel的目的操作数在前,源操作数在后;AT&T相反 |
3、常数/立即数的格式不同
| AT&T | Intel | 说明 |
| movl $_value,%ebx | mov eax,_value | Intel的立即数前面不带$符号 |
| movl $0xd00d,%ebx | mov ebx,0xd00d | 规则同样适用于16进制的立即数 |
4、操作数长度标识
| AT&T | Intel | 说明 |
| movw %ax,%bx | mov bx,ax | Intel的汇编中, 操作数的长度并不通过指令符号来标识。 AT&T的格式中, 每个操作都有一个字符后缀, 表明操作数的大小. 例如:mov指令有三种形式: movb 传送字节 movw 传送字 movl 传送双字 如果没有指定操作数长度的话,编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”,由于目标操作数bx的长度为word,那么编译器将把此指令等同于“movw %ax, %bx”。 |
5、寻址方式
| AT&T | Intel | 说明 |
| imm32(basepointer, indexpointer, indexscale) |
[basepointer + indexpointer*indexscale + imm32) |
两种寻址的实际结果都应该是 imm32 + basepointer + indexpointer*indexscale |
例如: 下面是一些寻址的例子:
| AT&T | Intel | 说明 |
| mov 4(%ebp), %eax | mov eax, [ebp + 4] | 基址寻址(Base Pointer Addressing Mode),用于访问结构体成员比较方便,例如一个结构体的基地址保存在eax寄存器中,其中一个成员在结构体内的偏移量是4字节,要把这个成员读上来就可以用这条指令 |
data_items(,%edi,4) |
[data_items+edi*4 | 变址寻址(Indexed Addressing Mode),访问数组 |
| movl $addr, %eax | mov eax, addr | 直接寻址(Direct Addressing Mode) |
movl (%eax), %ebx |
mov ebx, [eax] | 间接寻址(Indirect Addressing Mode),把eax寄存器的值看作地址,把内存中这个地址处的32位数传送到ebx寄存器 |
|
mov $12, %eax |
mov eax, 12 | 立即数寻址(Immediate Mode) |
| mov $12, %eax | mov eax, 12 | 寄存器寻址(Register Addressing Mode |
6.跳转方式不同
AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。
| AT&T | Intel | 说明 |
| jmp *%eax | jmp %eax | 用寄存器%eax中的值作为跳转目标 |
| jmp *(%eax) | jmp (%eax) | 以%eax中的值作为读入的地址, 从存储器中读出跳转目标 |
2 求一个数组最大数
通过求一个数组的最大数,来进一步学习AT&T的语法
- #PURPOSE: This program finds the maximum number of a
- # set of data items.
- #
- #VARIABLES: The registers have the following uses:
- #
- # %edi - Holds the index of the data item being examined
- # %ebx - Largest data item found
- # %eax - Current data item
- #
- # The following memory locations are used:
- #
- # data_items - contains the item data. A 0 is used
- # to terminate the data
- #
- .section .data #全局变量
- data_items: #These are the data items
- .long 3,67,34,222,45,75,54,34,44,33,22,11,66,0
- .section .text
- .globl _start
- _start:
- movl $0, %edi # move 0 into the index register
- movl data_items(,%edi,4), %eax # load the first byte of data
- movl %eax, %ebx # since this is the first item, %eax is
- # the biggest
- start_loop: # start loop
- cmpl $0, %eax # check to see if we've hit the end
- je loop_exit
- incl %edi # load next value
- movl data_items(,%edi,4), %eax
- cmpl %ebx, %eax # compare values
- jle start_loop # jump to loop beginning if the new
- # one isn't bigger
- movl %eax, %ebx # move the value as the largest
- jmp start_loop # jump to loop beginning
- loop_exit:
- # %ebx is the status code for the _exit system call
- # and it already has the maximum number
- movl $1, %eax #1 is the _exit() syscall
- int $0x80
汇编程序中以.开头的名称并不是指令的助记符,不会被翻译成机器指令,而是给汇编器一些特殊指示,称为汇编指示(Assembler Directive)或伪操作(Pseudo-operation),由于它不是真正的指令所以加个“伪”字。.section指示把代码划分成若干个段(Section),程序被操作系统加载执行时,每个段被加载到不同的地址,操作系统对不同的页面设置不同的读、写、执行权限。.data段保存程序的数据,是可读可写的,相当于C++程序的全局变量。
.text段保存代码,是只读和可执行的,后面那些指令都属于.text段。
.long指示声明一组数,每个数占32;.quad类似,占64位;.byte是8位;.word 是16位。.ascii,例如.ascii "Hello world",声明11个数,取值为相应字符的ASCII码。
参考资料:
1. 最简单的汇编程序
2. 第二个汇编程序
3. http://blog.chinaunix.net/uid-27717694-id-3942757.html
最后复习一下lea命令:
mov 4(%ebp) %eax #将%ebp+4地址处所存的值,mov到%eax
leal 4(%ebp) %eax #将%ebp+4的地址值, mov到%eax
leal 可以被mov取代:
addl $4, %ebp
mov. %ebp, %eax
Linux Debugging(二): 熟悉AT&T汇编语言的更多相关文章
- Linux内核设计第一周 ——从汇编语言出发理解计算机工作原理
Linux内核设计第一周 ——从汇编语言出发理解计算机工作原理 作者:宋宸宁(20135315) 一.实验过程 图1 编写songchenning5315.c文件 图2 将c文件汇编成32位机器语言 ...
- Linux学习(二)-Xshell 5和Xftp 5的安装和使用
(一)软件介绍: (1)Xshell: Xshell通过互联网可以连接到远程的服务器,然后通过模拟终端来实现对服务器的各种操作,而且这款软件可以很好的解决中文乱码问题,非常的方便快捷. (2)Xftp ...
- Linux Debugging(五): coredump 分析入门
作为工作几年的老程序猿,肯定会遇到coredump,log severity设置的比较高,导致可用的log无法分析问题所在. 更悲剧的是,这个问题不好复现!所以现在你手头唯一的线索就是这个程序的尸体: ...
- Linux Debugging(三): C++函数调用的参数传递方法总结(通过gdb+反汇编)
上一篇文章<Linux Debugging:使用反汇编理解C++程序函数调用栈>没想到能得到那么多人的喜爱,因为那篇文章是以32位的C++普通函数(非类成员函数)为例子写的,因此只是一个特 ...
- Linux(二)—— Unix&Linux 的基本概念
Linux(二)-- Unix&Linux 的基本概念 计算机 = 主机(host)+ 终端(terminal) 主机 = 内核 + 实用工具 内核(kernel) 当计算机启动时,计算机要经 ...
- 一、Linux概述 二、Linux的安装 三、Linux的常用命令(重点)
一.Linux概述###<1>操作系统 OS,管理和控制 计算机的 硬件和软件资源的 计算机程序. 最基本的系统软件. 是用户和计算机交互的桥梁,是硬件和软件交互的桥梁. 操作系统:she ...
- Linux(二):VMware虚拟机中Ubuntu安装详细过程
Linux(二):VMware虚拟机中Ubuntu安装详细过程 目录 1 准备 2 安装 2.1 虚拟机的建立 2.2 虚拟机安装Ubuntu系统 2.3 虚拟机设置 3 完成 1 准备 1.操作系统 ...
- Linux第一二章笔记
第一章 Linux内核简介 1. Unix内核的特点 简洁:仅提供系统调用并有一个非常明确的设计目的 抽象:几乎所有东西都被当做文件 可移植性:使用C语言编写,使得其在各种硬件体系架构面前都具备令人惊 ...
- 小白Linux入门 二
参考: http://edu.51cto.com/lesson/id-11222.html CPU中有计算单元 控制单元.它通过桥接芯片与存储器进行匹配 其中北桥是高速 南桥是低速 包括IDE USB ...
随机推荐
- ubuntu14.04拼音输入法问题的解决方法
14.04的自带的拼音输入法,打字的时候你会发现有很大的问题,打不出来一个完整的字. 解决方法: ibus-daemon -drx //重启ibus进程 在终端里输一次这个命令就ok了. 或者装个 ...
- Spring完全基于Java配置和集成Junit单元测试
要点: 配置继承WebApplicationInitializer的类作为启动类,相当于配置web.xml文件 使用@Configuration注解一个类,在类中的方式使用@Bean注解,则表名该方法 ...
- NLP系列(2)_用朴素贝叶斯进行文本分类(上)
作者:龙心尘 && 寒小阳 时间:2016年1月. 出处: http://blog.csdn.net/longxinchen_ml/article/details/50597149 h ...
- python获取指定时间差的时间
在分析数据的时间经常需要截取一定范围时间的数据,比如三天之内,两小时前等等时间要求的数据,因此将该部分经常需要用到的功能模块化,方便以后以后用到的时候复用.在此,也分享给大家. <span st ...
- iOS 应用提交到iTunes Connect,显示"正在处理"后消失不见
打包上传iTunes Connect 成功后,进入iTunes Connect 会看到如下的构建信息: 可是,过一会再刷新该页面,构建的版本就消失了. 出现如上所述的情况,主要目前已知的有两种原因: ...
- Android属性动画完全解析(下),Interpolator和ViewPropertyAnimator的用法
转载请注明出处:http://blog.csdn.net/guolin_blog/article/details/44171115 大家好,欢迎继续回到Android属性动画完全解析.在上一篇文章当中 ...
- docker 部署cassandra
摘要 本文主要介绍在redhat7 平台,利用docker 部署cassandra 集群,除了介绍基本的部署步骤,另外主要 讨论类似于cassandra 这种分布式集群系统部署 docker如何进行网 ...
- java创建线程
创建一个线程 Java提供了两种创建线程方法: 通过实现Runable接口: http://blog.csdn.net/duruiqi_fx/article/details/52187275 通过继承 ...
- XMPP(一)-openfire服务端的安装和搭建
XMPP全称:可扩展通讯和表示协议 简介:可扩展通讯和表示协议 (XMPP) 可用于服务类实时通讯.表示和需求响应服务中的XML数据元流式传输.XMPP以Jabber协议为基础,而Jabber是即时通 ...
- 集合框架之Collection接口
Collection 层次结构中的根接口.Collection表示一组对象,这些对象也称为 collection 的元素.一些 collection 允许有重复的元素,而另一些则不允许.一些 coll ...