gcc 源代码分析-前端篇2

2. 对ID及保留字的处理

在c语言中，系统预留了非常多keyword。也被称为保留字，比方表示数据类型的int,short,char,控制分支运行的if,then等。

不论什么keyword，本质上也是一个ID，比方它也有长度，对int就是3。对short就是5，也有内容，比方int,short。但比起一般id,

   它还有其它一些属性，比方表示数据类型的int,它有一个数值范围，它的值范围是-xxx到xxx之间。

   因为这种关系，gcc把ID和keyword都保存在一张表中，这张表定义例如以下：

                                         #define MAX_HASH_TABLE 1009

                                          tree hash_table[MAX_HASH_TABLE];   /* id hash buckets */

   同一时候定义了一个函数get_identifier (text) 来操纵这一张表：



       函数详细实现就是通过传入的字串查找该id,假设没有则创建这个ID，这里new了一个tree_identifier，同一时候把它保存在hash_table表中，为了加快查找，这里用到了hash算法。在这里我们见到了struct tree_common结构体chain成员的使用方法，对于hash算法来说，非常难避免冲突，对于传入的不同字串，有可能它算出的hash值是一样的，这时候。我们就把相冲突的ID放在chain成员变量中；

      函数的最后给tree_identifier的成员length,pointer附值。

   gcc 在运行之初，便開始创建这些表示数据类型的keyword。比方int,short,char,void,这个在函数init_lex依次创建，并把创建的相相应的

   tree 结点附给：

       ridpointers[(int) RID_INT]

       ridpointers[(int) RID_CHAR]

       ridpointers[(int) RID_VOID]

       ridpointers[(int) RID_SHORT]

   keyword的ID生成了，还有附一些其它參数，这个过程是在init_decl_processing完毕；在GCC中要表示一个数据类型，要用到以下的结构：

struct tree_type

{

char common[sizeof (struct tree_common)];

union tree_node *values;

union tree_node *sep;

union tree_node *size;

enum machine_mode mode : 8;

unsigned char size_unit;

unsigned char align;

unsigned char sep_unit;

union tree_node *pointer_to;

union tree_node *reference_to;

int parse_info;

int symtab_address;

union tree_node *name;

union tree_node *max;

union tree_node *next_variant;

union tree_node *main_variant;

union tree_node *basetypes;

union tree_node *noncopied_parts;

/* Points to a structure whose details depend on the language in use. */

struct lang_type *lang_specific;

};

   在表示int型的数据类型中，它的两个成员变量sep。max比較重要; sep表示它的最小值。而max表示它的最大值；

   在函数make_signed_type中创建了一个 INTEGER_TYPE 类型的tree 节点；它实际上是一个 struct tree_type 类型的节点，

   在该函数中，创建的节点的sep,max成员被赋予INTEGER_CST 节点，它实际上是一个struct tree_int_cst类型节点：

struct tree_int_cst

{

char common[sizeof (struct tree_common)];

long int_cst_low;

long int_cst_high;

};

能够看出。它有两个成员特殊成员：int_cst_low，int_cst_high

对于最小值。它给出的值是: int_cst_low=0x80000000,int_cst_high=0xffffffff

对于最大值，它给出的值是：int_cst_low=0x7fffffff,int_cst_high=0x0

它们均是在build_int_2 函数中创建；

在函数make_signed_type的最后layout_type中，设定int 型数据节点的size成员。它也是一个struct tree_int_cst类型节点，仅仅是它的

   int_cst_low值是4,而int_cst_high为0。

   这样int型节点生成了，这个节点数据和它的ID。最后被封装成一个声明类型节点，它用struct tree_decl结构体表示：

struct tree_decl

{

  char common[sizeof (struct tree_common)];

  char *filename;

  int linenum;

  union tree_node *size;

  enum machine_mode mode : 8;

  unsigned char size_unit;

  unsigned char align;

  unsigned char voffset_unit;

  union tree_node *name;

  union tree_node *context;

  int offset;

  union tree_node *voffset;

  union tree_node *arguments;

  union tree_node *result;

  union tree_node *initial;

  char *print_name;

  char *assembler_name;

  struct rtx_def *rtl;    /* acts as link to register transfer language

                   (rtl) info */

  int frame_size;        /* For FUNCTION_DECLs: size of stack frame */

  struct rtx_def *saved_insns;    /* For FUNCTION_DECLs: points to insn that

                   constitutes its definition on the

                   permanent obstack.  */

  int block_symtab_address;

  /* Points to a structure whose details depend on the language in use.  */

  struct lang_decl *lang_specific;

};

能够看出，这是一个巨复杂的结构，int 类型节点转变成一个int 声明节点过程中。它将生成一个struct tree_decl节点，它的

成员变量name将是int 的ID节点值，它的type 就是刚刚生成的int 节点，这个int 声明节点最后会被放入到记录全局节点的

global_binding_level中。

global_binding_level->name 指向刚刚创建的int 声明节点；

在init_decl_processing函数接下来将创建char 类型节点，unsigned int 类型。short 类型。这些值都回放入global_binding_level->name

然后通过chain连接起来；

总结一下。gcc 用hash表来储存全部的ID,包含保留字；gcc 对于内建的数据类型(int,short,char)在初始化时会生成tree_decl 结构的结点，

并把它记录在global_binding_level的name变量中。这个name始终指向最后一个声明的结点。并通过节点的chain串接起来。

gcc 源代码分析-前端篇2的更多相关文章

gcc 源代码分析-前端篇3
3. GCC怎样函表示一个函数对c语言来说.函数是其核心,全部的东西都在环绕着函数在转.对于一个函数来说.它基本的一些特性例如以下: 1. 有一个返回值,在这里我们没有把返回值的函数觉得它 ...
Android系统进程Zygote启动过程的源代码分析
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6768304 在Android系统中,所有的应用 ...
Android系统进程间通信Binder机制在应用程序框架层的Java接口源代码分析
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6642463 在前面几篇文章中,我们详细介绍了A ...
Android系统进程间通信（IPC）机制Binder中的Client获得Server远程接口过程源代码分析
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6633311 在上一篇文章中,我们分析了And ...
鸿蒙内核源码分析(编译过程篇) | 简单案例窥视GCC编译全过程 | 百篇博客分析OpenHarmony源码| v57.01
百篇博客系列篇.本篇为: v57.xx 鸿蒙内核源码分析(编译过程篇) | 简单案例窥视编译全过程 | 51.c.h.o 编译构建相关篇为: v50.xx 鸿蒙内核源码分析(编译环境篇) | 编译鸿蒙 ...
JAVA随笔篇一（Timer源代码分析和scheduleAtFixedRate的使用）
写完了基础篇,想了非常久要不要去写进阶篇.去写JSP等等的用法.最后决定先不去写.由于自己并非JAVA方面的大牛.眼下也在边做边学,所以决定先将自己不懂的拿出来学并记下来. Timer是Java自带的 ...
Monkey源代码分析番外篇之Android注入事件的三种方法比較
原文:http://www.pocketmagic.net/2012/04/injecting-events-programatically-on-android/#.VEoIoIuUcaV 往下分析 ...
【原】让H5页面适配移动设备全家 - 前端篇 - PPT
7月份在部门内给设计中心的同事们带来<让H5页面适配移动设备全家 - 设计师篇 - PPT>的分享,在视觉和交互稿上提出页面适配的建议及提升页面体验的好处,促进前端和设计双方更好的合作,同 ...
android-plugmgr源代码分析
android-plugmgr是一个Android插件加载框架,它最大的特点就是对插件不需要进行任何约束.关于这个类库的介绍见作者博客,市面上也有一些插件加载框架,但是感觉没有这个好.在这篇文章中,我 ...

随机推荐

log4net写日志的时间附带时区信息
<conversionPattern value="%date{yyyy-MM-dd HH:mm:ss.fffzzz} [%thread] %-5level %logger - %me ...
【IOI 1994】 The Buses
[题目链接] http://poj.org/problem?id=1167 [算法] 深度优先搜索 + 迭代加深 [代码] #include <algorithm> #include &l ...
Python多线程学习(一、线程的使用)
Python中使用线程有两种方式:函数或者用类来包装线程对象. 1. 函数式:调用thread模块中的start_new_thread()函数来产生新线程.如下例: import thread de ...
H3C路由器查看序列号信息
H3C MSR系列的路由器,查看本机的MAC地址.序列号信息和生产日期信息等可以使用dis device manuinfo 命令查看,以下是执行结果: slot 0 DEVICE_NAME ...
使用串口终端安装AIX操作系统
使用串口终端安装AIX操作系统一.配置超级终端首先,配置超级终端:在笔记本电脑上(Windows XP系统),点击开始à程序->附件->通讯->超级终端,配置名称为test的超级 ...
CharSequence源码分析
CharSequence是一个接口,表示一个char值的可读序列,此接口为多种char序列提供统一的.只读的通道.既然是接口,就不能通过new来进行赋值,只能通过以下方式赋值: CharSequenc ...
软件需求规范说明 (Software Requirements Specification, 简称SRS)
GB/T 9385-2008 笔记为了形成确定和完备的规格说明, 我们需要明确软件的顾客希望得到什么; 软件的供方理解用户想要什么; 4.2 SRS的基本性质 SRS是对在具体环境中执行确定功能的 ...
修改Visual Studio2010的主题颜色
第一步:打开工具->扩展管理器第二步:搜素visual studio color theme editor 第三步:找到Visual Studio Color Theme Editor 第四步 ...
html中map标签和area标签的应用
map标签的用途:是与img标签绑定使用的,常被用来赋予给客户端图像某处区域特殊的含义,点击该区域可跳转到新的文档. 因为map标签是与img标签绑定使用的,所以我们需要给map标签添加ID和name ...
python3 常用模块详解
这里是python3的一些常用模块的用法详解,大家可以在这里找到它们. Python3 循环语句 python中模块sys与os的一些常用方法 Python3字符串详解 Python3之时间模块详述 ...

gcc 源代码分析-前端篇2

gcc 源代码分析-前端篇2的更多相关文章

随机推荐

热门专题