2. 对ID及保留字的处理

   在c语言中,系统预留了非常多keyword。也被称为保留字,比方表示数据类型的int,short,char,控制分支运行的if,then等。

不论什么keyword,本质上也是一个ID,比方它也有长度,对int就是3。对short就是5,也有内容,比方int,short。但比起一般id,

   它还有其它一些属性,比方表示数据类型的int,它有一个数值范围,它的值范围是-xxx到xxx之间。

   因为这种关系,gcc把ID和keyword都保存在一张表中,这张表定义例如以下:

                                         #define MAX_HASH_TABLE 1009

                                          tree hash_table[MAX_HASH_TABLE];    /* id hash buckets */

   同一时候定义了一个函数get_identifier (text) 来操纵这一张表:

       

       函数详细实现就是通过传入的字串查找该id,假设没有则创建这个ID,这里new了一个tree_identifier, 同一时候把它保存在hash_table表中,为了加快查找,这里用到了hash算法。在这里我们见到了struct tree_common结构体chain成员的使用方法,对于hash算法来说,非常难避免冲突,对于传入的不同字串,有可能它算出的hash值是一样的,这时候。我们就把相冲突的ID放在chain成员变量中;

      函数的最后给tree_identifier的成员length,pointer附值。



   gcc 在运行之初,便開始创建这些表示数据类型的keyword。比方int,short,char,void,这个在函数init_lex依次创建,并把创建的相相应的

   tree 结点附给:

        ridpointers[(int) RID_INT]

        ridpointers[(int) RID_CHAR]

        ridpointers[(int) RID_VOID]

        ridpointers[(int) RID_SHORT]



   keyword的ID生成了,还有附一些其它參数,这个过程是在init_decl_processing完毕;在GCC中要表示一个数据类型,要用到以下的结构:



struct tree_type

{

  char common[sizeof (struct tree_common)];

  union tree_node *values;

  union tree_node *sep;

  union tree_node *size;



  enum machine_mode mode : 8;

  unsigned char size_unit;

  unsigned char align;

  unsigned char sep_unit;



  union tree_node *pointer_to;

  union tree_node *reference_to;

  int parse_info;

  int symtab_address;

  union tree_node *name;

  union tree_node *max;

  union tree_node *next_variant;

  union tree_node *main_variant;

  union tree_node *basetypes;

  union tree_node *noncopied_parts;

  /* Points to a structure whose details depend on the language in use.  */

  struct lang_type *lang_specific;

};

   在表示int型的数据类型中,它的两个成员变量sep。max比較重要; sep表示它的最小值。而max表示它的最大值;



   在函数make_signed_type中创建了一个 INTEGER_TYPE 类型的tree 节点;它实际上是一个 struct tree_type 类型的节点,

   在该函数中,创建的节点的sep,max成员被赋予INTEGER_CST 节点,它实际上是一个struct tree_int_cst类型节点:

struct tree_int_cst

{

  char common[sizeof (struct tree_common)];

  long int_cst_low;

  long int_cst_high;

};



  能够看出。它有两个成员特殊成员:int_cst_low,int_cst_high

  对于最小值。它给出的值是: int_cst_low=0x80000000,int_cst_high=0xffffffff

  对于最大值,它给出的值是:int_cst_low=0x7fffffff,int_cst_high=0x0



  它们均是在build_int_2 函数中创建;

  在函数make_signed_type的最后layout_type中,设定int 型数据节点的size成员。它也是一个struct tree_int_cst类型节点,仅仅是它的

   int_cst_low值是4,而int_cst_high为0。



   这样int型节点生成了,这个节点数据和它的ID。最后被封装成一个声明类型节点,它用struct tree_decl结构体表示:

struct tree_decl
{
char common[sizeof (struct tree_common)];
char *filename;
int linenum;
union tree_node *size;
enum machine_mode mode : 8;
unsigned char size_unit;
unsigned char align;
unsigned char voffset_unit;
union tree_node *name;
union tree_node *context;
int offset;
union tree_node *voffset;
union tree_node *arguments;
union tree_node *result;
union tree_node *initial;
char *print_name;
char *assembler_name;
struct rtx_def *rtl; /* acts as link to register transfer language
(rtl) info */
int frame_size; /* For FUNCTION_DECLs: size of stack frame */
struct rtx_def *saved_insns; /* For FUNCTION_DECLs: points to insn that
constitutes its definition on the
permanent obstack. */
int block_symtab_address;
/* Points to a structure whose details depend on the language in use. */
struct lang_decl *lang_specific;
};

能够看出,这是一个巨复杂的结构,int 类型节点转变成一个int 声明节点过程中。它将生成一个struct tree_decl节点,它的

  成员变量name将是int 的ID节点值,它的type 就是刚刚生成的int 节点,这个int 声明节点最后会被放入到记录全局节点的

  global_binding_level中。

  global_binding_level->name 指向刚刚创建的int 声明节点;



  在init_decl_processing函数接下来将创建char 类型节点,unsigned int 类型。short 类型。这些值都回放入global_binding_level->name

  然后通过chain连接起来;   



  总结一下。gcc 用hash表来储存全部的ID,包含保留字;gcc 对于内建的数据类型(int,short,char)在初始化时会生成tree_decl 结构的结点,

  并把它记录在global_binding_level的name变量中。这个name始终指向最后一个声明的结点。并通过节点的chain串接起来。

gcc 源代码分析-前端篇2的更多相关文章

  1. gcc 源代码分析-前端篇3

    3. GCC怎样函表示一个函数   对c语言来说.函数是其核心,全部的东西都在环绕着函数在转.对于一个函数来说.它基本的一些特性例如以下:    1. 有一个返回值,在这里我们没有把返回值的函数觉得它 ...

  2. Android系统进程Zygote启动过程的源代码分析

    文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6768304 在Android系统中,所有的应用 ...

  3. Android系统进程间通信Binder机制在应用程序框架层的Java接口源代码分析

    文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6642463 在前面几篇文章中,我们详细介绍了A ...

  4. Android系统进程间通信(IPC)机制Binder中的Client获得Server远程接口过程源代码分析

    文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6633311 在上一篇文章中,我 们分析了And ...

  5. 鸿蒙内核源码分析(编译过程篇) | 简单案例窥视GCC编译全过程 | 百篇博客分析OpenHarmony源码| v57.01

    百篇博客系列篇.本篇为: v57.xx 鸿蒙内核源码分析(编译过程篇) | 简单案例窥视编译全过程 | 51.c.h.o 编译构建相关篇为: v50.xx 鸿蒙内核源码分析(编译环境篇) | 编译鸿蒙 ...

  6. JAVA随笔篇一(Timer源代码分析和scheduleAtFixedRate的使用)

    写完了基础篇,想了非常久要不要去写进阶篇.去写JSP等等的用法.最后决定先不去写.由于自己并非JAVA方面的大牛.眼下也在边做边学,所以决定先将自己不懂的拿出来学并记下来. Timer是Java自带的 ...

  7. Monkey源代码分析番外篇之Android注入事件的三种方法比較

    原文:http://www.pocketmagic.net/2012/04/injecting-events-programatically-on-android/#.VEoIoIuUcaV 往下分析 ...

  8. 【原】让H5页面适配移动设备全家 - 前端篇 - PPT

    7月份在部门内给设计中心的同事们带来<让H5页面适配移动设备全家 - 设计师篇 - PPT>的分享,在视觉和交互稿上提出页面适配的建议及提升页面体验的好处,促进前端和设计双方更好的合作,同 ...

  9. android-plugmgr源代码分析

    android-plugmgr是一个Android插件加载框架,它最大的特点就是对插件不需要进行任何约束.关于这个类库的介绍见作者博客,市面上也有一些插件加载框架,但是感觉没有这个好.在这篇文章中,我 ...

随机推荐

  1. 关于jetty服务器默认首页和端口设置

    一.jetty服务器部署.启动成功后,在浏览器输入http://localhost:8080/ 可以直接访问到jetty欢迎首页. 这是因为在Jetty包中默认带了一个test.war的应用,在${J ...

  2. poj1028--动态规划--Ignatius and the Princess III

    Ignatius and the Princess III Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K ...

  3. 【Codeforces 258B】 Sort the Array

    [题目链接] http://codeforces.com/contest/451/problem/B [算法] 模拟 在序列中找到一段单调递增的子序列,将这段序列反转,然后判断序列是否变得单调递增,即 ...

  4. FH Admin

    http://www.360doc.com/content/14/0713/08/8072791_394027312.shtml

  5. Pop3协议详解

      POP3全称为Post Office Protocol version3,即邮局协议第3版.它被用户代理用来邮件服务器取得邮件.POP3采用的也是C/S通信 模型 用户从邮件服务器上接收邮件的典型 ...

  6. 单件模式(Singleton)C++实现

    意图:保证一个类仅有一个实例,并提供一个访问它的全局访问点. 实用性:1.当类只能有一个实例而且客户可以从一个众所周知的访问点访问它. 2.当这个唯一的实例应该是通过子类可扩展的,并且客户应该无需更改 ...

  7. P1304 哥德巴赫猜想

    题目描述 输入N(N<=10000),验证4~N所有偶数是否符合哥德巴赫猜想. (N为偶数). 如果一个数,例如10,则输出第一个加数相比其他解法最小的方案.如10=3+7=5+5,则10=5+ ...

  8. Google浏览器“无法添加来自此网站的应用、扩展程序和应用脚本”的解决办法

    原文链接:https://blog.csdn.net/Fan_Weibin/article/details/80402790 解决方法如下: 在桌面找到Google Chrome图标→右击属性→在快捷 ...

  9. 当接口上配了 FeignClient 和 RequestMapping 两个注解,结果错误提示 重复mapping处理方法

    再接手老文档的时候,发现有这么一个问题 错误显示为: 原文档写法: 解决方法: 这是一个编译时写法的问题,将上方的RequestMapping去掉,然后把路径放在下面的PostMapping 便可以正 ...

  10. LINUX 环境安装 jdk-tomcat安装

    linux版本两种安装方式 卸载自带jdk $rpm -qa | grep java $ rpm -e --nodeps java-**-openjdk-*$ rpm -e --nodeps java ...