深入研究Clang(四) Clang编译器的简单分析
首先我们确定下Clang编译器的详细内容和涵盖范围。之前在《LLVM每日谈之二十 Everything && Clang driver》中以前提到过。Clang driver(命令行表示是clang)和Clang前端(依照详细实现来说就是Clang的那些库所实现的前端)是不同的。同一时候还存在一个Clang编译器(命令行表示是clang -cc1)。Clang编译器不只包括了Clang前端,还包括使用LLVM的哭实现的编译器的中间阶段以及后端,同一时候也集成了assembler。
Clang driver有一系列的frontend action,这些frontend action定义于clang/include/clang/Frontend/FrontendOptions.h中的ActionKind枚举中。
当中一些frontend action就会触发Clang编译器(clang -cc1),比方:ASTView, EmitBC, EmitObj等。一旦触发了Clang编译器(clang -cc1)。就会执行函数cc1_main()(clang/tools/driver/cc1_main.cpp),从名字上就能够看出来,这个函数是Clang编译器(clang -cc1)的入口主函数。
举个详细的样例来看一下:
min.c
int min(int a, int b) {
if (a < b) {
return a;
}
return b;
}
执行命令: clang -### min.c -o min
clang version 3.5.0 (tags/RELEASE_350/final)
Target: x86_64-unknown-linux-gnu
Thread model: posix
"/home/shining/llvm-3.5/build/bin/clang-3.5" "-cc1" "-triple" "x86_64-unknown-linux-gnu" "-emit-obj" "-mrelax-all" "-disable-free" "-main-file-name" "min.c" "-mrelocation-model" "static" "-mdisable-fp-elim" "-fmath-errno" "-masm-verbose" "-mconstructor-aliases" "-munwind-tables" "-fuse-init-array" "-target-cpu" "x86-64" "-dwarf-column-info" "-resource-dir" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0" "-internal-isystem" "/usr/local/include" "-internal-isystem" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0/include" "-internal-externc-isystem" "/usr/include/x86_64-linux-gnu" "-internal-externc-isystem" "/include" "-internal-externc-isystem" "/usr/include" "-fdebug-compilation-dir" "/home/shining/llvm-3.5/build/bin" "-ferror-limit" "19" "-fmessage-length" "80" "-mstackrealign" "-fobjc-runtime=gcc" "-fdiagnostics-show-option" "-o" "/tmp/min-75c13b.o" "-x" "c" "min.c"
"/usr/bin/ld" "-z" "relro" "--hash-style=gnu" "--build-id" "--eh-frame-hdr" "-m" "elf_x86_64" "-dynamic-linker" "/lib64/ld-linux-x86-64.so.2" "-o" "min" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crt1.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crti.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtbegin.o" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu" "-L/lib/x86_64-linux-gnu" "-L/lib/../lib64" "-L/usr/lib/x86_64-linux-gnu" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../.." "-L/home/shining/llvm-3.5/build/bin/../lib" "-L/lib" "-L/usr/lib" "/tmp/min-75c13b.o" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "-lc" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtend.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crtn.o"
-###參数是为了查看。clang driver究竟调用了哪些命令,而且不会执行这些命令。从这里能够实际看到,实际上调用的是 clang-3.5 -cc1。当中3.5是版本,所以事实上调用的就是clang编译器。
之后又调用了系统的ld loader,由于LLVM架构的loader还在开发之中。
所以,对于那些我们已经明白须要clang编译器去作的工作,我们能够不通过clang driver去隐式调用(比方上面的样例)。而是直接在命令行调用clang -cc1去执行。而且在clang -cc1之后跟clang编译器接受的參数。也能够通过clang -Xclang就能够直接将參数传递给clang编译器(clang -cc1)。以下的详细实现,将同一时候给出这两种的命令行形式,事实上执行结果差点儿是全然同样的。不同的是,使用clang -Xclang的时候,假设不加强制的參数,这里尽管-Xclang将參数传递给了clang -cc1,可是这里的clang driver依旧会继续工作的。在以下的样例中会进行分别的展示
编译器首先进行的是词法分析。我们能够通过命令行去查看进行词法分析之后的token序列究竟是怎么样的,仍然以上面的min.c为例,执行命令:
clang -cc1 -dump-tokens min.c
执行之后得到例如以下输出:
int 'int' [StartOfLine] Loc=<min.c:1:1>
identifier 'min' [LeadingSpace] Loc=<min.c:1:5>
l_paren '(' Loc=<min.c:1:8>
int 'int' Loc=<min.c:1:9>
identifier 'a' [LeadingSpace] Loc=<min.c:1:13>
comma ',' Loc=<min.c:1:14>
int 'int' [LeadingSpace] Loc=<min.c:1:16>
identifier 'b' [LeadingSpace] Loc=<min.c:1:20>
r_paren ')' Loc=<min.c:1:21>
l_brace '{' [LeadingSpace] Loc=<min.c:1:23>
if 'if' [StartOfLine] [LeadingSpace] Loc=<min.c:2:5>
l_paren '(' [LeadingSpace] Loc=<min.c:2:8>
identifier 'a' Loc=<min.c:2:9>
less '<' [LeadingSpace] Loc=<min.c:2:11>
identifier 'b' [LeadingSpace] Loc=<min.c:2:13>
r_paren ')' Loc=<min.c:2:14>
l_brace '{' [LeadingSpace] Loc=<min.c:2:16>
return 'return' [StartOfLine] [LeadingSpace] Loc=<min.c:3:9>
identifier 'a' [LeadingSpace] Loc=<min.c:3:16>
semi ';' Loc=<min.c:3:17>
r_brace '}' [StartOfLine] [LeadingSpace] Loc=<min.c:4:5>
return 'return' [StartOfLine] [LeadingSpace] Loc=<min.c:5:5>
identifier 'b' [LeadingSpace] Loc=<min.c:5:12>
semi ';' Loc=<min.c:5:13>
r_brace '}' [StartOfLine] Loc=<min.c:6:1>
eof '' Loc=<min.c:6:2>
或者选用: clang -Xclang -dump-tokens min.c
输出信息例如以下:
int 'int' [StartOfLine] Loc=<min.c:1:1>
identifier 'min' [LeadingSpace] Loc=<min.c:1:5>
l_paren '(' Loc=<min.c:1:8>
int 'int' Loc=<min.c:1:9>
identifier 'a' [LeadingSpace] Loc=<min.c:1:13>
comma ',' Loc=<min.c:1:14>
int 'int' [LeadingSpace] Loc=<min.c:1:16>
identifier 'b' [LeadingSpace] Loc=<min.c:1:20>
r_paren ')' Loc=<min.c:1:21>
l_brace '{' [LeadingSpace] Loc=<min.c:1:23>
if 'if' [StartOfLine] [LeadingSpace] Loc=<min.c:2:5>
l_paren '(' [LeadingSpace] Loc=<min.c:2:8>
identifier 'a' Loc=<min.c:2:9>
less '<' [LeadingSpace] Loc=<min.c:2:11>
identifier 'b' [LeadingSpace] Loc=<min.c:2:13>
r_paren ')' Loc=<min.c:2:14>
l_brace '{' [LeadingSpace] Loc=<min.c:2:16>
return 'return' [StartOfLine] [LeadingSpace] Loc=<min.c:3:9>
identifier 'a' [LeadingSpace] Loc=<min.c:3:16>
semi ';' Loc=<min.c:3:17>
r_brace '}' [StartOfLine] [LeadingSpace] Loc=<min.c:4:5>
return 'return' [StartOfLine] [LeadingSpace] Loc=<min.c:5:5>
identifier 'b' [LeadingSpace] Loc=<min.c:5:12>
semi ';' Loc=<min.c:5:13>
r_brace '}' [StartOfLine] Loc=<min.c:6:1>
eof '' Loc=<min.c:6:2>
/usr/bin/ld: cannot find /tmp/min-3cce9d.o: No such file or directory
clang-3.5: error: linker command failed with exit code 1 (use -v to see invocation)
明显能够看到,使用-Xclang的时候,把-dump-tokens參数传递给了clang -cc1,可是clang driver依旧工作,而且调用了ld.
能够使用clang -### -Xclang -dump-tokens min.c命令进行验证。
看过了词法分析阶段,我们再看下clang编译器语法分析来的AST nodes。
使用命令:clang -cc1 -fsyntax-only -ast-dump min.c
或者:clang -fsyntax-only -Xclang -ast-dump min.c
输出结果一样:
TranslationUnitDecl 0x6bc3a40 <<invalid sloc>> <invalid sloc>
|-TypedefDecl 0x6bc3f40 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128'
|-TypedefDecl 0x6bc3fa0 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128'
|-TypedefDecl 0x6bc42f0 <<invalid sloc>> <invalid sloc> implicit __builtin_va_list '__va_list_tag [1]'
`-FunctionDecl 0x6bc4490 <min.c:1:1, line:6:1> line:1:5 min 'int (int, int)'
|-ParmVarDecl 0x6bc4350 <col:9, col:13> col:13 used a 'int'
|-ParmVarDecl 0x6bc43c0 <col:16, col:20> col:20 used b 'int'
`-CompoundStmt 0x6bc46f8 <col:23, line:6:1>
|-IfStmt 0x6bc4668 <line:2:5, line:4:5>
| |-<<<NULL>>>
| |-BinaryOperator 0x6bc45c0 <line:2:9, col:13> 'int' '<'
| | |-ImplicitCastExpr 0x6bc4590 <col:9> 'int' <LValueToRValue>
| | | `-DeclRefExpr 0x6bc4540 <col:9> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'
| | `-ImplicitCastExpr 0x6bc45a8 <col:13> 'int' <LValueToRValue>
| | `-DeclRefExpr 0x6bc4568 <col:13> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'
| |-CompoundStmt 0x6bc4648 <col:16, line:4:5>
| | `-ReturnStmt 0x6bc4628 <line:3:9, col:16>
| | `-ImplicitCastExpr 0x6bc4610 <col:16> 'int' <LValueToRValue>
| | `-DeclRefExpr 0x6bc45e8 <col:16> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'
| `-<<<NULL>>>
`-ReturnStmt 0x6bc46d8 <line:5:5, col:12>
`-ImplicitCastExpr 0x6bc46c0 <col:12> 'int' <LValueToRValue>
`-DeclRefExpr 0x6bc4698 <col:12> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'
通过clang -### -fsyntax-only -Xclang -ast-dump min.c查看实际执行命令。事实上跟使用clang -cc1是同样的。
參考资料:
1. 《Getting Started with LLVM Core Libraries》
2. Code of clang
深入研究Clang(四) Clang编译器的简单分析的更多相关文章
- python2.7 爬取简书30日热门专题文章之简单分析_20170207
昨天在简书上写了用Scrapy抓取简书30日热门文章,对scrapy是刚接触,跨页面抓取以及在pipelines里调用settings,连接mysql等还不是很熟悉,今天依旧以单独的py文件区去抓取数 ...
- Deep learning:四十六(DropConnect简单理解)
和maxout(maxout简单理解)一样,DropConnect也是在ICML2013上发表的,同样也是为了提高Deep Network的泛化能力的,两者都号称是对Dropout(Dropout简单 ...
- 研究Java语言的编译器和虚拟机源代码
现在使用Java语言的人很多,但是了解Java语言实现的人非常少.如果要研究Java语言的实现,推荐研究Javac和虚拟机HotSpot的源代码实现,其中Javac相当于Java编译的前端,HotSp ...
- FFmpeg源代码简单分析:configure
===================================================== FFmpeg的库函数源代码分析文章列表: [架构图] FFmpeg源代码结构图 - 解码 F ...
- 对苹果“五仁”编程语言Swift的简单分析
对苹果"五仁"编程语言Swift的简单分析 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvUHJvdGVhcw==/font/5a6L5 ...
- PC-lint集成于SourceInsight 范例以及简单分析;提高代码的健壮性;
写代码之际突然想起了pc-lint这个"古董级"的代码静态分析工具; 下午机房的服务器歇菜了,没法调试游戏,刚好抽出时间来研究一下pc-lint集成在SourceInsight ...
- x264源代码简单分析:宏块分析(Analysis)部分-帧间宏块(Inter)
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
- x264源代码简单分析:宏块分析(Analysis)部分-帧内宏块(Intra)
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
- x264源代码简单分析:滤波(Filter)部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
随机推荐
- 一致性算法--Paxos
分布式一致性算法--Paxos Paxos算法是莱斯利·兰伯特(Leslie Lamport)1990年提出的一种基于消息传递的一致性算法.Paxos算法解决的问题是一个分布式系统如何就某个值(决议) ...
- jq商品展示图放大镜 and 原生js和html5写的放大镜效果 ~~效果不错
<!DOCTYPE HTML><html lang="en-US"><head> <meta charset="UTF-8&qu ...
- SQLite3的使用(用到了dll)good
1.下载sqlite3相关文件sqlite3.dll.sqlite3.h(可从http://download.csdn.net/detail/mingxia_sui/5249070下载),添加到工程的 ...
- javascript 入门之简单换肤效果
大家好,我是小强老师,这里简单入门 做一个换肤效果 效果如图所示: 这个案例思路分为两部分: 获取元素对象. var pic1 = document.getElementById('pic1'); v ...
- 一种SpringMVC调用Javascript的方法
在spring的controller里面,一般是进行业务逻辑的处理,组织数据模型,然后选择适当的显示模版进行展示,这种情况下,我们可以事先做一个js的模版,然后controller根据不同的参数调用此 ...
- libvirt(virsh命令介绍)
有了virt-install是安装虚拟机的命令,当然也需要一个管理虚拟机的命令了,那就是virsh. virsh命令使用 virsh <command> <domain-id> ...
- eclipse中build workspace的相关优化
网上流传的各种的eclipse的调优的方法都大同小异,但是调优的基本上针对eclipse或者myclipse的本身,比如关掉validate和启动项,文件拼写,和自动构建等,调过之后,等个eclips ...
- 在Eclipse/MyEclipse中安装spket插件
Spket ide是强大的工具包为了JavaScript和XML的开发,这个强大的编辑器对JavaScript, XUL/XBLand Yahoo! Widget的开发都有全面的支持 ,比如代码完毕, ...
- Android中如何查找内存泄露
1.首先确定是否有内存泄露及哪个程序造成. 1.1.内存泄露已弹出out of memory对话框的情况. 这种情况很简单,直接看对话框就知道是哪个应用的问题了.然后再分析该应用是否是因为内存泄露造成 ...
- C# 使用PictureBox控件--点击切换图片
效果: 1. 2. 代码: private Boolean fals = true; /// <summary> /// 单击事件 /// </summary> /// < ...