http://blog.csdn.net/shuimuniao/article/details/8017971

将流水线引入cpu,可以提高cpu的效率。更简单的说,让cpu可以预先取出下一条指令,可以提供cpu的效率。如下图所示:
+--------------------------------
|取指令 | 执行指令 | 输出结果
+--------------------------------
|             | 取指令     | 执行
+--------------------------------
可见,cpu流水钱可以减少cpu等待取指令的耗时,从而提高cpu的效率。
       
如果存在跳转指令,那么预先取出的指令就无用了。cpu在执行当前指令时,从内存中取出了当前指令的下一条指令。执行完当前指令后,cpu发现不是要执行
下一条指令,而是执行offset偏移处的指令。cpu只能重新从内存中取出offset偏移处的指令。因此,跳转指令会降低流水线的效率,也就是降低
cpu的效率。
        综上,在写程序时应该尽量避免跳转语句。那么如何避免跳转语句呢?答案就是使用__builtin_expect。
       
这个指令是gcc引入的,作用是"允许程序员将最有可能执行的分支告诉编译器"。这个指令的写法为:__builtin_expect(EXP,
N)。意思是:EXP==N的概率很大。一般的使用方法是将__builtin_expect指令封装为LIKELY和UNLIKELY宏。这两个宏的写
法如下。
        #define LIKELY(x) __builtin_expect(!!(x), 1) //x很可能为真
        #define UNLIKELY(x) __builtin_expect(!!(x), 0) //x很可能为假

如下是一个实际的例子。

  1. //test_builtin_expect.c
  2. #define LIKELY(x) __builtin_expect(!!(x), 1)
  3. #define UNLIKELY(x) __builtin_expect(!!(x), 0)
  4. int test_likely(int x)
  5. {
  6. if(LIKELY(x))
  7. {
  8. x = 5;
  9. }
  10. else
  11. {
  12. x = 6;
  13. }
  14. return x;
  15. }
  16. int test_unlikely(int x)
  17. {
  18. if(UNLIKELY(x))
  19. {
  20. x = 5;
  21. }
  22. else
  23. {
  24. x = 6;
  25. }
  26. return x;
  27. }

运行如下命令:
        gcc -fprofile-arcs -O2 -c test_builtin_expect.c
        objdump -d test_builtin_expect.o
输出的汇编码为:

  1. <test_likely>:
  2. 00    push     %ebp
  3. 01    mov      %esp,%ebp
  4. 03    mov      0x8(%ebp),%eax
  5. 06    addl     $0x1,0x38
  6. 0d    adcl     $0x0,0x3c
  7. 14    test     %eax,%eax
  8. 16    jz       2d <test_likely+0x2d>//主要看这里。此处的效果是eax不为零时,不需要跳转。即x为真是不跳转。
  9. 18    addl     $0x1,0x40
  10. 1f    mov      $0x5,%eax
  11. 24    adcl     $0x0,0x44
  12. 2b    pop      %ebp
  13. 2c    ret
  14. 2d    addl     $0x1,0x48
  15. 34    mov      $0x6,%eax
  16. 39    adcl     $0x0,0x4c
  17. 40    pop      %ebp
  18. 41    ret
  19. 42    lea      0x0(%esi,%eiz,1),%esi
  20. 49    lea      0x0(%edi,%eiz,1),%edi
  21. <test_unlikely>:
  22. 50    push     %ebp
  23. 51    mov      %esp,%ebp
  24. 53    mov      0x8(%ebp),%edx
  25. 56    addl     $0x1,0x20
  26. 5d    adcl     $0x0,0x24
  27. 64    test     %edx,%edx
  28. 66    jne      7d <test_unlikely+0x2d>//主要看这里。此处的效果是edx为零时,不需跳转。即x为假时不跳转。
  29. 68    addl     $0x1,0x30
  30. 6f    mov      $0x6,%eax
  31. 74    adcl     $0x0,0x34
  32. 7b    pop      %ebp
  33. 7c    ret
  34. 7d    addl     $0x1,0x28
  35. 84    mov      $0x5,%eax
  36. 89    adcl     $0x0,0x2c
  37. 90    pop      %ebp
  38. 91    ret
  39. 92    lea      0x0(%esi,%eiz,1),%esi
  40. 99    lea      0x0(%edi,%eiz,1),%edi

可见,编译器利用程序员作出的判断,生成了高效的汇编码。即,跳转语句不生效的概率很大。

参考资料:http://hi.baidu.com/uu_dou/item/e9f6f41d570d817b7a5f25c7

[转] GCC __builtin_expect的作用的更多相关文章

  1. GCC __builtin_expect的作用

    https://blog.csdn.net/shuimuniao/article/details/8017971 #define LIKELY(x) __builtin_expect(!!(x), 1 ...

  2. gcc -ldl 选项作用

    如果你的程序中使用dlopen.dlsym.dlclose.dlerror 显示加载动态库,需要设置链接选项 -ldl 加载动态链接库,首先为共享库分配物理内存,然后在进程对应的页表项中建立虚拟页和物 ...

  3. Clang比 gcc/g++更人性化代码出错提示的C/C++编译器

    编译器方面的几个命令 gcc/g++ 一. 常用编译命令选项 常用用法 gcc -Wall test.c -o test gcc编译过程 .c ->(-E)-> .i[中间文件] -> ...

  4. linux下gcc编译多个源文件、gdb的使用方法

    一. gcc常用编译命令选项 假设源程序文件名为test.c. 1. 无选项编译链接 用法:#gcc test.c 作用:将test.c预处理.汇编.编译并链接形成可执行文件.这里未指定输出文件,默认 ...

  5. gcc编译代码报错及编译方式

    一.error: 'for' loop initial declarations are only allowed in C99 mode 前段时间写了一个小C程序,放在linux下用gcc编译出错, ...

  6. GCC 编译命令

    今天突然被同事问道一个GCC编译命令为的问题,感觉对相应内容生疏了,赶紧整理下相关内容,梳理下相关知识. GCC命令提供了非常多的命令选项,但并不是所有都要熟悉,初学时掌握几个常用的就可以了,到后面再 ...

  7. Ubuntu下GCC的安装以及版本控制

    在Ubuntu下安装GCC和其他一些Linux系统有点不一样. 方法一: 该方法超简单:sudo apt-get  build-depgcc 就上面这条命令就可以搞定 方法二:sudo apt-get ...

  8. gcc总结【基本用法】【选项】【动静态库】(转)

    1.////////////////////////////////////////////////////////////////////////////////////////////////// ...

  9. gcc常用命令集

    引用:http://developer.51cto.com/art/200609/32317_1.htm 对于GUN编译器来说,程序的编译要经历预处理.编译.汇编.连接四个阶段 假设源程序文件名为te ...

随机推荐

  1. 【开源】前端练手笔记,Chrome扩展应用程序(html+CSS+JS) (1)

    项目名称:github-notification 项目地址:https://github.com/WQTeam/github-notification 说明:本人打算抽时间学习前端(html + cs ...

  2. Dedecms自定义sql 出现错误Safe Alert: Request Error step 2!

    Dedecms自定义执行sql: SELECT body FROM dede_addonarticle WHERE aid = (select max(aid) fromdede_addonartic ...

  3. Python学习 - 编写一个简单的web框架(二)

    在上一篇日志中已经讨论和实现了根据url执行相应应用,在我阅读了bottle.py官方文档后,按照bottle的设计重写一遍,主要借鉴大牛们的设计思想. 一个bottle.py的简单实例 来看看bot ...

  4. js动态加载脚本

    最近公司的前端地图产品需要做一下模块划分,希望用户用到哪一块的功能再加载哪一块的模块,这样可以提高用户体验. 所以到处查资料研究js动态脚本的加载,不过真让人伤心啊!,网上几乎都是同一篇文章,4种方法 ...

  5. eclipse问题解决(link方式安装插件失败)

    使用 link 方式,离线安装 eclipse 插件时,经常失败. 一.常见的失败情况 link方式配好后,eclipse 启动,没有弹出任何信息. 查看当前工作空间——.metadata——.log ...

  6. [BZOJ 3236] [Ahoi2013] 作业 && [BZOJ 3809] 【莫队(+分块)】

    题目链接: BZOJ - 3236   BZOJ - 3809 算法一:莫队 首先,单纯的莫队算法是很好想的,就是用普通的第一关键字为 l 所在块,第二关键字为 r 的莫队. 这样每次端点移动添加或删 ...

  7. QS Network

    zoj1586:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=1586 题目大意:最小生成树,不只算两点之间的费用,还要算点 ...

  8. Robot Motion

    Description A robot has been programmed to follow the instructions in its path. Instructions for the ...

  9. 利用低成本的MCU的UART驱动智能卡

    在银行.身份识别和电信市场中,对安全和增强的功能性不断增长的需要,增加了全球范围智能卡的使用.另一方面,这也使得对安全性较低的磁条卡的使用量下降. 然而,所需的基于智能卡系统中,适当的通信系统的硬件和 ...

  10. mysql 树形数据,层级数据Managing Hierarchical Data in MySQL

    原文:http://mikehillyer.com/articles/managing-hierarchical-data-in-mysql/ 引言 大多数用户都曾在数据库中处理过分层数据(hiera ...