编译器判断优化(__builtin_expect)
2016-04-15 14:41
513 查看
最近在网上看到这个,稍微研究了下,发现特定情况下,能提高不少判断的效率。
这个技巧就是在循环判断时去期望是或否。这涉及到了编译器优化,以及很经典的火车选路。
在 GCC 手册中对 __builtin_expect() 的描述是这样的:
这个函数的语义是:你期望 exp 表达式的值等于常量 c ,从而 GCC 为你优化程序,将符合这个条件的分支放在合适的地方。
现在处理器都是流水线的,有些里面有多个逻辑运算单元,系统可以提前取多条指令进行并行处理,但遇到跳转时,则需要重新取指令,这相对于不用重新去指令就降低了速度。
所以就引入了 likely 和 unlikely ,目的是增加条件分支预测的准确性,cpu 会提前装载后面的指令,遇到条件转移指令时会提前预测并装载某个分 支的指令。unlikely 表示你可以确认该条件是极少发生的,相反 likely 表示该条件多数情况下会发生。编译器会产生相应的代码来优化 cpu 执行效率。
按照我的理解,简单来说,就是在if(likely(x))的情况下,会提前预读x为1分支下的一条指令,从而减少指令跳转带来的开销。
因为我们可以根据实际情况,比如,绝大部分情况下x为真时使用if(likely(x)),相反的情况使用if(unlikely(x))。
自己的测试程序如下:
运行结果:
可以看到,极端情况下可以提升30%到50%的效率。
#define likely(x) __builtin_expect(!!(x),1) #define unlikely(x) __builtin_expect(!!(x),0)
这个技巧就是在循环判断时去期望是或否。这涉及到了编译器优化,以及很经典的火车选路。
在 GCC 手册中对 __builtin_expect() 的描述是这样的:
这个函数的语义是:你期望 exp 表达式的值等于常量 c ,从而 GCC 为你优化程序,将符合这个条件的分支放在合适的地方。
现在处理器都是流水线的,有些里面有多个逻辑运算单元,系统可以提前取多条指令进行并行处理,但遇到跳转时,则需要重新取指令,这相对于不用重新去指令就降低了速度。
所以就引入了 likely 和 unlikely ,目的是增加条件分支预测的准确性,cpu 会提前装载后面的指令,遇到条件转移指令时会提前预测并装载某个分 支的指令。unlikely 表示你可以确认该条件是极少发生的,相反 likely 表示该条件多数情况下会发生。编译器会产生相应的代码来优化 cpu 执行效率。
按照我的理解,简单来说,就是在if(likely(x))的情况下,会提前预读x为1分支下的一条指令,从而减少指令跳转带来的开销。
因为我们可以根据实际情况,比如,绝大部分情况下x为真时使用if(likely(x)),相反的情况使用if(unlikely(x))。
自己的测试程序如下:
#define likely(x) __builtin_expect(!!(x), 1) #define unlikely(x) __builtin_expect(!!(x), 0) #include <stdio.h> #include <time.h> #include <stdlib.h> int main() { clock_t start, finish; long i = 10000000L; start = clock(); int x = 1; int y = 0; while(--i) { if (likely(x)) y = 0; else y = 1; } finish = clock(); printf("%d\r\n",finish-start); i = 10000000L; while(--i) { if (x) y = 0; else y = 1; } finish = clock(); printf("%d\r\n",finish-start); return 0; }
运行结果:
[root@sssversion131 mytest]# ./test 40000 70000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 50000 80000 [root@sssversion131 mytest]# ./test 40000 70000 [root@sssversion131 mytest]# ./test 40000 80000 [root@sssversion131 mytest]# ./test 50000 80000
可以看到,极端情况下可以提升30%到50%的效率。
相关文章推荐
- iOS UIWindow 窗口
- cocoaPods 安装第三库出现错误(target overrides the `USER_HEADER_SEARCH_PATHS` build setting defined in `Pods/)
- guava、protobuf、guice浅析
- LeetCode 288. Unique Word Abbreviation(单词缩写)
- Core Graphics 定制UIVIew 处理图片
- Android学习笔记——Bluetooth的使用
- iPad如何使用UIPopoverController
- android UI进阶之style和theme的使用
- Android之UI--打造万能自定义Dialog
- No More Spool Space Teradata Query Solution
- UIView无法响应点击事件问题分析
- POJ 2524 Ubiquitous Religions【并查集模板】
- Quick Tip: Don’t Forget the Viewport Meta Tag
- Android 高级UI设计笔记10:瀑布流控件PinterestLikeAdapterView的使用
- LeetCode 304. Range Sum Query 2D - Immutable
- UIView 中常见的方法总结
- UIViewAnimationOptions类型
- oarcle sequence用法
- mysql 1366 Incorrect integer value错误
- MUI常用方法