您的位置：首页 > 其它

在细节上提升你的程序的性能

2012-12-26 12:38 441 查看

虽然，这些使用方法看似差别不大，在现在的cpu运行期起来几乎上可以忽略不计，
但是，我们想一下现在软件，每一个都是那么的庞大，一个小项目都是几万行代码，
一个函数中你消耗一点，那么多函数是很大的性能消耗的。举一个不恰当的例子，
如果在百度首页中，每天几亿次的点击率，每一个函数里面都有一个无用++运算，这个i++可以小视吗？

下面的例子是我在虚拟机中运行，其中也会有机器性能不好的原因，但是我觉得这样才会将问题展示的更加的严重。

1.不要将函数作为循环的条件

SIZE= 1024

program 1： time:29ms

     p = &a;
     for( ; i < SIZE *sizeof(int); i++)
     {
        p = 1;
        p++;
   }
program 2: time:1ms
    p = &a;
   len = SIZE *sizeof(int);
    for( ; i < len; i++)
   {
        p = 1;
          p++;
     }
原因：因为每次比较条件，函数都需要重新计算的，将会消耗时间。

2. 减少内存访问次数

program:1     time:1ms
   i = 0；

    for( ; i < 1024; i++)
            tmp ++;

program:2 time:7ms
     i = 0;
     for( ; i < 1024; i++)
           tmp = tmp + 1;
原因：内存与cpu的频率差别很大，尽量减少cpu对内存的访问，减少变量引用；

3.去除不必要的分支

program:1     time:3ms

   i = 0;
   for (tmp = 0; tmp < 100; tmp++)
{
       max = min = a[0] ;
       for( ; i < 100; i++)
       {
              if (max > a[i]) max = a[i];
              if (min < a[i]) min = a[i];
      }
   }
program:2     time:2ms
     i = 0;
     for (tmp = 0; tmp < 100; tmp++)
    {
           max = min = a[0] ;
           for( ; i < 100; i++)
          {
                if (max > a[i]) max = a[i];
                else if (min < a[i]) min = a[i];
          }
      }
注意：这个平时写代码的时候注意方可，很多时候书上都是这样的写的，大家觉得没什么？不影响程序的运行结果。所以，没有注意。

4.间接寻址比基地址寻址慢，所以将结构体中常用的成员放前面，并且放在一起。（类、接口、文件同理）

program 1： time：11ms

       i = 0;
      for( ; i < 1000; i++)
      {
            t.t1 = 1;
            t.t3 = 1;
      }

program 1： time：7ms
      i = 0;
      for( ; i < 1000; i++)
      {
            t.t1 = 1;
            t.t2 = 1;
       }

原因：将数据放到同一内存页中，减少页面切换，增加缓存的命中率。

a[i][j]与a[j][i]性能差别的原因

一下内容仅是个人理解，有错误之处，望大家谅解和指正。

a[i][j]使用时间：94s

for( k = 0 ; k <10000 ; k++ )
for( i = 0 ; i<MAX; i++ )
for( j = 0;j < MAX; j++ )
a[i][j] = 0;

a[j][i]使用时间：488s

for( k = 0 ; k < 10000 ; k++ )
for( i = 0 ; i<MAX; i++ )
for( j = 0;j < MAX; j++ )
a[j][i] = 0;
我将两种方法使用gcc生成了汇编代码。使用diff比较只发现了一下四句汇编代码的不同

1c1
< .file"array.c"
---
> .file"array1.c"
31c31
< movl4194352(%esp), %eax
---
> movl4194356(%esp), %eax
33c33
< addl 4194356(%esp), %eax
---
> addl 4194352(%esp), %eax

并且，这四句汇编在这行的时候不会产生性能差别，那性能差别出现在那里。可定不是循环、计算数据产生的差别。差别会出现在内存的访问位置上吗？不会的，内存是随机访问，访问任何一个位置内存的地址的时间应该是一样的。我们现在考虑一下是不是操作系统的缓存的功能。首先，本程序在加载到内存执行、以后除了cpu访问内存之外没有任何的资源消耗。所以说不是系统的问题。想了很久，想到cpu访问数据的时候是以块进行访问的，将取来的数据放到缓存中。因为a[i][i]是顺序访问，所以cpu缓存中的数据可以直接使用，无需再访问内存。而a[j][i]非顺序访问，下一个访问的位置，不在cpu的缓存中。

提议：在写代码的时候
1. 对数组、结构体进行顺序访问。提高缓存的命中率。
2. 减少不必要的判断，提高cpu的分支预测的命中率

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航