优化代码,看看哪个执行速度更快!!!
2004-09-01 13:25
585 查看
优化代码,看看哪个执行速度更快!!!
最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。
// Delphi 代码如下:
unit Unit1;
// Created By BHB. 2004-08-31
interface
uses
Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls;
type
TForm1 = class(TForm)
procedure FormCreate(Sender: TObject);
private
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
// 高精度计时
function XTimer(var t0: Int64; bStart: Bool): Int64;
var
t, fq: Int64;
begin
QueryPerformanceCounter(t);
if bStart then
t0 := t
else begin
t := t - t0;
QueryPerformanceFrequency(fq);
Result := trunc(t / fq * 1000);
end;
end;
procedure Rev1(var a, b: Integer);
begin
asm
MOV ECX, [EDX]
XCHG [EAX], ECX
MOV [EDX], ECX
end;
end;
procedure Rev2(var a, b: Integer);
begin
a := a xor b;
b := a xor b;
a := a xor b;
end;
procedure Rev3(var a, b: Integer);
var
t: Integer;
begin
t := a;
a := b;
b := t;
end;
procedure TForm1.FormCreate(Sender: TObject);
type
TRevFun = procedure(var a, b: Integer);
var
S: string;
a, b: Integer;
T: Int64;
procedure Test(const RevName: string; Rev: TRevFun);
var
I: Integer;
begin
XTimer(T, True); // 计时开始
// 一千万次循环
for I := 0 to 10000000 do Rev(a, b);
T := XTimer(T, False); // 计时结束
S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);
end;
begin
a := 123;
b := 321;
Test('Rev1', Rev1);
Test('Rev2', Rev2);
Test('Rev3', Rev3);
ShowMessage(S);
end;
end.
如果你认为汇编执行速度更快,可能会选 Rev1;
如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;
如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。
倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)
AMD Duron 750MHz 执行结果:
P4 2.00GHz 执行结果:
怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1
Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;
Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...
Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。
最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。
// Delphi 代码如下:
unit Unit1;
// Created By BHB. 2004-08-31
interface
uses
Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls;
type
TForm1 = class(TForm)
procedure FormCreate(Sender: TObject);
private
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
// 高精度计时
function XTimer(var t0: Int64; bStart: Bool): Int64;
var
t, fq: Int64;
begin
QueryPerformanceCounter(t);
if bStart then
t0 := t
else begin
t := t - t0;
QueryPerformanceFrequency(fq);
Result := trunc(t / fq * 1000);
end;
end;
procedure Rev1(var a, b: Integer);
begin
asm
MOV ECX, [EDX]
XCHG [EAX], ECX
MOV [EDX], ECX
end;
end;
procedure Rev2(var a, b: Integer);
begin
a := a xor b;
b := a xor b;
a := a xor b;
end;
procedure Rev3(var a, b: Integer);
var
t: Integer;
begin
t := a;
a := b;
b := t;
end;
procedure TForm1.FormCreate(Sender: TObject);
type
TRevFun = procedure(var a, b: Integer);
var
S: string;
a, b: Integer;
T: Int64;
procedure Test(const RevName: string; Rev: TRevFun);
var
I: Integer;
begin
XTimer(T, True); // 计时开始
// 一千万次循环
for I := 0 to 10000000 do Rev(a, b);
T := XTimer(T, False); // 计时结束
S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);
end;
begin
a := 123;
b := 321;
Test('Rev1', Rev1);
Test('Rev2', Rev2);
Test('Rev3', Rev3);
ShowMessage(S);
end;
end.
如果你认为汇编执行速度更快,可能会选 Rev1;
如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;
如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。
倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)
AMD Duron 750MHz 执行结果:
P4 2.00GHz 执行结果:
怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1
Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;
Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...
Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。
相关文章推荐
- PHP程序加速探索[2]--脚本执行速度测试.代码优化.压缩输出gzip
- VC++代码执行速度优化
- PHP程序加速探索[2]--脚本执行速度测试.代码优化.压缩输出gzip
- 优化php代码,提高执行速度
- 优化PHP代码执行速度
- Zend Optimizer用优化代码的方法来提高php应用程序的执行速度
- 不谈架构,看看如何从代码层面优化系统性能!
- 提高asp访问速度的技巧-优化代码
- Ansible系列(七):执行过程分析、异步模式和速度优化
- 两个线程并发执行以下代码,假设a是全局变量,那么以下输出___哪个是可能的?
- 如何利用VS的代码优化和openmp并行计算提高程序运行速度
- HTML5图片上传图片实时预览,通过DataURL将图片压缩“嵌入”到HTML中,优化图片的加载速度和执行效率。
- 如何优化Mysql执行查询数据的速度
- 嵌入式程序设计中运行速度与代码尺寸优化策略
- 压缩JS,提高代码执行速度
- ++num和num++哪个执行速度更快,++num为什么会比num++速度快
- 【代码优化】如何提高网页加载速度
- 如何优化Mysql执行查询数据的速度
- 优化页面性能的代码技术整理(提高网页响应速度必看)