您的位置:首页 > 运维架构 > Linux

<2012 12 20> Gcc/ARM/Linux Kernel关于浮点运算的一些说明(很有用!)

2012-12-20 20:43 260 查看
参考之前的两篇博文《ABI/EABI/OABI详解及ARM-linux 浮点运算解析与配置》《Why ARM's EABI Matters?有关ARM-Linux平台浮点计算性能。

跟这篇博文的主题都有关系,这篇博文整理这方面的知识比较清楚,也便于应用。

=====================================================================

名字解释:
ABI,application binary interface (ABI),应用程序二进制接口。

编译版本问题:
GCC 4.0 为分界线
4.0版本以下,由于采用OABI接口,其对浮点的支持不太好
4.0版本以上,采用了新的EABI接口,其对软浮点和硬浮点的支持都比较好。

考虑在4.0版本以下时,其支持的ARM内核大多数没有硬浮点,所以可以分析资料比较少,
现在重点关注4.0版本以上。以下所述都是针对4.0版本以上的。

编译器相关的参数:
-mfloat-abi=soft 使用这个参数时,其将调用软浮点库(softfloat lib)来支持对浮点的运算,GCC编译器已经有这个库了,一般在libgcc里面。这时根本不会使用任何浮点指令,而是采用常用的指令来模拟浮点运算。但使用的ARM芯片不支持硬浮点时,可以考虑使用这个参数。在使用这个参数时,连接时一般会出现下面的提示:
undefined reference to `__aeabi_fdiv'
或者类似的提示,主要因为一般情况下连接器没有去主动寻找软浮点库,这时使用将libgcc库加入即可。

-mfloat-abi=softfp
-mfloat-abi=hard
这两个参数都用来产生硬浮点指令,至于产生哪里类型的硬浮点指令,需要由-mfpu=xxx参数来指令。这两个参数不同的地方是:
-mfloat-abi=softfp生成的代码采用兼容软浮点调用接口(即使用-mfloat-abi=soft时的调用接口),这样带来的好处是:兼容性和灵活性。库可以采用-mfloat-abi=soft编译,而关键的应用程序可以采用-mfloat-abi=softfp来编译。特别是在库由第三方发布的情况下。
-mfloat-abi=hard生成的代码采用硬浮点(FPU)调用接口。这样要求所有库和应用程序必须采用这同一个参数来编译,否则连接时会出现接口不兼容错误。

-mfpu=vfp
-mfpu=fpa
...
前面已经讲述了,-mfpu参数就是用来指定要产生哪种硬浮点指令。常见的有vfp,fpa等。

编译器使用时要注意的地方:
1.确认编译器默认是使用哪种参数来处理浮点操作的。写一个简单的浮点数程序:
#include <stdio.h>
int main(void)
{
double d1 = 10.3;
double d2 = 2.0;

double dret = d1/d2;
dret++;

printf("result :%f",dret);

return 0;
}

然后使用
arm-linux-gcc -c main.c -o main.o
再使用
arm-linux-objdump -d main.o
然后观察产生的指令,从而确定默认使用的是软浮点还是硬浮点。(确认的过程,看个人。晃一眼,里面如果有不熟悉指令,那可能就是硬浮点指令了)

2.确认编译器所带的库使用哪种参数来编译的。
3.确认所使用的芯片是否支持硬浮点,如果支持,是哪种类型的浮点指令。如果1,2与使用的芯片相冲突,这时就要考虑另寻编译器了。

这三点确认以后,我们在写自己的应用程序时,就会知道该怎样使用这些参数了。

Linux相关问题:
这里涉及两个问题:1.使用的ARM芯片不支持硬浮点
2.使用的ARM芯片支持硬浮点
问题1:使用的ARM芯片不支持硬浮点
在配置ARM Linux内核时,应该都会看到这样的配置:
menu "Floating point emulation"
comment "At least one emulation must be selected"
config FPE_NWFPE
...
这个是用来配置在内核里面模拟浮点处理器。
这个配置有什么作用呢?估计很少有人能够知道。其实它是这样的:
当使用的ARM芯片不支持硬浮点,而又采用了-mfpu=fpa -mfloat-abi=softfp/hard来编译应用程序。现在应该知道,采用这样的参数是要参数fpa硬浮点指令。但是使用的ARM芯片不支持硬浮点,这时这个配置就其作用了。因为使用了fpa硬浮点指令,但使用的ARM芯片不支持硬浮点,这样当程序运行到fpa硬浮点指令,会出现指令异常,便会陷入到内核里,这时这个模拟浮点处理器就来模拟这些浮点指令。现在应该清楚了,其作用了吧。但是现在有了更好的办法,前面已经讲过了,采用-mfloat-abi=soft参数来编译应用程序,这样效率会快得多。想想从用户态切换到内核态,以及由此产生的cache和TLB表的损失。所以可以考虑将这个配置抛弃了。

问题2:使用的ARM芯片支持硬浮点
一般ARM芯片支持硬浮点,都是采用协处理器方式的。与ARM内核本身一样,协处理器也有自己的寄存器。这样当多个进程同时涉及浮点运算时,会怎样?所以Linux内核为了支持硬浮点,也要做一些工作的。
内核配置:
config VFP
bool "VFP-format floating point maths"
depends on CPU_V6 || CPU_ARM926T || CPU_V7 || CPU_FEROCEON
如果使用的ARM芯片支持硬浮点,同时在应用程序里面使用了硬浮点,那么内核可能需要做一些工作。。上面这个配置是针对vfp硬浮点处理器的;如果是其他硬浮点处理,需要参考相关的资料,来确认要做哪些功能。如果可以确保所有时候,可以确保只有一个进程使用硬浮点处理器,那可以不需要考虑对硬浮点相关寄存器的保存和切换,问题是可以确认吗?

对于浮点运算,针对ARM芯片应该尽量避免。如果无法避免,那就需要综合考虑到底使用哪种方式?如何去操作?性能如何?都需要考虑,去实验测试是最好的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: