您的位置：首页 > 其它

C程序编译与CUDA编译

2017-10-16 15:40 218 查看

1，C编译流程

预处理（Preprocessing）
展开宏，添加引用的文件，去除不影响程序执行的语句

gcc
-E hello.c
-o hello.i

编译（Compilation）
将预处理后的文件转化为汇编代码（包括优化）

gcc -S
hello.i -o
hello.s

汇编（Assembly）
将汇编代码转化为机器码

gcc
-c hello.c
-o hello.o

链接（Linking）
调用链接器ld链接运行程序需要一些目标文件

gcc
-o hello
hello.c -L./addlib
-ladd

2，编译选项

-shared ：指定生成动态链接库。
-static ：指定生成静态链接库。
-fPIC ：表示编译为位置独立的代码，用于编译共享库。目标文件需要创建成位置无关码，念上就是在可执行程序装载它们的时候，它们可以放在可执行程序的内存里的任何地方。
-L. ：表示要连接的库所在的目录。
-l：指定链接时需要的动态库。编译器查找动态连接库时有隐含的命名规则，即在给出的名字前面加上lib，后面加上.a/.so来确定库的名称。
-Wall ：生成所有警告信息。
-ggdb ：此选项将尽可能的生成gdb的可以使用的调试信息。
-g ：编译器在编译的时候产生调试信息。
-c ：只激活预处理、编译和汇编,也就是把程序做成目标文件(.o文件)。
-Wl,options ：把参数(options)传递给链接器ld。如果options中间有逗号,就将options分成多个选项,然后传递给链接程序。

3，CUDA编译流程

nvcc编译器会将cudaApp.cu的内容分为主机端和设备端进行不同的处理：

设备端：通过nvcc对设备端代码进行编译产生kernel.ptx文件（微码文件），在通过ptxas将微码编译为kernel.cubin文件

主机端：将调用设备端的代码转化为c代码，加上kernel.cubin文件一起由主机端的编译器进行编译。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 并行计算 gpu cpu cuda

相关文章推荐

新的分享

章节导航