您的位置:首页 > 其它

C程序编译与CUDA编译

2017-10-16 15:40 218 查看
1,C编译流程

预处理(Preprocessing)
展开宏,添加引用的文件,去除不影响程序执行的语句

gcc
-E hello.c
-o hello.i

编译(Compilation)
将预处理后的文件转化为汇编代码(包括优化)

gcc -S
hello.i  -o
hello.s

汇编(Assembly)
将汇编代码转化为机器码

gcc
-c hello.c
-o hello.o

链接(Linking)
调用链接器ld链接运行程序需要一些目标文件

gcc
-o hello
hello.c -L./addlib
-ladd

2,编译选项

-shared :指定生成动态链接库。
-static :指定生成静态链接库。
-fPIC :表示编译为位置独立的代码,用于编译共享库。目标文件需要创建成位置无关码,念上就是在可执行程序装载它们的时候,它们可以放在可执行程序的内存里的任何地方。
-L. :表示要连接的库所在的目录。
-l:指定链接时需要的动态库。编译器查找动态连接库时有隐含的命名规则,即在给出的名字前面加上lib,后面加上.a/.so来确定库的名称。
-Wall :生成所有警告信息。
-ggdb :此选项将尽可能的生成gdb的可以使用的调试信息。
-g :编译器在编译的时候产生调试信息。
-c :只激活预处理、编译和汇编,也就是把程序做成目标文件(.o文件)。
-Wl,options :把参数(options)传递给链接器ld。如果options中间有逗号,就将options分成多个选项,然后传递给链接程序。

3,CUDA编译流程

nvcc编译器会将cudaApp.cu的内容分为主机端和设备端进行不同的处理:

设备端:通过nvcc对设备端代码进行编译产生kernel.ptx文件(微码文件),在通过ptxas将微码编译为kernel.cubin文件

主机端:将调用设备端的代码转化为c代码,加上kernel.cubin文件一起由主机端的编译器进行编译。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  并行计算 gpu cpu cuda