Cuda C 混合编译

1 extern “C”

在用CUDA的.cu文件和C的.c文件混合编译时,最后用gcc对之前步骤生成的目标.o文件混合编译时经常会报错

例如我门又如下三个文件
c语言的main.c文件

1
2
3
4
5
#include "cuda_fun.h"

int main(){
cuda_fun();
}

cuda_fun.h头文件是函数的声明,这里省略

cuda_fun.cu

1
2
3
4
5
6
7
8
9
10
11
12

#include "cuda_fun.h"

__global__ cuda_kernel(){
//some code
}

int cuda_fun(){
nBlock = 1;
nThread = 128;
cuda_kernel<<<nBlock,nThread>>>();
}

如果我们想混合编译.c和.cu文件,编译时可能会遇到undefined reference to cuda_fun的错误,这是由于由于nvcc用的是c++的编译器,c++与c混合编译也会遇到这样的问题,所以我们需要用extern "C"来修饰cu里面的代码,如下所示

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17


extern "C"{
#include "cuda_fun.h"
}
__global__ cuda_kernel(){
//some code
}

extern "C"{
int cuda_fun(){
nBlock = 1;
nThread = 128;
cuda_kernel<<<nBlock,nThread>>>();
}
}

2 cuda库

但是如果我们直接用

1
gcc -o my_app main.o my_fun.o

进行编译的话,会报例如undefined reference to cudalaunchkernel等的错误。这是由于找不到cuda的一些运行时的库导致的,所以我们需要在gcc编译时用 -L-l 来引入相应的库

1
gcc -o my_app  -L/usr/local/cuda-10.0/lib64 -lcuda -lcudart main.o my_fun.o 

根据gcc链接器工作原理,被依赖目标文件(或库)必须放在引用该文件的目标文件(或库)的后面(如果放在前面,链接器在处理被依赖文件时,不知道后面会有对该文件的引用,被引用的符号就不会提取出来)

说白了就是被引用的在后面,如果无法理清依赖关系,可以用Xlinker,或者是单纯的多写几遍\(^o^)/~,这里不再详细说了