我写的cuda程序
2011-04-18 17:40
176 查看
#include "stdio.h"
#include "cuPrintf.cu"
#define N 10
__global__ void add(int *da,int *db,int*dc)
{
int tid=blockIdx.x;
if(tid<N)
c[tid]=a[tid]+b[tid];
}
int main()
{
int a
,b
,c
;//定义host端的三个数组变量
int *da,*db,*dc; //定义Debice端的三个数组指针变量
/* 下面三个语句表示在设备端为三个计算数组分配存储空间*/
cudaMalloc((void**)&da,N*sizeof(int));
cudaMalloc((void**)&db,N*sizeof(int));
cudaMalloc((void**))&dc,N*sizeof(int);
/*在主机端输入依次输入两个数组变量*/
printf("please input two arrays:");
printf("the first array a
=");
for(i=0;i<N)
scanf("%d",&a[i]);
printf("/n the second array b
=");
for(i=0;i<N)
scanf("%d",&b[i]);
/*将Host段的数组内容传递到Debice端*/
cudaMemcpy(da,a,N*sizeof(int),cudaHostToDevice);
cudaMemcpy(db,b,N*sizeof(int),cudaHostToDevice);
/*执行kernel函数,执行参数必须是设备端的参数,即da,db,dc 不应该是主机端的参数a,b,c*/
add<<< N, 1 >>>(da,db,dc);
/*将kernel函数执行后的结果由Device端传到Host端*/
cudaMemcpy(c,dc,N*sizeof(int),cudaDeviceToHost);
/*用for循环输出数组c[i]的结果*/
for(i=0;i<N;i++)
printf("the final array a[i]",c[i]);
/*释放在Device端分配的显存空间*/
cudaFree(da);
cudaFree(db);
return 0;
}
相关文章推荐
- CUDA: 程序优化的15个策略
- CUDA编程(三)评估CUDA程序的表现
- 使用Python写CUDA程序
- 【转】CUDA程序优化要点
- 解决CUDA程序的黑屏恢复问题
- cuda的简单程序
- java 调用cuda程序
- 矩阵棋盘划分的CUDA程序
- CUDA之程序优化总结
- Linux上CUDA程序调试(cuda-gdb)
- 我的CUDA学习之旅1——大图像分块处理程序(包括求均值,最大值等)
- CUDA程序计时
- CUDA6 Unified Memory,移植程序到GPU上再也不蛋碎
- 【CUDA】利用NVIDIA SDK生成dll程序详解
- GPU编程之CUDA(九)——示例程序运行截图【5_Simulations】
- GPU编程之CUDA(十)——示例程序运行截图【7_CUDALibraries】
- CUDA进阶第五篇-如何估算出程序的GPU加速比
- 多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)
- CUDA SDK示例程序概览
- 数组求和的快速方法(利用cuda的共享内存)--第二部分之程序完善