转自:http://blog.sina.com.cn/s/blog_48b9e1f90100fm56.html CUDA的代码分成两部分,一部分在host(CPU)上运行,是普通的C代码:另一部分在device(GPU)上运行,是并行代码,称为kernel,由nvcc进行编译. Kernel产生的所有线程成为Grid.在并行部分结束后,程序回到串行部分即到host上运行. 在CUDA中,host和device有不同的内存空间.所以在device上执行kernel时,程序员需要把host memo…