CUDA 5.0 のC言語 (GPGPU関連)
Posted: 2013年2月28日(木) 15:33
CUDAのC言語ですけれども、
CUDA5.0以降、kernel関数の中にkernel関数をコールできるようになったそうですが、
これで、並行アルゴリズムの実行速度が実際に速くなるのでしょうか。
これまでkernel を発行する旅に、
GPUとCPUとの間しょっちゅうやり取りしなければないないので、非常に非能率でした。
経験のある方、ご存知の方お願いします。
CUDA5.0以降、kernel関数の中にkernel関数をコールできるようになったそうですが、
これで、並行アルゴリズムの実行速度が実際に速くなるのでしょうか。
これまでkernel を発行する旅に、
GPUとCPUとの間しょっちゅうやり取りしなければないないので、非常に非能率でした。
経験のある方、ご存知の方お願いします。