多线程到硬件线程
OpenCL中,Kernel函数由Workgroup中的Workitem执行。在硬件层,Workgroup映射到硬件的CU单元,由SIMT PE组成。这些PE执行具体Workitem计算,按照特定顺序分组调度到硬件执行。在NVIDIA和AMD硬件中,这些调度单位分别称为Warp和Wavefront。
5.4MB
文件大小:
评论区