多线程到硬件线程 OpenCL中,Kernel函数由Workgroup中的Workitem执行。在硬件层,Workgroup映射到硬件的CU单元,由SIMT PE组成。这些PE执行具体Workitem计算,按照特定顺序分组调度到硬件执行。在NVIDIA和AMD硬件中,这些调度单位分别称为Warp和Wavefront。 C 28 次浏览 2024-05-02