CUDA内核在GPU上是怎么执行的？Reddit大神这组图片，不懂CUDA的人看

量子位看科技 2025-11-13 12:58:05

CUDA内核在GPU上是怎么执行的？Reddit大神这组图片，不懂CUDA的人看了也能有直观概念。【图1】在GPU上跑一个CUDA Kernel，第一步是把任务拆成一个大的线程网格Grid，里面塞满一个个Block。这个Grid就是“要完成的全部工作量”，Block就是被分成的小任务。【图2】GPU内部有很多个SM（Streaming Multiprocessor），它们是负责运算的“小机器”。每个Block会被自动分配到某个SM上去跑，一个SM一次能接多少Block，要看它的硬件资源。【图3】Block不会直接跑，到了SM里会再被切成一个个Warp。Warp由32条线程组成，是GPU真正调度的单位。可以理解为：Block是任务包，Warp才是上机干活的小队。【图4】一个Warp的32条线程，会被塞进SM内部的CUDA Core里执行。Core数量够，Warp就能一次性跑完；Core不够，多出来的Warp就只能排队等位置。【图5】SM里有Warp调度器，它决定哪个Warp先跑、哪个先停。并不是所有Warp一起执行，而是调度器轮流“点名”。所以GPU高速，但也是有节奏的。【图6】如果Grid里的Block数量比SM数量多，就会出现“排队”。SM忙不过来，多出来的Block会先放在队列里，等前面的跑完再补上，这个过程完全自动。【图7】不同Block之间怎么调度、什么时候上SM，不需要开发者操心，GPU会自己做资源分配。我们只需要告诉它Block和线程数量，剩下就是GPU的事。【图8】最后一张是整个执行流程的总结：Grid → Block → Warp → Thread，再到SM和CUDA Core。所有Block都会被GPU按SM数量分批跑完，实现自动扩展和并行。总体来看，这组图讲的很清楚了，如果后续再加一套图，把共享内存访问、L1/L2缓存、bank conflict这些讲清楚，会更接近真正的CUDA性能优化流程。原图地址：www.reddit.com/r/CUDA/comments/1ofvfpe/how_cuda_kernels_are_executed_on_the_gpu/

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

MiniMax实习生炼成屠榜模型屠榜开源榜MiniMaxM2技术解析屠榜开源大模

2

聚焦手机AI超级入口中兴小模型让手机变小秘手机上的AI“超级入口”，真的来了。

3

Qwen半成品刷下AIME25满分Qwen预览版数学推理SOTA半成品模型，已经

4

OpenAI宫斗真相全曝光52页证词撕开硅谷宫斗最新披露的llya 52页证词，

5

AI正取代哪些岗位这些岗位正受AI影响2025年，全球招聘数量同比下降了8%，A

6

AI编程提示词Top20常用VibeCoding提示词😂要说最热门的编程语言，

7

OpenAI给AWS甩380亿算力订单OpenAI与亚马逊达成云合作OpenAI

8

马斯克奥特曼再开撕硅谷甄嬛传更新精彩，实在是精彩！硅谷"甄嬛传"——马斯克和奥特

9

两个业余数学家推翻300年猜想300年数学定律被推翻一个300多年的难题，居然被

10

一句话做AI漫画人人都能当漫画师AI漫画也能“拍立得”了：输入一句话➕一张照片，

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

3

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

6

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

7

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

8

中国移动你是良心发现了吗？中国移动你是良心发现了吗？18年的老用户了，每个月就

9

这下你用iPhone的控制中心不会迷茫了。

10

小鹏机器人“猫步”惊艳全场！网友疑是真人，何小鹏四字回应暗藏玄机昨日，第七届小

科技最新文章

1

还别说这次的荣耀500系列外观设计有东西，正面是直屏大R角，极窄边框，背面一改之

2

荣耀是没学会怎么阉割标准版吗？料给的太足了！看完荣耀Magic8拆解视频，感

3

荣耀500大概就是这样了，猜价格？首先是外观全新大变样，这颜值比上一代提

4

荣耀不讲武德！这下GT2系列怕是要彻底杀疯了[捂脸哭]看完荣耀GT2系列的硬件配

5

发布会可以不用开了，荣耀500真机开箱来了，而且配置参数基本确定从媒体放出的

6

荣耀500真机外观亮相，全系列采用6.55英寸机身，荣耀500标准版搭载骁龙8s

7

想换mate70air了，在华为店模拟日常使用试玩了半天，9020b在华为这是吃

8

从华为Mate60Pro换到荣耀Magic8Pro，续航和拍照的提升是意料之

9

重磅消息！华为Mate80系列手机壳曝光，摄像模组是居中大圆，和华为Mate

10

今年7月发布的荣耀X70，用了快4个月了，现在体验怎么样呢？个人感觉，在中端