英伟达韩松团队新作英伟达新模型比Qwen快47倍英伟达开源又放大招了！韩松团队推

量子位看科技 2025-08-26 17:45:37

英伟达韩松团队新作英伟达新模型比Qwen快47倍

英伟达开源又放大招了！

韩松团队推出了一款全新的基于后神经架构搜索的高效语言模型——Jet-Nemotron。

该模型在一系列基准测试中，不仅表现出与Qwen3、Qwen2.5、Gemma 3和Llama 3.2相当甚至更优的准确率，还在生成吞吐量上实现最高53.6倍加速，在预填充阶段达到6.1倍加速。

值得一提的是，在MMLU、MMLU-Pro和BBH基准上，Jet-Nemotron-2B相比Qwen3-1.7B-Base吞吐量提高了47倍，缓存大小缩小至1/47。

同时，它还实现了比DeepSeek-V3-Small和Moonlight（共150亿参数，22亿激活参数）更高的准确率。

代码和预训练模型都将开源，我们先来看看Jet-Nemotron是如何构建的。

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

英伟达韩松团队新作英伟达新模型比Qwen快47倍英伟达开源又放大招了！韩松团队推

2

UNIX被骂合集买书居然送呕吐袋一本关于UNIX的书，买书居然送呕吐袋？1994

3

英伟达咽喉上的苏州女人她凭一颗芯撬动AI用电潮英伟达供应链里，悄然出现了一个陌生

4

大模型开发生态还有哪些新机遇 9月13日来外滩找答案 | 报名开启AI开源时代，

5

中兴让大模型飞入寻常GPU中兴Mariana撕开显存天花板当大语言模型（LLM）

6

微信授权背后认证机制图解OAuth认证原理当你点击“微信授权”或“允许某应用访问

7

科学家发现上帝粒子新秘密希格斯玻色子罕见衰变证据出现粒子是如何获得质量的？人们对

8

为什么和AI聊天会上瘾AI真的有情感吗为什么和AI聊天会上瘾？背后其实有一套精心

9

马斯克再告OpenAI并拉上苹果马斯克怒喷iOS强推ChatGPT马斯克又把Op

10

苹果折叠屏最新爆料苹果折叠屏TouchID回归苹果折叠屏的新消息来了：- 厚度控

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

光刻机禁售，我忍了。芯片技术封锁，我也忍了。但全国首台国产电子束光刻机在杭州

2

太tm解气了，当华为pura80ultra更新后，麒麟9020出现的那一刻，心

3

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

4

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

5

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

6

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

7

9月骁龙峰会，六款国产旗舰新机扎堆硬刚苹果17：荣耀Magic8系列、iQ

8

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

9

曝iPhone17Pro仍保留SIM卡槽很正常啊，毕竟iPhone是全球机型，

10

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

科技最新文章

1

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

2

真心发问，小鹏汽车很土吗？小鹏汽车董事长兼CEO何小鹏在做客罗永

3

小鹏汽车董事长CEO何小鹏参加《罗永浩的十字路口》第二期视频播客访谈。节目中，何

4

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

5

Pura80Pro/Pro+/Ultra三机区别最大的还是影像先来看看主摄，P

6

高德新升级的地图，昨天晚上用一下，感觉满屏都是线，无关的对象车道不用显示出来吧，

7

国产机器人的挑战来了！英伟达机器人大脑名动风云，“新大脑”发售，英伟达在A

8

补齐短板，iPhone手机总算支持反向无线充电了！今天刚刚曝光的消息，今年9月

9

依然特供，英伟达试探中国！当地时间8月22日，黄仁勋造访台积电时透露，正在和美国

10

还是高志凯教授说的有道理。据媒体报道：高志凯博士建议：只要是英伟达在中国市场销售