英伟达暗示小模型才是未来英伟达小模型四两拨千斤
大模型OUT,小模型才是智能体的未来!
这可不是标题党,而是英伟达最新论文观点:
在Agent任务中,大语言模型经常处理重复、专业化的子任务,这让它们消耗大量计算资源,且成本高、效率低、灵活性差。
相比之下,小语言模型则能在性能够用的前提下,让Agent任务的执行变得更加经济灵活。【图1】
网友的实测也印证了英伟达的观点:当6.7B的Toolformer学会调用API后,其性能超越了175B的GPT-3。
7B参数的DeepSeek-R1-Distill推理表现也已胜过Claude3.5和GPT-4o。【图2】
那么,小模型是如何“四两拨千斤”,放倒大模型的?下面具体来看: