arxiv.org/abs/2511.02779字跳的这个论文蛮有意思。现在的大

蚁工厂 2025-11-11 21:31:28

arxiv.org/abs/2511.02779字跳的这个论文蛮有意思。现在的大模型包括多模态大模型在某类问题上成功率不高：需要通过生成中间的视觉图像（如草图、结构图或路径）才能解决的问题。在这类问题上使用纯文本思维链（Level 2）几乎没有带来任何好处，甚至对某些强大模型（如Gemini 2.5 Pro 和 O3）的性能有负面影响（准确率分别下降18.3%和14.0%）。论文中的实验结果认为，未来的多模态模型迫切需要发展出一种“边想边画”的能力，在推理过程中主动生成和利用高质量的中间视觉状态（有点像人类打草稿一样？），以弥合与人类解决问题方式之间的差距。

0 阅读：0

感谢大家的关注

作者最新文章

1

魏建军吐槽太多发布会让人听不懂长城Hi4 这图里的一句话总结还是蛮清晰，感觉似乎

2

Deep-ML.com ，一个开源的机器学习挑战平台，可以看作机器学习版的lee

3

海尔换新万里行正式启动 3月20日，在AWE期间，海尔换新万里行发布会在上海正式

4

现代机器人课程github.com/madibabaiasl/modern-ro

5

称呼1B参数的模型为小模型是不礼貌的。应该叫中杯/大杯/超大杯。罗老师.gif

6

AMD开源了GAIA项目，用于在本地跑大模型github.com/amd/gai

7

电子书 The little book about OS development

8

github.com/sail-sg/understand-r1-zero为了理

9

AI用3.6亿条数据生成梦中情房能安全落地的房子就是好房子。买房是人生大事，检

10

有了养老机器人你还想生孩子吗有点口水和因果倒置的话题。首先是少子化的社会现状推

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

3

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

6

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

7

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

8

中国移动你是良心发现了吗？中国移动你是良心发现了吗？18年的老用户了，每个月就

9

这下你用iPhone的控制中心不会迷茫了。

10

小鹏机器人“猫步”惊艳全场！网友疑是真人，何小鹏四字回应暗藏玄机昨日，第七届小

科技最新文章

1

不懂就问，谢霆锋这用的是什么手机？其实很好辨认，从镜头Deco设计、侧边的实

2

布灵布灵的闪，我有点晕3D了....第一次被手机搞得有点晕3D！！OPPO

3

陈芋汐手持荣耀500真机，预计搭载8000mAh电池!陈芋汐手持荣耀500，

4

两款旗舰对决！荣耀Magic8vs一加15，你站谁？🔥要我选，必须推荐

5

荣耀全价位购机指南来啦！📱不同预算照着买，绝对不踩雷！【1-2K档位】

6

咱就是说，现在旗舰机价格真的杀疯了！荣耀Magic8这一波，简直就是标准版水桶机

7

华为这波操作实在让人想不明白去年高价抢购机的小伙伴“哭晕”在厕所？这个双十一

8

鸿蒙6.0.0.110（Sp97）整整1.03G的，这难道是APi21，这节奏真

9

荣耀500就这样被自家店员水灵灵地泄密了，她是不想干了吗？发布会还没开，直接把荣

10

100万保密协议也拦不住？荣耀500真机提前开箱，横排三摄比左上角顺眼多了！