AndrejKarpathy最近开发了一个名为“LLMCouncil”的网

爱生活爱珂珂 2025-11-23 13:05:23

Andrej Karpathy 最近开发了一个名为“LLM Council”的网页应用，模拟ChatGPT界面，但背后运行着多个大型语言模型（LLM）共同协作回答问题。用户每次提问，系统会并行调用多款模型（如GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5、Grok 4），并让它们匿名互评、排名，最终由“主席模型”整合评论和回复，输出最终答案。这种多模型并行评议的方式不仅让人能直观对比不同模型的回答，更有趣的是看到它们彼此打分、互相认可甚至承认别的模型表现更优，这为模型评估提供了新思路。Karpathy观察到，模型间的评价有时与人类主观感受不完全一致，比如GPT-5.1虽然被频繁选为最有洞察力，但回答偏冗长；Gemini 3更简洁；Claude则相对简短甚至“吝啬”。这表明LLM集成的设计空间极大，值得深入探索。社区反馈也非常热烈，大家分享了类似的开源项目、不同的评估策略和应用场景： - 有人用多模型议会识别回答分歧，反复让模型自我纠错，提升答案质量； - 有建议使用更细化的评分指标（准确度、清晰度、洞察力等）减少偏见； - 有人把这种思路扩展到模拟专家咨询会、企业决策、甚至司法审判； - 还有人强调实战中“快速交付”比无休止分析更重要； - 多数认可多模型集成是提升AI可靠性和多样性的有效路径。这也启示我们，AI不再是单一模型独奏，而更像是一个多元智慧的“议会”，通过协作、批判和融合，产生更全面、更精准的答案。未来，如何设计更优的“主席模型”决策机制、不同模型间的互动规范，以及更科学的评价体系，将成为AI应用的重要研究方向。Karpathy的项目代码开放： x.com/karpathy/status/1992381094667411768总结：AI多模型“议会”开启了智能问答的新篇章，让我们看到机器不仅能答，更能互评、互助，推动AI智慧的群体进化。

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

新技术往往先作为“玩具”面世，因为它必须经历从“完全不可用”到“完美可用”的漫长

2

Andrej Karpathy 最近开发了一个名为“LLM Council”的网

3

[人人能懂] 从虚假纠错、全知指数到诗歌越狱我们总惊叹AI越来越聪明，但你有没有

4

[CL]《Adversarial Poetry as a Universal S

5

[CL]《AA-Omniscience: Evaluating Cross-Do

6

[CV]《Back to Basics: Let Denoising Gener

7

[LG]《Structural Inducements for Hallucin

8

早！

9

数据科学工作流程复杂，涉及规划、执行、验证和反思多个环节，单靠传统工具难以高效协

10

MiroFlow是由MiroMind AI团队推出的一款开源高性能研究智能体框架

热门分类

科技TOP

1

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

2

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

3

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

4

中国移动你是良心发现了吗？中国移动你是良心发现了吗？18年的老用户了，每个月就

5

小鹏机器人“猫步”惊艳全场！网友疑是真人，何小鹏四字回应暗藏玄机昨日，第七届小

6

MagicOS10迎来重大更新，升级至116版本，内容很多，有1.2GB新增

7

这次准备买华为Mate80Pro的，务必选择16GB运存版本的，因为这个版本

8

mate系列最近3代的青色同框对比，如此看来，还是mate60的设计要养眼一些，

9

今晚恐怕没有一个友商笑得出来了，华为Mate80系，配置汇总简直大开眼界。全

10

Mate80的直屏设计真的很出彩！这外观太也太赞了吧！

科技最新文章

1

mate系列最近3代的青色同框对比，如此看来，还是mate60的设计要养眼一些，

2

华为Mate80系列还有几天就要发布了，这下2025年度旗舰已经集结完毕，给大家

3

余总手握Mate80ProMax，正面屏幕观感还是不错的，有几个点不难看出，真

4

万万没想到[捂脸哭]荣耀X60Pro竟然还在和荣耀X70的价格相差不多，有种新老

5

相信有不少强迫症的人可能接受不了华为mate80背后多出来的那个圆圈，假如，把那

6

华为Mate80星环设计回归了！此时此刻让你想起哪一代Mate了？磁吸圈

7

MagicOS10迎来重大更新，升级至116版本，内容很多，有1.2GB新增

8

荣耀真的不讲武德，荣耀GT2系列又要彻底杀疯了荣耀500系列官宣之后，12月

9

荣耀500Pro图赏抢先看！这一代荣耀数字系列，主打一个超级。在外观上面有挺

10

【荣耀500Pro宣布升级3D超声波指纹】荣耀500系列将于11月24日正式发