世良情感网

Qwen3 开源模型来了!该模型包含 2 个 MoE 模型和 6 个密集模型,规

Qwen3 开源模型来了!

该模型包含 2 个 MoE 模型和 6 个密集模型,规模从 0.6B 到 235B。旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准测试中取得了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比极具竞争力。

此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数量是 QwQ-32B 的 10 倍,即使是像 Qwen3-4B 这样的微型模型也能与 Qwen2.5-72B-Instruct 的性能相媲美。

看数据表现不错,现在开源模型不经追求能力的上限,也要控制好参数量规模。