世良情感网

Cerebras本周一直在展示其以极快的速度托管大型MoE的能力,以>1,500

Cerebras本周一直在展示其以极快的速度托管大型MoE的能力,以>1,500个输出令牌/s的速度推出了Qwen3 235B 2507和Qwen3 Coder 480B端点 ➤ @CerebrasSystems现在为Qwen3 235B 2507推理和非推理提供端点。两种型号都有235B总参数,22B有效。 ➤ Qwen 3 235B 2507 Reasoning提供与o4-mini(高)和DeepSeek R1 0528相当的智能。非推理变体提供了与Kimi K2相当的情报,远远高于GPT-4.1和Llama 4 Maverick。 ➤Qwen3编码器480B总参数为480B,35B活跃。该模型在代理编码方面特别强大,可用于各种编码代理工具,包括Qwen3-Coder CLI。 Cerebras的发布代表了首次以这些输出速度访问这种级别的智能,并有可能解锁新的用例——例如为代理的每个步骤使用推理模型,而不必等待几分钟。每天跟我涨知识 技术分享