世良情感网

英伟达恢复H20供应,为什么很多公司“没有骨气的”立马购买,会不会断了中国芯片的

英伟达恢复H20供应,为什么很多公司“没有骨气的”立马购买,会不会断了中国芯片的发展? 看看国内需求非常大的豆包(抖音旗下的)服务器,也许能窥一二 虽然H20阉割版,但的确还是比国产强很多。 但是大公司也怕断供,所以都国产的,和进口的都买一部分。 毕竟大公司首先考虑的是发展。 🖥️ 一、**豆包服务器架构与芯片现状** 1. **混合架构设计** - **训练层**:依赖英伟达高端GPU(如H100/A100),通过海外数据中心或租赁第三方算力获取,用于大模型训练。 - **推理层**:国内服务器以**国产芯片为主**(昇腾910B、寒武纪思元590等),搭配英伟达特供版**H20芯片**(性能为H100的15%-30%)。 - **比例**:2025年国内芯片采购中,60%为国产芯片,40%为英伟达H20等受限型号。 2. **国产芯片应用深化** - 华为昇腾910B承担主要推理任务,寒武纪思元590适配金融等垂直场景。 - 国产芯片已支持豆包7100万月活用户的实时推理需求,单位成本低至3厘/千Token。 --- ⚠️ 二、**断供风险:短期承压,长期可控** 1. **短期风险:训练环节高度依赖海外芯片** - 豆包模型的训练依赖英伟达H100/A100等芯片,若美国全面断供,海外算力租赁渠道可能受阻(拜登政府已要求审查芯片最终用户)。 - 英伟达特供芯片(如H20)政策反复,2025年4月曾遭禁售,导致字节跳动紧急调整供应链。 2. **长期韧性:国产替代加速落地** - **技术突破**:国产12nm工艺芯片(如江原D10)已支持千亿模型推理,下一代D20/T800芯片性能对标英伟达A100。 - **生态适配**:华为昇腾、寒武纪完善了CUDA转译工具链,主流框架(PyTorch、TensorFlow)兼容性达80%以上。 - **政策驱动**:中国数据中心国产芯片占比从2023年的14%升至2024年的34.6%,字节跳动60%国内订单投向国产芯片。 🛡️ 三、**字节跳动的应对策略** 1. **供应链多元化** - **国内**:与华为、寒武纪签订长期订单,2025年国产芯片采购额达400亿元。 - **海外**:在马来西亚、新加坡建设数据中心,通过第三方租赁获取英伟达芯片(已锁定2025年大部分需求)。 2. **技术降本增效** - 推理任务全面转向国产芯片,单位成本降低70%。 - 自研MoE稀疏架构,减少单次推理算力需求。 3. **政策风险对冲** - 国产芯片优先用于金融、政务等敏感领域,规避政策不确定性。 - **局限**:国产芯片在超大规模集群训练(万卡级)、FP16高精度计算等领域仍落后英伟达旗舰芯片2-3年。 - **突破点**:江原T800、寒武纪思元590等芯片已支持2000亿参数模型训练,推理场景差距基本弥合。 五、**结论:卡脖子风险分级评估** 1. **训练环节**:🔥 **高风险**(依赖英伟达A100/H100,替代周期需2-3年)。 2. **推理环节**:⚠️ **中低风险**(国产芯片+特供H20双备份,已满足70%需求)。 3. **长期趋势**:🚀 **风险持续下降**(国产算力占比超60%+政策强制替代)。 :豆包通过“国内国产化+海外迂回采购”策略,短期内可抵御断供冲击;长期随国产芯片性能提升(如江原T800)和生态完善,被“卡脖子”的概率将大幅降低。但若美国升级制裁(如封堵第三方租赁),训练能力仍可能受阶段性影响。