6月30日,中国人工智能领域见证了历史性的一刻。
美团与华为在同一天发布了各自的开源模型,与此同时,算力芯片领域的领军企业寒武纪的市值在盘中飙升至万亿级别,模型、芯片与资本市场呈现出协同效应。
美团推出的新一代开源模型LongCat-2.0,拥有高达1.6万亿的参数量,其测试版本的使用量已位列全球前三。
虽然拥有1.6万亿参数的国产模型并非首例,与4月份推出的DeepSeek模型规模相当,但关键在于LongCat-2.0完全是基于国产算力进行训练的,这标志着“国产模型与国产芯片”深度融合趋势的体现。
尽管此前已有基于国产算力训练的模型的先例,但它们尚未达到1.6万亿参数的规模。另一方面,虽然大多数模型已开始探索使用国产算力进行推理,但训练阶段仍普遍依赖英伟达的芯片。这也是为何作为国产算力概念股的寒武纪,在经历了超过9个月的横盘整理后,才开始向万亿市值发起冲击。
与此同时,随着Mythos 5等前沿模型的“出口管制”变相实施,越来越多的中国企业如美团和华为推出开源模型,为全球“主权AI”用户提供了更多选择。
中国企业引领开源浪潮
公开数据显示,开源大模型生态的增长速度异常迅猛。
根据美国独立研究机构Interconnects AI发布的ATOM报告,从2025年3月到2026年3月,全球开源模型的累计下载量从3.39亿激增至20.4亿,同比增幅高达6倍。在2024年11月至2026年1月期间,中国、美国和欧洲的开源模型使用量占比分别为72.7%、10.4%和16.8%。
相较于去年,中国开源模型的下载量同比增长了11.9倍,美国为4.1倍,欧洲为2.5倍,下载量增速存在显著差异。
在中国开源模型领域,阿里巴巴的Qwen系列扮演了重要角色,并在近期持续占据领先地位。2025年9月,阿里Qwen的下载量首次超越了Meta的Llama模型;到2026年3月,Qwen的累计下载量已达9.42亿次,几乎是Llama的两倍。
“全球顶尖的八种模型中,有三种来自中国。” 盖茨在2025年3月纽约经济俱乐部的一次讲座中如此评价。实际上,在全球最大的AI开源社区Hugging Face的排行榜上,排名前十的开源大模型大多是中国制造。
Meta前首席AI科学家、图灵奖得主Yann LeCun也一直高度赞扬中国开源模型,他表示:“目前最好的开源模型来自中国,整个研究社区都在依赖它们。”
中国开源模型之所以能够领跑,得益于人才储备、运营效率以及国内大力推广开源的优势。
清华大学智能产业研究院(AIR)创始院长张亚勤在2026年达沃斯论坛上指出,中国AI人才的培养规模约是美国的五倍。同时,DeepSeek等模型通过算力和电力成本的极致优化,正在不断提升开源模型的全球竞争力。
中国开源大模型取得突破性进展的标志性事件是DeepSeek R1的发布。
2025年1月20日,DeepSeek发布了其开源模型R1。一周后,英伟达的股价大幅下跌约17%,市值蒸发了5900亿美元。当时,这一事件被解读为“市场对巨额投入构建AI大语言模型的合理性和前景产生了质疑”。
正如AI领域的泰斗级人物吴恩德所判断的,当时美国对中国AI发展的遏制,反而促使中国走出了一条效率极高的“第二增长曲线”。根据DeepSeek的技术报告显示,DeepSeek V3模型在训练时仅使用了由2048块H800组成的集群。
前HuggingFace亚太生态负责人王铁震提到,目前DeepSeek的强化学习训练算法正在直接提升美国实验室的产出效率。“许多中国开源模型的权重都在美国硬件上运行。” 中国的开源模型也在加速美国闭源模型的进化。
相比之下,闭源模型的控制权集中在单一厂商手中,并且容易受到监管政策的影响。
此前,Fable 5和Mythos 5曾出现“全球下线”的情况。在经过一系列封禁和漏洞修复后重新上线,但重新开放的Fable 5系列已不允许非美国公民使用。
“美国政府对顶尖模型日益增多的限制,将把更多用户推向中国AI模型的阵营。” 《经济学人》对这一现象做出了评论。
阿里巴巴集团主席蔡崇信观察到,欧洲的高管和科学家最关心的是“主权”。他们担心技术被“一键关闭”,也担心数据一旦交出就无法收回。“开源恰好能够解决这两个问题。模型可以下载到自己的数据中心,与原始制造商无关,数据也能保留在自己的防火墙内。”
目前,开源已成为大模型领域的“集体共识”,国内主要的模型几乎都已实现开源,包括DeepSeek、Qwen、Kimi、混元、小米MiMo等。
与此同时,中国大模型的迭代速度也在不断加快。模型的更新周期已从过去的“半年一代”缩短至“一月数款”。有网友在X上向马斯克提问,预计中国大模型何时能达到Anthropic的Fable水平,马斯克预测为2027年第一季度。
随后,智谱AI创始人唐杰回复马斯克称:“用不了那么久。”
从“追赶者”转变为“领跑者”,中国开源模型仅用了一年时间。然而,在快速发展的同时,中国大模型仍需跨越算力自主的另一道挑战。
重新评估国产算力价值
在过去相当长一段时间里,模型训练高度依赖英伟达的GPU。然而,随着美国出口管制政策的不断收紧,Hopper系列和Blackwell系列之后的多款先进芯片已被禁止出口到中国。
2025年,英伟达的CEO黄仁勋多次表示,中国市场的销量将为零。在刚刚结束的英伟达2026财年股东大会上,黄仁勋透露,2026财年英伟达来自中国的营收占比已降至约9%。
《金融时报》援引一位交易员的消息称,受出口管制影响,英伟达的非合规产品价格普遍大幅上涨。即使是RTX 6000 Pro这类算力相对较低的产品,价格也从年初的约5万元人民币飙升至最高13万元人民币,涨幅达160%。
一系列出口禁令迫使大量算力需求转向国内市场,这为“寒武纪们”创造了绝佳的市场机遇。6月30日,寒武纪的盘中市值突破10000亿,充分证明了国产算力价值的重估。
如文章开头所述,越来越多的国产模型在推理层面开始集成国产算力。
4月底发布的DeepSeek V4,其技术报告首次将昇腾NPU与英伟达GPU并列进行验证。这是DeepSeek尝试将推理路径从单一硬件依赖中解耦出来的举措。与此同时,在完成超过500亿人民币的融资后,DeepSeek也开始推动数据中心的建设,这为国产算力带来了增量空间。
梁文锋(DeepSeek创始人)的投入决心有多大,国产算力的发展机遇就有多大。
6月17日,智谱发布并开源了新一代旗舰大模型GLM-5.2。昇腾、平头哥、摩尔线程等国产算力平台迅速完成了“Day 0”级别的推理适配,在国产芯片集群上实现了高吞吐、低延迟、大并发的稳定运行。
越来越多的中国模型开始释放算力需求,但国产算力的供给也面临挑战。
“一卡难求,包括我自己,我们虽然生产卡,但是我想用卡也很难。” 华为昇腾的一位内部专家在一次沟通会上表示。
2025年初,由于市场上仍能购得英伟达和AMD等提供的合规产品,业内对国产卡的态度更侧重于“好不好用”的问题。但在过去一年多海外算力供应中断的真空期,中国大模型面临的是“不得不用”的困境。
如果说DeepSeek等模型在推理端迈出了与国产算力匹配的关键一步,那么美团则通过其1.6万亿参数的Long-Cat 2.0模型,打开了国产算力训练的广阔想象空间。
中国算力与中国模型的融合之路已走过漫长岁月,仿佛史诗中那场持续十年的“奥德赛”,漫长且充满不确定性。

用户评论