过往,人工智能行业的核心竞争力聚焦于“谁拥有最卓越的模型”。模型参数、推理能力以及在各类基准测试(Benchmark)中的排名,几乎占据了所有AI公司发布会的全部议程。无论是OpenAI、Anthropic,还是中国的智谱、MiniMax、月之暗面,它们宣传自身的方式都高度相似——模型越智能,公司价值就越高,这是早期大模型公司的普遍叙事。
然而,这一叙事正在发生转变。以MiniMax M3的发布为例,其最引人注目的内容已不再仅仅是模型本身的强大能力,而是BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等一系列新的评估维度。这些新指标的共同特点是,它们不再关注模型“知道什么”,而是聚焦于模型“能够完成什么”。
许多人将这一转变解读为“Agent”的兴起。但若放长视角审视,M3更值得关注之处并非Agent本身,而是MiniMax对其自身价值定位的重新思考。它开始尝试回答一个行业过去鲜少认真探讨的问题:一家AI公司真正销售的究竟是什么?
01. 第一代AI公司:销售“智能”
在过去的几年里,竞争逻辑简单明了:模型的能力即产品,Benchmark的成绩即价值。MMLU、GSM8K、HumanEval、LiveCodeBench等基准测试,不仅仅是技术能力的衡量,更像是市场认可的价值衡量体系。如同CPU有SPEC、GPU有MLPerf、数据库有TPC一样,成熟的产业需要统一的标准来理解产品价值、辅助采购决策,并帮助资本形成共识。因此,模型的参数规模和排行榜上的位置,成为市场衡量AI公司最直接的指标。在此阶段,模型本身就是商品。
MiniMax M3发布中一个容易被忽视的亮点是,MiniMax花费了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等Benchmark的共同特征是,它们几乎不关心模型是否能给出答案,而是关注模型能否修复实际的Bug、能否独立执行网页操作、能否调用开发环境、能否对接企业系统,以及能否完成一项完整的工作。
换言之,Benchmark的评价对象发生了变化。过去评价的是“智能”(Intelligence),现在评价的是“任务完成”(Task Completion)。模型首次被置于“岗位考核”而非“知识考试”的场景下。这不仅仅是评测体系的演进,更是MiniMax向市场传递的信号:模型能力固然重要,但真正驱动商业价值的,将是其“工作能力”。
02. MiniMax为何开始强调“工作”?
过去,大型模型的首要客户是开发者。开发者购买的是模型能力,他们关心模型是否更聪明,能否解决更复杂的问题。然而,企业客户的考量则不同。企业采购AI,很少关注模型在排行榜上的具体名次。他们真正关心的是:AI能帮助业务完成多少工作?能节省多少人力?能融入多少现有流程?能提升多少效率?
因此,产品表达也随之改变。Browser不再仅仅是浏览器能力,而是融入办公流程;Coding不再只是代码生成,而是进入研发流程;Terminal不再只是Linux命令,而是进入开发环境;MCP也不再只是协议,而是对接企业现有的软件系统。将这些能力整合来看,MiniMax所展示的,已不再是单一模型,而是一套“工作流能力”。
03. 从Token到Workflow
许多人仍将AI公司视为API提供商,收入模式基于Token消耗。调用次数越多,收入越高,这是早期AI商业模式的典型特征。然而,如今一种新的趋势正在显现:越来越多的企业购买AI,并非为了获得更多的“回答”,而是为了完成更多的“工作”。修复一个Bug、整理一次会议纪要、处理一张工单、分析一份合同、完成一次网页操作,其价值单位正在发生转变。过去,一次调用对应一个Answer;如今,一次调用越来越对应一项Task。
MiniMax M3的产品设计也越来越围绕这一逻辑展开。模型正从“基础”转变为“底座”,而“工作流”(Workflow)则成为其核心产品。若将M3置于行业视角下观察,它代表了一种新的产品叙事。越来越多的AI公司开始展示其“工作能力”。这种变化并非MiniMax独有。Claude Code强调开发工作流;OpenAI的Operator、Computer Use关注任务执行;Google则不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正围绕一个新的竞争维度展开:Workflow和Productivity(生产力)。
04. 资本为何关注这种转变?
资本市场真正关注的,并非技术领先本身,而是技术如何转化为持续的收入。模型能力可以构建技术壁垒,但“工作流”更容易构建商业壁垒。一旦工作流深度嵌入企业,就意味着数据沉淀、流程绑定、员工习惯形成以及系统集成。这些因素共同作用,能够带来更高的续费率、更强的客户粘性以及更稳定的商业模式。
因此,越来越多的AI公司开始将产品叙事从“模型能力”转向“工作能力”。这并非放弃对模型的投入,而是在探索模型之外更长期的价值来源。从更宏观的视角看,M3最值得关注之处并非某个具体的Benchmark,而是MiniMax对其未来竞争对手的重新定义:从其他模型公司,转变为企业工作入口、浏览器、IDE、Office、ERP、CRM等平台。企业的数据不会沉淀在一次次的对话中,而是最终沉淀在日常的工作流里。谁能更深入地融入企业工作流,谁就拥有更坚实的商业基础。从这个意义上说,MiniMax未来的竞争对手,不只是OpenAI或Anthropic,更是所有定义企业工作方式的软件平台。
尾声:一家AI公司价值重构的开端
如果说过去的大模型竞争是以“智能”为核心,那么MiniMax M3所展示的,则是一种不同的竞争逻辑。模型依然重要,但它正从“产品”转变为“基础设施”。真正站到台前的,是模型如何进入企业、连接软件、完成工作。对于MiniMax而言,这可能比一次Benchmark的排名更具战略意义。因为它标志着公司开始尝试回答一个新问题:当模型能力逐渐趋同,一家AI公司还能依靠什么建立长期价值?M3给出的答案,不是更多的参数或排行榜上的名次,而是更多真实的工作场景。这或许也是AI行业进入下一阶段最重要的信号。未来,决定一家AI公司价值的,将不仅仅是模型有多么聪明,更是它能够帮助企业重组多少生产力。

用户评论