过去,人工智能行业的核心竞争焦点在于“谁拥有最智能的模型”。模型参数、推理能力和基准测试排名几乎是所有AI公司发布会上的全部内容。OpenAI、Anthropic、智谱、MiniMax、月之暗面等公司,都采用了高度一致的宣传方式,即“模型越智能,公司价值越高”,这是第一代大模型公司的普遍叙事。
然而,这种叙事正在发生转变。以MiniMax M3的发布为例,其最引人注目的内容不再仅仅是模型的能力,而是BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等一系列新的能力展示。
这些新能力的共同特点是,它们不再关注模型“知道什么”,而是模型“能够完成什么”。许多人将这种变化解读为“Agent”的出现,但若将时间线拉长来看,M3更值得关注的是MiniMax对其自身价值的重新定义。公司开始尝试回答一个行业过去较少认真探讨的问题:“一家AI公司真正销售的究竟是什么?”
第一代AI公司,销售的是“智能”
过去几年,竞争逻辑十分简单:模型能力即产品,基准测试即价值。MMLU、GSM8K、HumanEval、LiveCodeBench等基准测试,不仅是技术评估,更是市场认可的价值衡量标准。正如CPU有SPEC,GPU有MLPerf,数据库有TPC一样,成熟的产业需要统一的标准来理解产品价值、评估采购决策,并帮助资本形成共识。因此,参数规模和排行榜位置成为市场理解AI公司的最直接方式。在此阶段,模型本身就是商品。
MiniMax M3发布中一个容易被忽视的方面是,MiniMax投入了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等基准测试,几乎都不关心模型是否能回答问题,而是考察模型能否修复真实Bug、独立完成网页操作、调用开发环境、连接企业系统,以及完成一项完整的工作。
换言之,基准测试的评价对象发生了变化。过去评价的是“智能”(Intelligence),现在评价的是“任务完成度”(Task Completion)。模型首次被置于“岗位考核”而非“知识考试”的场景下。这不仅是评测体系的革新,更是MiniMax向市场传递的信号:模型能力依然重要,但真正决定商业价值的将是工作能力。
MiniMax为何开始强调“工作”?
过去,大模型的主要客户是开发者,他们购买的是模型能力,关注的是模型是否更智能、能否解决更复杂的问题。但企业客户不同,企业在采购AI时,很少关心模型在排行榜上的位置。企业真正关心的是:AI能帮助业务完成多少工作?能节省多少人力?能融入多少流程?能提升多少效率?
因此,产品表达也随之改变。Browser不再仅仅是浏览器能力,而是融入办公流程;Coding不再是简单的代码生成,而是进入研发流程;Terminal不再是基础的Linux操作,而是进入开发环境;MCP也不再是简单的协议,而是整合进企业现有的软件系统。将这些能力整合来看,MiniMax希望展示的不是一个模型,而是一套工作流能力。
从Token到Workflow
许多人仍将AI公司视为API公司,收入依赖于Token消耗。调用次数越多,收入越高,这是第一代AI商业模式。然而,一个新的趋势正在显现:越来越多的企业购买AI,并非为了获得更多回答,而是为了完成更多工作。修复一个Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作,价值单位正在发生变化。过去,一次调用对应一个Answer;今天,一次调用越来越对应一项Task。
MiniMax M3的产品设计也越来越围绕这一逻辑展开。模型成为基础,Workflow成为产品。将M3置于行业视角下,它代表了一种新的产品叙事。越来越多的AI公司开始证明其工作能力,这一趋势并非MiniMax独有。Claude Code强调开发工作流;OpenAI的Operator、Computer Use关注任务执行;Google不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正在围绕一个新的竞争维度展开:Workflow和Productivity。
为何这种变化值得资本关注?
资本市场关心的始终是技术如何转化为持续收入,而非技术领先本身。模型能力可以建立技术壁垒,但Workflow更容易建立商业壁垒。一旦工作流被企业采用,就意味着数据沉淀、流程绑定、员工习惯形成以及系统集成。这些都将带来更高的续费率、更强的客户黏性以及更稳定的商业模式。因此,越来越多的AI公司开始将产品叙事从模型能力转向工作能力。这并非放弃模型,而是在模型之外寻求更长期的价值来源。
从更宏观的视角看,M3最值得关注的并非某项基准测试,而是MiniMax对未来竞争对手的重新定义:从其他模型公司,转变为企业工作入口、浏览器、IDE、Office、ERP、CRM等。企业数据不会沉淀在一次聊天中,而是最终沉淀在日常工作流中。谁能进入更多工作流,谁就拥有更强的商业基础。从这个意义上说,MiniMax未来的竞争对手,不仅是OpenAI或Anthropic,更是所有定义企业工作方式的软件平台。
尾声:一家AI公司价值重构的开始
如果说过去的大模型竞争围绕“智能”展开,那么MiniMax M3所展示的则是另一种竞争逻辑。模型依然重要,但正从产品转变为基础设施。真正走到台前的是模型如何进入企业、连接软件、完成工作。对MiniMax而言,这或许比一次基准测试排名更为重要,因为它意味着公司开始尝试回答一个新问题:当模型能力逐渐趋同,一家AI公司还能依靠什么建立长期价值?
M3给出的答案不是更多参数或排行榜,而是更多真实的工作。这或许也是AI行业进入下一阶段最重要的信号。未来,决定一家AI公司价值的,不仅是模型有多聪明,而是它能帮助企业重新组织多少生产力。

玩家互动社区