「Agent代理人」将是AI竞赛新的破局者?
号称“全球首款真正意义上的通用AI Agent”的国产产品Manus风头十足,刷屏海内外社媒。Manus的名字来源于拉丁语Mens et Manus,意为“mind and hand”,即手脑并用,这也是麻省理工学院的校训。
值得注意的是,Manus在权威的GAIA(General AI Assistants,通用AI助手)基准测试中创下了新纪录,全部难度级别中的评分都超越了OpenAI的DeepResearch。Manus的出现标志着人机协作进入了一个新的范式,它可能是通向通用人工智能(AGI)的一个重要窗口。由于产品处于内测阶段,仅以邀请码形式开放使用,Manus急剧进入一个供不应求的状态。
经过2023年的百模大战,2024年的应用之争,行业淘汰赛加剧,2025年对于初创企业而言,落地路线的选择至关重要。Manus不仅仅是一个只会聊天的对话式AI工具,它是一个多模型、多智能体产品,拥有“独立思考”能力,能够对复杂的通用任务进行多步骤拆解并执行。只需要告诉它最终目标,Manus就可以灵活调用各类工具,自主执行浏览网页、操作网页应用、编写并执行代码等操作来实现。
「Agent代理人」有多强?
业内常规产品中,通行的逻辑是在平台内整合全球供应链企业信息,来帮助用户完成供货商/需求方匹配这件事。但在Manus的案例中,你能看到完全不同的实现方式。Manus与传统AI助手最大的不同在于自主规划与执行能力,从“被动响应”向“主动执行”的跨越,其核心架构通过多模型协作将复杂任务拆解为子目标,并调用外部工具逐步完成。例如,用户只需输入“分析特斯拉股票并制作PPT”,Manus会自动完成数据搜集、分析、图表生成及PPT排版,全程无需人工干预。类似任务如简历筛选、房产推荐等,Manus均能通过虚拟机技术分解步骤,模拟人类工作流。
打开Manus界面,有四部分构成,分别是浏览器、搜索、编辑器和终端,是把各类功能组合封装好的一款产品。具体来看,第一步跟ChatGPT一样有对话界面,用户需要提出具体的诉求,之后操作界面被划分为了两部分,左面是对话界面,右面是终端。当开始执行任务后,左面开始识别意图、制定执行步骤以及开始搜索、调用所需的各类工具,右面的终端相当于一个虚拟机,可以同步执行文件处理、代码生成、搜索浏览器等工作。
里面有一个小插曲,据说,Manus团队一开始的方向是AI浏览器。在偶然看到Arc被放弃后,他们才决定了终止AI浏览器的研发工作。现在在使用过程中,也能看到浏览器的痕迹。
Manus目前采用「Multiple Agent」架构,运行在独立的虚拟机中。通过规划型Agent负责任务拆解、执行型Agent调用具体工具、监控验证Agent跟踪任务进度和debug等多层代理分工协作机制,来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。此外,Manus还具备记忆能力,能够在执行类似任务时不断优化和提升自己的工作效率:例如若用户习惯以Excel接收结果,后续任务会自动优先生成表格。整个过程在云端异步完成,这意味着用户可以随时关闭电脑,等待结果生产。
在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过API或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务。专用RL小模型负责系统中最关键的决策环节:意图识别、任务规划和工具调用。整个工作流程设计以一份todo.md文件为核心,它兼顾记忆和指挥,解决了AI Agent长期面临的上下文管理难题,并且能够保持执行反馈与todo.md之间的动态联系。
使用Manus过程中,用户能感受到的体验感更多是跨App操作能力及其可视化过程带来的,而输出结果的可用性完全有赖于基础模型的能力。最近几个月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,一定程度上提升了路径规划能力、深度研究能力和代码写作的准确率,为更具生产力的agent提供了可能。
Manus的火爆加速了开源社区的创新进程,MetaGPT等团队迅速推出OpenManus、OWL等开源项目,通过复现核心架构推动Agent技术普惠化。开源社区的活跃表明,行业竞争壁垒正从单一模型性能转向工程化能力,包括工具链封装效率、场景适配性及用户体验优化。不过,实际应用仍需解决模型幻觉、响应速度等体验问题,这将是下一阶段技术演进的重点。
Manus存在的争议
在Manus的解释理虚拟机中的计算机应用并不多,主要体现在模拟用户点击、浏览和切换工具使用,意义不是十分大。因此Zengyi Qin(MIT博士)认为它在本质上还是一个预先设定的“workflow”,在无边界操作系统级环境(open-ended OS Level environment)中并未取得突破。官网上介绍的智能研究、高级数据分析、任务自动化三大功能其实也就是Manus的极限了。
Manus真正的杀手锏是它模拟人类方式工作方式的能力,它并没有做到哪些人类当前真正无法做到的事,这也就是为什么一些已经体验过的用户,形容Manus为“一个实习生”。而Manus团队本身并不自研大模型,而是基于业内大模型开发“套壳”产品,这也是Manus被不少AI业内人士认为不具备“护城河”、以及在技术层面并没有太多新东西的原因之一。
需要指出的是,根据参加过沟通会的行业人士表述,Manus并不讳言自己是一个“套壳”产品,其价值在于工程化创新 —— 通过逆向工程实现任务拆解逻辑的标准化,降低开发门槛,为行业提供了可复用的技术框架。这种将底层模型与工具调用深度集成的模式,或将成为Agent产品的通用范式。
一场产品经理式的成功
在Manus获得如此热度之后,就如同好奇DeepSeek团队成员一样,外界也开始关心这家应用层公司团队的来历。Manus团队主要成员包括创始人肖弘、产品合伙人张涛和首席科学家季逸超。其中,张涛曾在字节跳动负责国际化产品,随后在光年之外担任产品负责人,与肖弘、季逸超共同成立Manus AI并担任合伙人后,目前负责产品战略、市场沟通及用户体验优化,主导构建了Manus的多代理架构设计,提出“用户体验应从答案交付转向成果交付”的产品理念。
一个很明确的事实是,Manus诞生的必要前提是基座模型的性能提升,但这是过去两年来整个行业有目共睹的趋势,为什么率先让Agent获得注意力的会是Manus?从传播路径上来看,Manus与DeepSeek-R1一样,爆火是因为成功打出了用户体验上的低门槛和时间差。DeepResearch只有200美元/月的ChatGPT Pro用户才能够使用,因而Manus更容易在体验上形成冲击。
这是一场产品经理式的成功,考验的是产品设计能力和产品实现技能。这种能力,是Manus团队所擅长的,也是曾被市场所低估的。
Manus控股公司蝴蝶效应(Butterfly Effect Hong kong)成立于2023年,境内企业名为北京红色蝴蝶科技有限公司,还在武汉设有分公司。在Manus之前,主要有两款产品:2023年初推出号称All-in-One的AI助手浏览器插件Monica,接入了ChatGPT等工具的API,可为用户提供搜索、阅读、写作、翻译、创作等多种任务的协助,截至2024年年底,主打海外市场的Monica已经拥有了超过1000万的用户;另一款则是2023年收购而来的另一款插件ChatGPT for Google。
现在的Manus距离正式版想交付给大家的体验还差很远,像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间。未来,Manus或将基于AHPU(Agentic Hours Per User)这一新指标打造出独属于AI的商业模式,即衡量用户委托AI完成任务的时间效率,目标是通过并行任务提升生产力,否则很难完成规模化。目前,Manus通过KV cache优化、推理时延压缩、执行流程精简等手段,实现了单次任务消耗控制在两美元左右的成本。但是,单次任务的成本可能只是一个平均数或中位数,许多动辄两小时的任务生成,其消耗成本应该不止于此。
AI的下一个关键阶段
2025年是AI Agent爆发的元年已经成为行业共识。根据麦肯锡等多份权威报告,在多元化需求驱动下,AI Agent市场呈爆发式增长态势,2024年全球AI Agent市场规模约为51亿美元,预计2030年将飙升至471亿美元,复合年增长率高达44.8%。
与GPT等对话式AI不同,AI Agent能像人类助手般独立规划任务、调用工具并交付成果。如果说大模型让AI长出了“脑”,那AI Agent就是让AI长出了“手和脚”。借用OpenAI前应用研究主管Lilian Weng的经典定义,一个合格的Agent需要三大核心能力:Planning(规划)、Tool use(工具使用)、Memory(记忆)。
AI Agent的热潮并非偶然,而是技术演进的必然产物。早在2024年红杉AI峰会上,吴恩达教授便预言“AI Agent是AI发展的下一个关键阶段”。实际上,市场对AI Agent更早的感知来自于OpenAI和Anthropic。
· 2024年10月,由OpenAI前研究副总裁达里奥·阿莫迪、大语言模型GPT-3论文的第一作者汤姆·布朗等人共同创立的企业Anthropic,推出了基于Claude模型的扩展功能Computer Use,用户能够像指挥人类一样指导Claude操作电脑,包括移动光标、点击按钮和输入文本。在国内,智谱是最早探索Agent的初创企业,同期推出自主智能体AutoGLM。
· 2025年1月,OpenAI推出基于Computer-Using Agent模型的了首款AI智能体Operator,可以根据用户指令,在云端执行任务,如订餐、制定计划、购物等。具体来说,CUA将GPT-4o的视觉能力与强化学习的高级推理能力相结合,经过训练可以与图形用户界面(GUI)交互,就像人类使用鼠标和键盘操作一样。如果遇到问题,Operator可以利用其推理能力自我纠正,遇到故障卡顿、需要帮助时,它会将控制权还给用户,就像自动驾驶一样。
可以预判的是,AI Agent是大模型公司不会错过的产品方向,凭借算力、数据等优势,大厂基本都是在模型端、应用端、智能体开发平台协同三个领域闭环发展,倾向于以MaaS(模型即服务)形式将Agent嵌入现有应用生态。大厂们的思路在于,利用AI智能体赋能业务,完善AI应用生态,提高业务及自身在AI时代的竞争力。垂类企业则聚焦行业Know-how,开发场景化解决方案:例如,工业软件厂商可基于Agent优化生产流程,而网络安全企业可增强威胁响应能力。
大厂现在几乎人手一个AI应用,有自研大模型,同时接入了DeepSeek-R1推理模型,RAG、联网搜索更是现成的,原地改造或者再造一个Manus几乎不是问题。而AI初创企业布局智能体的思路在于,推出更多可场景化的落地方案,寻找商业变现的路径。随着技术的不断发展和市场的逐渐成熟,AI Agent领域的竞争将愈发激烈,各企业的产品也将不断迭代升级,以满足用户日益增长的需求。
进入2025年,从Operator到Manus,从大厂到独角兽的竞相加速,一场围绕AI Agent的竞逐赛悄然拉开帷幕。就像比尔·盖茨曾说的,“谁能主宰AI Agent,那才是大事,因为你将永远不用去搜索网站或者亚马逊”。Manus的爆火出圈,反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,抛开“套壳”带来的争议,当智能体的价值被更多人看到,智能体时代有望加速到来。

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码