AI智能体,为什么看不懂?

作者: 吴俊宇 周源 黄思韵

AI智能体,为什么看不懂?0

Agent(智能体)到底是什么?简单说,它就是下一代AI应用。

它与目前人们每一步都需要自己操作的电脑、手机应用有本质区别——正如Agent被直译为“代理人”,它是一个能帮助人类,自主运用AI规划任务并执行的软件系统。

今年3月,猎豹移动董事长兼CEO(首席执行官)、猎户星空董事长傅盛在接受《财经》采访时曾提到,如果按照自动驾驶L1-L5的标准去衡量,目前大部分Agent都处于L1-L2的阶段。有朝一日进入L5阶段,人们可以晚上睡前给Agent安排写文档、查资料、制作PPT、购买机票等工作。一觉醒来之后就查收工作成果。

哪些应用可以算是Agent?目前没有统一标准。大模型App(应用)里的聊天助手、多任务AI应用都“一箩筐”被称作Agent。但前者功能太简陋,后者执行复杂任务总烂尾。

很多人使用这些产品时总是一头雾水——难道这些就是Agent?

2025年,AI(人工智能)落地过程中,Agent正处于一个让人“看不懂”的尴尬时期:一方面,它被认为是下一代革命性的应用,会颠覆所有;另一方面,它具体是什么样的,具体会如何颠覆一切,威力有多大,绝大多数人一无所知。

这组矛盾并不妨碍国际IT咨询机构Gartner把Agentic AI(代理式AI,即本文主角AI智能体)列为“2025年十大战略技术趋势”。

Gartner预测,到2028年,33%的企业软件将包含Agent,2024年该比例不到1%;到2028年,15%的日常工作将由Agent自主完成,2024年该比例接近0%。

Agent同样在让从业者重新思考软件的定价模式。传统的订阅付费,似乎可能转向按结果付费。一些创业者正在彻底拥抱新的定价模式。但另一部分从业者担忧,这可能让软件公司彻底丧失定价主导权。

产品形态不明确,定价模式不清晰,这并不妨碍Agent狂潮来袭。这些困惑,反而是理解这个新事物的最佳切片。

看不懂、不成熟?

Agent的不成熟可以从Single-Agent(单智能体)、Muti-Agent(多智能体)两种产品说起。

Single-Agent应用,很多时候约等于大模型对话机器人或AI助手。比如,字节跳动旗下的豆包App中,英语陪聊机器人、写作助手被统称为Agent。用户问,模型答,这种简单的交互模式,很难被看作是会“自主决策”的Agent。

Muti-Agent应用,最典型的是AI创业公司“蝴蝶效应”2025年2月推出的Manus。它号称是“世界首款通用Agent”。在演示资料中,Manus可以独立思考、计划并执行复杂任务。然而,一些用户注册使用后发现,它无法有效执行很多复杂任务。

由于产品不成熟,Manus网页访问量一直在下滑。国际流量分析平台SimilarWeb数据显示,2025年3月Manus访问量高达2310万,4月下滑到1784万,5月下滑到1616万。

“拿Manus做一个贪吃蛇游戏,任务总是执行到一半出错,还无法手工调代码。更多专业代码工具可以更好完成这个任务。”傅盛今年3月对《财经》表示,Agent被过度包装了,Muti-Agent应用还不够成熟。但他同时承认,Agent是未来,它就是AI时代的App。

杜克大学电子与计算机工程系教授陈怡然的观点是,创业公司为了获取市场关注拿到下轮融资,先推不成熟产品是常规打法。OpenAI就是拿到融资后再打磨产品,并实现商业化。

Single-Agent更像AI助手,Muti-Agent却不够成熟。这个问题也困扰着很多企业。

IBM大中华区科技事业部数据与人工智能资深技术专家吴敏达在一次媒体采访中表示,不少企业客户困惑,很多Agent可能不是真正的Agent,只能看作是AI助手。他提到两者一个核心区别——Agent能“自主决策”,能调用API(应用程序接口)或者其他工具规划任务。AI助手虽然有AI能力,但是不能自主完成工作。

目前人们熟悉的大多数对话应用,离真正的“自主决策”还很远。吴敏达解释,AI助手推理过程简单、流程固定、消耗算力很少,速度也比Agent快,甚至更准确。但是Agent会主动调用更多AI助手或工具,和其他工具合作完成任务。这个过程会消耗更多算力,做好Agent的门槛会更高。

他同时认为,Agent和AI助手的定义不重要。AI助手始终会存在,而且AI助手未来在企业软件中的可能比Agent更高。解决企业真正的问题,保证任务准确率才是根本。企业也没必要追求通用型Agent,用一个通用Agent解决企业所有问题,这没有意义。

Agent的能力,是它背后的“大脑”——

大模型的能力决定的。Muti-Agent应用暂时不成熟,根本原因是目前大模型的准确率、逻辑推理能力,尤其是对复杂任务的理解和规划能力还不够高。一种判断是,这种局面会在2025年底得到很大程度的改善。

火山引擎智能算法负责人、火山方舟负责人吴迪今年5月曾对《财经》表示,未来12个月,大模型的能力还会不断提升,有三个提升方向。

其一,多模态(文本+图片+音频+视频)推理模型会成为主角,这是当下正在发生的变化。AI将可以把文本、图片、音频、视频等多种信息融合在一起进行综合推理。它将极大增强Agent对现实世界复杂信息的理解能力。

其二,视频生成模型将成熟可用,预计今年末将迎来一轮爆发。这意味着Agent不仅能理解世界,还能以更动态、更直观的方式生成内容和模拟过程。

其三,多步骤的复杂任务处理能力会大幅提升,预计今年末会有重大突破。这是Agent走向成熟的关键一步。当模型能够稳定、可靠地规划和执行包含数十步甚至上百步的复杂任务时,Agent“烂尾”的问题将从根本上被解决。

在吴迪看来,目前大部分Muti-Agent应用都“像是玩具”,但基于这三条技术主线的突破,他给出了最终判断——

Muti-Agent应用2025年末准确率将会大幅提升。届时,Agent应用会有一轮爆发。

Agent正在改变什么?

Agent看不懂、不成熟,这却不影响它正在成为大公司、创业者涌入的新兴赛道。它也的确带来了眼花缭乱的变化。

GPTDAO是美国硅谷的一个生成式AI社区,长期追踪各Agent网页流量变化趋势,定期发布AIwatch.ai数据分析榜单,它会针对AI To C(面向消费者的AI应用)类产品统计其用户规模、网页访问、融资规模。该社区近期的一份针对AI Agent的统计显示,中国市场、国际市场的AI Agent产品的网页访问量正在大幅增长。

字节跳动、百度都是目前最有热情投入Agent的重要中国玩家。字节跳动的扣子、百度的文心智能体平台半年内访问量均增长超过200%;另外,国际知名的AI Agent平台N8n、LangChain用户访问大幅增长的同时,还分别取得了新一轮融资。

表:硅谷生成式AI社区GPTDAO:AI Agent关键平台流量与融资情况概览(2024年10月-2025年3月)

AI智能体,为什么看不懂?1
注:1.硅谷生成式AI社区GPTDAO长期发布AIwatch.ai数据分析榜单;2.它会针对AI To C(面向消费者)类产品统计其用户规模、网页访问、融资规模
资料来源:硅谷生成式AI社区GPTDAO 制表:颜斌
AI智能体,为什么看不懂?2
一位算法工程师向《财经》演示如何用Cursor调用Claude Sonnet 4模型生成贪吃蛇游戏。
AI智能体,为什么看不懂?3
这款贪吃蛇游戏,画面虽然简陋,但是游戏规则均是AI制定的。

傅盛今年3月对《财经》表示,在这一波Manus爆火之前,硅谷的Agent创业就已经很热了。硅谷创业公司早就不卷模型了,都在卷Agent。他认为,Manus只是第一个产品,后面中国市场上会不断出现类似产品。

目前,面向普通消费者的Agent并不算成熟,但To B(面向企业)的Agent正在一些专业场景,显著提升企业的业务效率。

据陈怡然观察,美国大部分企业都在寻找AI提效的机会,开发“企业级专用Agent”蔚然成风,因为类似Manus这类通用Agent无法直接用在垂直行业。

为什么To B场景落地速度更快?核心因素是很多大型科技公司的IT基础设施很完善——一方面,很多企业内部已经做好了数据治理,Agent能够访问更多结构化的专业数据;另一方面,MCP(模型上下文协议,也可认为是AI应用接口)协议让Agent能和其他应用互动。它就像USB接口,让Agent用简单、标准化的形式去访问数据、使用其他工具。

AI编程就是一个典型的提效场景。软件工程领域,代码编写、调试、升级和维护一直耗时耗力,而AI编程类Agent,正在将这一过程的效率提升一个乃至数个量级。

百度文心快码高级经理彭云鹏甚至认为,“写代码是Agent当下落地最好的方向。”他介绍,把研发任务分配到Agent,把不同Agent协同,可以互相生成代码,并解决一些相对复杂的任务。前提是,确定好项目规范、研发规范、测试规范等研发规范,有了明确的规则后,AI生成代码就会遵从规范。

百度在6月23日的AI开放日上披露,百度内部由AI生成的代码所占比例逐年大幅提升。2022年这一数据仅为0.27%,2025年二季度这一数据超过43%。百度内部深度使用文心快码的工程师,代码提交量相较于不使用的工程师提升了近70%。

字节跳动技术副总裁洪定坤今年6月在一场发布会上透露,字节跳动内部,超过80%的工程师在使用自研的TRAE代码工具辅助开发,已有相当比例的代码是通过AI生成的。不仅是科技公司,AI编程在银行等传统行业渗透也很快。国内某大型商业银行开发中心的一位高级开发人员向《财经》透露,他所在的银行,现在有20%-30%的代码由AI生成。

一位医疗硬件创业公司的资深算法工程师认为,上述数据不夸张,目前他日常工作中,80%的代码都是AI生成的。他向《财经》演示,如何使用AI代码生成工具Cursor调用Claude Sonnet 4模型生成并修改一款网页游戏的全过程。在演示过程中,Cursor运行Agent仅用一分钟就生成了三个文件,并最终在网页上跑起了贪吃蛇游戏。

这款贪吃蛇游戏,画面虽然简单,但是游戏规则均是AI制定的,且只使用Single-Agent就完成了整个开发过程。在这个过程中,人没有手动介入修改过代码。

更复杂的代码项目,可以让Agent规划任务清单,将项目拆解成若干大任务,再把大任务拆解成小任务。最后按照任务清单稳扎稳打,一步步执行、测试。这种方式便于人类工程师掌控任务执行进度,而且出现问题时能及时干预,确保任务质量。

AI智能体,为什么看不懂?4
2024年8月21日,2024火山引擎AI创新巡展(上海站)期间,现场观众体验豆包大模型、扣子、猫箱。图/视觉中国

经典小说推荐

杂志订阅

友情链接