套壳争议下的AI“智能体”

作者: 郑雪

套壳争议下的AI“智能体”0

假如你是一名小游戏研发者,想要研发制作一款休闲类小游戏,如何在短时间内完成?

当你向AI提出这个问题,AI会告诉你,它无法直接做出可以实际操作的游戏,但可以提供一段代码,你可以在此基础上完善、开发,最终写出属于自己的小游戏。

但如果你是向AI智能体(Agent)提出这个问题,只需坐等游戏完成,智能体会直接生成小游戏链接,让你试玩。

AI智能体并不是一个新概念。今年上半年,被称为“全球首款通用AI Agent”的Manus大火,让AI智能体进入公众视野,但也面临着“套壳”“技术缝合”“过度营销”等争议。

随着时间的推移,智能体热度不减,多个大厂都推出了相应产品,并将其看作AI发展的下一必争方向。那么,AI智能体是啥?萦绕背后的技术缝合争议如何理解?智能体时代是否能够快速到来?

AI智能体是个啥

AI智能体并不是一个新事物。2023年,斯坦福大学和谷歌的联合研究团队,发表了一篇题为《生成式智能体:人类行为的交互式模拟》的研究论文。

论文称,居住在虚拟小镇Smallville的25个虚拟人在接入ChatGPT之后,表现出各种类似人类的行为,由此带火了智能体概念。

知道创宇首席安全官周景平告诉记者,可以将AI 智能体看作一种不仅会“动脑思考”,还能“动手干活”的AI助手。他所在的企业也推出了自己的智能体产品,相关产品通过大模型API调用以实现通用任务理解、规划、执行。

“过去的大模型像是一个超强大脑,只能告诉你答案。而智能体不光会想,还能干活,它会自己规划步骤、写代码、调用工具,最后给你输出文档。”周景平说。

比如,用户上传10份简历压缩包,Manus会自主解压文件、分析候选人资质、生成Excel排名表,甚至附上评估标准。对于有些AI大模型来说,却不一定能支持解压文件夹。

如果用一个公式来表示,参考OpenAI Safety团队前负责人Lilian Weng的表述,智能体= LLM(Large Language Model,大语言模型,即大脑)+记忆(确保前后目标一致)+任务规划(任务拆解和检查)+工具使用(执行行动)。

智能体装在哪里?目前可以通过网页或者手机进行体验,和日常打开网站、使用APP的体验没有区别。

不少企业纷纷推出了自己的智能体。国外,OpenAI推出智能体Operator,自称能网购、会订票,甚至会做表情包。

国内,不少AI企业也推出了智能体。智谱Agent 产品 AutoGLM沉思能在进行复杂思考的同时进行操作。字节的扣子空间、百度的通用智能体产品“心响”APP等相继推出。阿里则选择和Manus合作,通义千问将为Manus提供坚实的底层模型支撑。

套壳还是创新

智能体热潮之下,“套壳”争议不断。关于套壳,可以理解为相关产品并不掌握核心技术,而是在技术基础上进行表面改造或包装。

拿做菜举例,菜谱是别人的,套壳可以看作只换了菜名。如上述提及的Manus并不避讳套壳,其产品底层模型采用Claude和Qwen,然后接入实用工具。

AI行业中存在“套壳”鄙视链,Manus也因此引起了相关争议。套壳背后,大家在意的是,这类产品究竟是不是真正的创新,以及企业护城河要如何构建。

值得关注的是,Manus爆火后,多个团队成功复刻Manus并开源,有的甚至只花了3个小时。

关于“套壳”,观点不一。

Manus创始人兼CEO肖弘表示,“套壳”可以视为一种整合和优化资源的方式,只要能够满足用户需求,提供良好的用户体验,那么“套壳”就是一种成功的产品策略。

OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)表示,就像当年被嘲笑为“云服务套壳”的创业公司一样,关键在于能否创造独特的用户价值。

MiniMax副总裁刘华则表示,底层模型一次重大迭代对产品带来的优化效果,远超在工程实现层面对产品进行“雕花”。

周景平认为,目前大模型只有大脑、没有手脚,或者手脚被束缚了。要发挥大模型能力就需要解放大模型,真正实现“干活”,纠结“套壳”问题没有太多意义。

AI智能体落地还有多远

智能体被不少人看作通往AGI (通用人工智能)的必经之路。

OpenAI列出实现通用人工智能的五级路线图:L1是聊天机器人;L2是推理者,即像人类一样能够解决问题的AI,如OpenAI近期推出了OpenAI o1大模型;L3即智能体,不仅能思考,还可采取行动;L4是创新者,协助发明创造;L5是组织者,完成组织工作。

多方看好2025年将成为智能体落地元年。

国际数据公司(IDC)今年4月发布《中国AI Agent应用市场概览》,其中显示2025年,AI Agent将迎来规模化落地浪潮,其通过智能化任务处理重构标准化作业流程的潜力备受期待。随着技术迭代与行业渗透加深,建立AI Agent标准化体系已成为产业共识。

周景平亦赞同上述观点,在他看来,当前的Agent靠拼接工具、制定各种调用协议来让AI显得“像会干活”;未来的Agent则将持续进化,AI可以直接写代码、获取反馈,在现实世界里真正“做事情”。

责编:郭霁瑶  guojiyao@ceweekly.cn

美编:孙珍兰

经典小说推荐

杂志订阅