Manus:通用AI agent来了吗?
作者: 王俊煜
3月中旬的一个周五中午,我溜进了花园路附近的一个共享办公空间。在一堆麦当劳、真功夫和霸王茶姬的外卖的包围中,我找到了Manus的几位核心团队成员。
彼时M a nu s发布刚满一周,中文世界中对它的各种负面舆论仍在发酵—从“ 搞营销”“买量铺软文”“套壳”“没有技术难度”,到更离谱的“团队准备发币跑路”。我对Manus后面的团队比较熟悉,其中有我认识近20年、共事过的老朋友,他们确实不是什么营销大师—要是靠花钱“买量”就能制造这样的声量,财大气粗的巨头们早就高枕无忧了。
这些声音看起来对团队毫无影响,开放办公空间里熙熙攘攘,团队成员三五成群讨论工作,不时还传来英文交谈声。这让我想起很多年前移动互联网创业的场景:热闹、骚动,空气中弥漫着身处浪潮之巅的兴奋感。
虽然是老朋友,但还是让我们客观地介绍Manus。
A I 最缺少的是眼睛和手脚,M a n u s自称“全球首个通用A I agent”,“agent”这个词已经出现两年了,有很多产品都管自己叫“agent”,其中不乏滥竽充数者。在我看来,“agent”的核心含义是替你跑腿、办事,它的重点显然是“手脚”。当今LLM完成的大部分工作都可以被归纳为信息获取和信息处理,而agent之所以令人兴奋,在于我们期待它能让AI进化到执行动作。
要理解M a nu s,不妨先倒一下带。我在2025年1月的专栏中讨论了“AI程序员”,重点介绍了Devin。Devin于2024年12月正式发布,这在AI纪元中已是上古时期。在那篇专栏的结尾,我建议非工程师也去试试,因为你会发现日常生活和工作中可以用“写程序”来完成的工作远比想象的多。和我一纸之隔的KevinRoose专栏,在2025年4月也表达了类似观点。
我常常这样劝人,但真正能付诸行动的人寥寥无几。第一道门槛是每月500美元的最低消费,Devin也知道这太贵了,4月初刚则宣布推出免订阅的按需使用模式,用户只需一次性预付20美元即可开始使用。据估算,在调整前,全世界真正使用过Devin的只有几千人,其中的非工程师可能更是屈指可数。如果有哪位非工程师在上次读了我的专栏后真的去试用了Devin,他就已经成了这极少数人之一,而那些经常抛头露面的KOL、CEO、投资人……他们大多数都没有用过。
还有学习门槛。使用Devin的全过程中你实际上可以一行代码都不写,但这款产品毕竟是针对工程师设计的。今年2月初,AndrejKarpathy提出了“vibe coding”这个略带戏谑的概念(上期的Kevin Roose专栏也提到过)。此处的“vibe”我认为可以翻译成“放飞”“摆烂”“无脑”等,所谓vibe coding,其要诀是在使用AI辅助编程时,对AI写的所有代码看也不看即全盘接受,对AI想执行的命令亦全部无脑同意,遇到错误就把错误信息一股脑复制粘贴给AI。人类在这个“无脑编程”的过程中,真的只是一个负责复制粘贴的“机械臂”而已。
事实上,这个概念提出之前,很多人就是这么使用AI编程的,尤其是在做一些“业余项目”时,我也是如此。既然用户可以完全不关心编程过程,那为什么还要让用户看到代码呢?
这就是Ma nus:它将A I编程带给非技术背景的普通人,是一个让非工程师可以毫无压力开箱即用的产品。如果说Devin是你招聘的一名远程软件工程师,那Manus就是你招了一名远程实习生来做个人助理。从能力来说,Manus其实也是位程序员,但它尽量去除了“程序员感”,你不需要用程序员的方式和它沟通—“写程序”只是它完成任务的手段之一,而非目的。
和Devin一样,Manus也自带电脑上班。别看这台破破的电脑只能用来写程序和用浏览器上网(听起来像ChromeOS),有了这两个功能,理论上就能完成大部分的工作。特别是能使用浏览器,这是Manus带给许多人的最初震撼—电脑竟然自己在操作自己:打开网站、浏览、点击、输入、填表……这应该也是Manus刚发布时第一批报道和测评提到的“炸裂感”的来源,而它的任务回放功能,更方便人们把这种震撼传递给朋友。
许多在一开始“黑”Manus的人,可能当时确实没有机会用过。
除此之外,Manus将“任务规划”做得更显性,就像DeepSeek将推理过程可视化一样,让你看到它是如何规划任务和一步步执行的,在遇到困难时又是如何调整的,这也增加了你对它的信任。
这些都是Ma nus敢声称自己是“通用A Iagent”的基础。Manus发布时,有些人说它“无技术含量”“套壳”、自己“随随便便就能做出来”,但一个半月过去,我还没有看到市场上出现第二个完全满足上述要求的产品。
当你有了这样一个远程个人助理,它能为你做点什么呢?这方面,Manus面临的挑战比Devin更大。正如我在1月专栏中分析的,软件工程师的工作大多确实可以在电脑上远程完成,但“个人助理”如果要真正帮助我处理生活和工作中的各种任务,它得拿着我的手机。即使是在电脑上,也需要登录我的各种账号,或者使用我保存在电脑中的文件。这些条件Manus暂时都达不到。
这就过滤掉了生活和工作中的大部分任务。无论是官方案例还是我观察到的其他用户分享的案例,大多是帮用户找东西、查信息的研究型任务,仍然在信息获取和处理范畴内,“手脚”体现得不太明显。不过话说回来,由于Manus可以写程序、用浏览器,还有规划能力,让它去研究一个东西,效果不比各式“Deep Research”差。有趣的是,Manus能为每个研究结果自动生成图文并茂、带有互动功能的网页,这一下子就在感官上拉开差距了—我最近看到有些人开始用它来“吃瓜”,为社交网络上的争议事件生成“专题页”,这也是不错的体验。
但我还是更关心它能否当我的“手脚”,因此会尽量给它分配适合的工作。印象最深刻的一次,是我让它去YC官网整理最新一批项目中的所有AI产品,并尽可能注册。Manus找到了27家目标公司,尝试注册了其中12家,成功了6家。尽管有显著遗漏(YC孵化的最新一批有200多家公司,不可能只有27家做AI),第二天早上打开Gmail,看到各种注册确认邮件时,我仍然大为震撼。
目前,在调用模型的成本压力下,Manus已开始收费,普通任务折算下来大约需要数美元。在现阶段,用它来生成各种充满创意的网页,可能是性价比更高、用户更愿意付费的场景。
总的来说,作为面向非工程师的AI agent,Ma nus已经初具雏形。但由于能力边界不明确、现阶段的各种限制、成本较高等,目前它还难以稳定完成日常任务。虽然尚不适合普通用户日常使用,但对AI爱好者而言它仍是个值得探索的平台,可以尝试将部分生活和工作任务交给它处理。
读到这里,你可能会想,这个专栏又介绍了一个不成熟的AI产品,一点也不“实用”。我也顺便谈谈自己这方面的想法。今天的A I应用,按“创新扩散曲线”,在国内刚进入earlyadopter阶段。用我们熟悉的智能手机来类比,大概相当于20 08年:那时iPhone发售刚满一年,第一台Android手机HTC G1也才刚发布。直到2010年iPhone 4发布,智能手机才开始迈入主流,我也在那时候创办了豌豆荚。
这个专栏正是写给early adopter的。他们希望快人半步(不需要一步),愿意承担一些使用不成熟的新产品的风险,也愿意牺牲一些短期的便利去探索新的可能性。但他们不是发烧友,仍然是追求实用价值的(因此我们也不讨论纯概念)。当“iPhone 4”来临时,他们就是身边人眼中“懂AI”的那个人。
所以,如果你是其中一员,我很希望能在这个专栏中和你一起探索:这些新工具能不能带来新思路?能不能从未来“窃取”一些不一样的可能性,放到今天的工作和生活中?别指望它们一夜之间替你完成所有工作,它们不会立即让我们的工作效率翻倍,但也别低估它们带来的新的可能性:如果我有了成百上千个能帮我动手的AI助理,我的工作和生活会发生什么变化?有哪些过去想都不敢想的事情,现在可以尝试去做了?

王俊煜
2010年起先后创办了豌豆荚、轻芒等。现在,一边做阅读产品“阅览室”,一边探索如何让AI在普通人的生活工作中发挥更大作用。