苹果如何定义下一代机器人?

作者: 吴一凡

苹果如何定义下一代机器人?0
苹果如何定义下一代机器人?1
3类家用机器人名单

2025年年初,苹果公司公开了一款台灯样式的桌面机器人原型。其机器学习团队在苹果官方网站上发布了一篇论文,罕见地在概念验证(Proof of Concept,POC)阶段展示了他们的产品设计理念。

这款桌面机器人的外形与皮克斯的经典小台灯相似,除了提供照明,它还能够根据环境自动调整灯光、充当投影仪、提醒用户喝水、向访客介绍房间、播放音乐等。但它的最特别之处在于会扭来扭去地表达情绪。比如,当无法完成任务时,它会伸长机械臂尝试数次,最终低头致歉,并摇头表示沮丧;被询问天气情况后,它会先转头看向窗外,并在说话的同时配合做出拟人化的肢体动作;它还会和人类伙伴一起在音乐中摇摆、舞动,看起来十分开心。

苹果将这款机器人的设计框架命名为针对非拟人化机器人的表意性与功能性动作设计(Expressive and Functional Movement Designfor Non-anthropomorphic Robot,ELEGNT)。他们认为,机器人不该只为了满足用户的功能需求,还应“优雅地”行动。

早期的家用机器人研发以功能需求为导向,最典型的例子是扫地机器人。随着AI技术的发展,机器人也开始尝试叠衣服、烹饪、冲咖啡等家务活。在这些场景里,完成任务、追求效率是机器人的基础使命,而苹果希望在此类产品的思考上更进一步:如何让机器人的动作既高效又富有情感?

一般来说,在机器人运动控制领域,主流的建模方法是马尔可夫决策过程(MarkovDecision Process, MDP)。整个过程像是让机器人玩一个回合制游戏,每一步都要根据当前情况决定如何行动,行动后会得到奖励或惩罚,然后进入下一个状态。对于机器人来说,它的目标就是通过不断学习,找到能让奖励最大化的策略。传统的机器人追求功能性的最大化,比如扫地机器人只会摸索出最高效的清洁路径,完全不管自己的动作看起来是否友好。

苹果的ELEGNT框架还引入了表达性。苹果的设计师们希望机器人兼具功能性和表达性,前者确保任务完成,后者则通过动作来传递意图、注意力、态度与情绪,这对既有的机器人动作设计提出了挑战。机器人需要在一个“知道何时展示情感、何时发挥功能、何时主动表达、何时最好只做被动反应”的多维矩阵中作出选择—这种选择对于不少人类来说都是难题。

苹果的研发人员从人类和动物的肢体语言中获得灵感,设计了一套动作语言,比如台灯机器人用“低头”表达沮丧,用“摇尾巴”表达开心,用“点头”“摇头”表达态度。动作的速度则可以反映情绪唤醒水平—快速、干脆的动作可能表示兴奋或恐惧,缓慢、流畅的动作则可能传达平静或悲伤。另外,他们还研究了如何通过管理空间距离来反映机器人和环境、周围人之间的关系。例如,机器人可以用灯光照亮一个物体,表示它的注意力所在,转换照亮的朝向则表示注意力的切换。

对于机器人的主动表达应该做到什么程度,苹果也在研究中得到了教训。完成初步设计后,苹果找了21位体验者来评估台灯的智能表现。许多体验者表示,这款台灯机器人让他们想到了小狗、孩子或是朋友,很活泼,并且具有幽默感。但是,也有不少人对它的一些主动行为表达了反感,理由是不喜欢自己的生活被机器人掌控,“要是我正沉浸在精彩的阅读中,我可不想被机器人的指令打断”,一位体验者说。

但其最大的创新思考在于,苹果认为机器人的动作无需在细节上模仿人类形态,就能被视作有目的性或富有表现力,因为人类很擅长解读抽象形状的运动。

人不人形并不重要

目前,家用机器人已经具有从圆形的扫地机器人到机器宠物,再到人形机器人的多种形态。苹果的相关研究团队将这些设计思路总结为三类:拟人化、动物化和类电器 化。

成立于2 0 1 4 年的挪威初创公司1 XTechnologies公司专注于人形机器人研发,其创始人伯恩特·伯尼奇(Bernt Bornich)曾在接受采访时表示,“也许我们会像《星球大战》一样,拥有不同类型的机器人执行各种任务,但人形机器人依然会占据很大一部分,因为它仍然是最通用的系统。”

苹果却跳出了此类思维框架。其设计思路体现了对用户需求的不同理解:人们想要的不一定是另一个“类人机器”,而是能无缝融入生活、提供情绪价值的智能伴侣。

资深苹果分析师郭明錤在社交平台X上曾发帖称,从供应链信息也可看出,苹果似乎并不太在意机器人是不是人形,而是更关心如何通过认知层面的相互理解来实现高效、自然的交互过程,强调机器人内在的智能和交互能力。这与乔布斯时代的“人文科技”理念一脉相承,也在一定程度上体现出苹果打算再次引领人机交互新模式的雄心。

但“非人形”也将苹果置于一个更艰难的选择中:这个机器人具体要设计成什么形态?

过往的相关研究表明,机器人的形态并非无关紧要。它会塑造用户的预期,并对人机互动过程中的自然沟通与沟通效率产生影响。比如,人形机器人因为“像人”,因此会给人“它是有生命的”的感觉,非人形机器人则依赖外观设计与动作的协同来传达这种类生命感。因此,如何确保机器人形态与用户预期、功能能力相匹配,成为设计环节的核心考量。苹果称自己研发台灯外形的初衷正是为了探索能启发未来研究的关键设计要 素。

在这个概念设计中,苹果选择了台灯外形。它的设计灵感主要来自皮克斯的经典动画短片《Luxo Jr.》(《顽皮跳跳灯》)—《Luxo Jr.》是美国著名动画师约翰·拉塞特(John Lasseter)为皮克斯制作的第一部短片,主角是两盏台灯—展示了简单的动作如何表达故事情节、人物关系和情感,与团队的设计初衷十分契合。设计团队认为,台灯形态能够综合美观、表现力和实用性等因素:台灯是一种常见的家用电器,并且能够融入一些微妙的拟人化元素,灯罩和灯臂可以让人联想到“头”和“脖子”,摄像头可以被视作机器人的“眼睛”,它还能够借助灯光传达“注意力”。

不过作为机器人,苹果这款产品在构造上当然更为复杂。它的灯臂是一个有着6个自由度(即可以调节角度的关节)的机械臂,其中除了集成扭矩感应器,还有触觉传感器。塑料灯罩中不仅装了LED灯,还装有激光投影仪和一个内置摄像头。并且,它还配备了一个外部摄像头和麦克风。

至于为什么最终敲定做桌面机器人,而不是落地式或者天花板式,苹果也经过了充分的讨论。如果做成落地式的,其优势在于能够覆盖更广的空间范围且具备移动潜力,但控制的复杂度较高,交互过程中可能会发生物理碰撞。天花板式台灯可最大程度地降低碰撞风险,但交互能力有限,因为它只能从顶部向下照射光线,而且运动往往会超出人的视线范围,导致其动作容易被用户忽 视。

来自机器人市场的挑战

把机器人设计成台灯形态并非苹果首创。以色列初创公司Intuition R obotics早在2017年就推出了ElliQ—一款专为老年人设计的陪伴型台灯机器人,会主动提醒老人吃药、和老人聊天、引导老人做认知训练小游戏等。ElliQ的底座是一个敦实的圆锥体,顶部是一个略微前倾的椭圆形灯罩,嵌有一块圆形显示屏。由于其定位是陪伴型机器人,且主要通过语音和用户互动,它和苹果的台灯机器人不同,后者在肢体上具有更多的动态和拟人性。

苹果如何定义下一代机器人?2
2024年5月21日,莫妮卡·佩雷斯在家中与ElliQ互动。这款由人工智能驱动的语音交互机器人伴侣,被作为纽约州政府缓解老年居民孤独问题计划的一部分。(摄影:LaurenLancaster)

大模型的出现很大程度上降低了机器人产品的开发成本。许多机器人创业公司都以陪伴、玩乐甚至是宠物等功能为设计方向,研发核心仍然是语言模型加上会动的硬件设备。例如,Living.AI公司开发的桌面宠物机器人Emo由一块方形屏幕和两只“脚”组成,它能够通过表情、声音和动作来表达情感:当用户抚摸它时,它会微笑;如果用户长时间没有和它互动,它可能会露出无聊或失望的表情;它还会在高兴时跳舞。

另一个典型例子是L O OI机器人,它由TangibleFuture(可触未来)设计开发,这是一家成立于2022年的中国初创企业。创始团队想让手机变成机器人,于是给手机安装了一个可移动的基座,并使用磁吸的方式将智能手机固定在上面。这个基座配备硅胶履带和传感器,能让手机在桌面上自主移动、避障。另外,集成了大模型的LOOI支持多轮情境化对话,可以在屏幕上显示表情。

值得一提的是,ElliQ最初上市时,采用的还是传统的规则驱动型AI对话系统,从在伦敦设计博物馆首次展出到2022年3月对外销售,用了近5年的时间。并且,早期版本的ElliQ与用户对话完全依赖预设脚本,对语境的理解有限。去年,ElliQ的3.0版本接入了大语言模型,迅速实现了从“程式化反应”到“情境化共情”的进化,它现在可以主动发起对话,分享新闻、讲笑话,甚至讨论宗教、生命的意义等复杂议题。

一位具身智能领域的业内人士告诉《第一财经》杂志,“这种套壳大模型的机器人,能够满足一部分好定义的需求,比如早教,有很多是针对小孩的。苹果强调用动作和空间交互来提供拟人化体验,能把这种设计思路做出来的企业还是少 数。”

晚来一步的苹果,面对的正是这一新兴市场。已有的桌面机器人大多类似:动作设计相对简单,主要集中在头部和身体的轻微移动上;定位都是情感陪伴、智能助手和娱乐互动三大功能领域;互动多以语音对话为主,搭配电子屏幕上的表情变化等多模态形式。它们的优势是能以较低的研发成本和时间向市场快速推出,并且能根据市场反馈完成产品迭 代。

从本质上来说,苹果台灯机器人面临的挑战还是技术创新需要更长的研发时间、成本和人才。要达到目前概念阶段所希望的肢体动态、情感与功能的合一,便不能只依赖已有的语言模型和硬件产品。而从消费者端来说,与前面提到的满足普通需求的机器人相比,未来苹果的台灯机器人可能还会面临消费者在性价比上的选 择。

寻找苹果生态系统的新核心

2024年2月,苹果耗时10年、投入超100亿美元的造车计划宣告失败。这一重大转折,让外界开始重新审视这家以硬件创新著称的技术巨头的发展路径。

10年前,技术行业存在着关于“后手机时代”的核心战场是什么的激烈讨论,争议焦点主要集中在“可穿戴设备”和“物联网平台”的优先级上,但苹果选择了全都要。就在宣布启动造车计划的同一年,苹果不仅发布了初代Apple Watch,还推出了HomeKit智能家居平台,打算通过认证第三方厂商设备,构建基于iOS的智能家居生态。2015年,苹果又从杜比实验室挖来技术负责人Mike Rockwell组建头显研发团队,次年Vision Pro项目正式立项。

目前,除了A p ple Wa t c h取得了成功,HomeKit和Vision Pro都没有实现预期的突破。智能手表市场整体也逐渐趋于饱和,根据研究机构Canalys和Strategy Analytics的数据,Apple Watch的全球销量在2022年突破50 0 0万块后,2023年和2024年下降至380 0万块和3900万块左右。如今,随着造车梦碎,库克将公司的战略重心转向了家用机器人领 域。

在苹果公布的2 02 5年Q1营收数据中,iPhone仍然是盈利的第一大组成,但它始终面临产品创新的压力,尤其是在和中国手机厂商的激烈竞争中。多年以来,它一直在寻求一个产品的创新,以振兴苹果生态链的不可替代性。

事实上,苹果的工业设计团队很长时间以来都在探索桌面机器人的概念,他们对这种设备的设定是智能家居的核心控制器,即通过Siri语音控制智能设备,实现设备间的协同工作。

经典小说推荐

杂志订阅