大型语言模型导致的错觉
作者: 阿马尔·比德通过自学成才从电报员成为企业家的托马斯·爱迪生,通常被认为是有史以来最伟大的发明家,而在移民美国之前曾在巴黎的爱迪生公司工作过的尼古拉·特斯拉,要不是马斯克的电动汽车公司,几乎没有人记得他。然则,正是特斯拉在交流电技术上的突破,而不是爱迪生的直流电技术,才使得大规模电气化成为可能。直流电的高昂成本,会让爱迪生的城市电气化技术像他的许多其他发明一样,成为富人的玩物。
与许多变革性技术一样,在OpenAI于2022年底发布ChatGPT引发狂热之前,人工智能已经发展了几十年。更好的算法、手机等辅助设备,以及更便宜、更强大的云计算,让这项技术的应用变得更加广泛,却几乎无人关注。
ChatGPT和其他大型语言模型的神奇魅力让人们产生了一种错觉,以为生成式人工智能是一项全新的突破。ChatGPT在发布五天内就拥有了100万用户,两年后每周用户数量达到3亿。微软、Meta和Alphabet等高科技巨头在人工智能产品和数据中心上投入了数十亿美元赌注,很快就忘记了早先对虚拟现实和增强现实的热情。
2024年,投资20亿美元研发Blackwell人工智能芯片的英伟达成为全球最有价值的公司,其市值在两年内增长了9倍。该公司首席执行官黄仁勋预测,未来几年将有1万亿美元投资于使用此类芯片的数据中心。所有这一切,都让苹果公司对人工智能的谨慎、观望的态度显得古板过时。
但在光鲜的外表下,大型语言模型和许多已有几十年历史的人工智能模型一样,无非是使用“模式识别”和“统计预测”来产生输出,这意味着它们的可靠性取决于未来是否与过去一样。这是一个重要的局限。人类可以用想象力解释历史证据,预测未来可能发生的不同情况;人类还可以通过相互之间的天马行空的对话来改进自己的预测。人工智能算法则不能。
这一缺陷并非致命。因为遵循自然规律的过程自然是稳定的,所以未来在很多方面都与过去相似。只要有明确的反馈,人工智能模型就能通过训练变得更加可靠,而即便底层过程不稳定,或者反馈不明确,统计预测也能比人类判断更具成本效益。由谷歌或Meta算法提供的不知所云的广告仍然优于盲目的广告。对着手机口述文字可能会产生错误,但仍然比在小屏幕上打字更快捷方便。
不过,如果仅仅因为大型语言模型可以像人类一样交谈,就认为大型语言模型是一个巨大的飞跃,那就太痴心妄想了。根据我的个人经验,大型语言模型应用程序在做研究、编写摘要或生成图形方面简直一无是处。尽管如此,有关“深度求索”的报道还是在金融市场掀起了轩然大波。
“深度求索”声称,它只仅靠低端英伟达芯片就实现了OpenAI和谷歌水平的人工智能性能,训练和运营成本只有后两者的几分之一。如果消息属实,高端人工智能芯片的需求将低于预期。正因如此,“深度求索”的消息让英伟达的市值在一天之内缩水了约6000亿美元。
诚然,特斯拉在取得交流电突破后的诸多所谓发明都是夸大其词,但是节俭的、打破常规的创新可以带来变革。看看马斯克的低成本可重复使用火箭,即可略知一二。印度成功执行火星任务的成本仅为7300万美元,比好莱坞科幻电影《地心引力》的预算还低。
如果得到证实,“深度求索”的技术对于大型语言模型的意义,就如同特斯拉发明交流电对于电气化的意义。它无法克服回顾性统计模型不可避免的局限性,但可以让这些模型的成本效益足够高,从而得到更广泛的应用。