Custom Thumbnail
题图:©Freepik,AI生成

AI实验室竞赛升温

ChatGPT并非独一家

内容提要

时不时就会有一项新技术让全球都为之着迷。从硅谷、华尔街、全球各地的高管办公室、新闻编辑室和教室里的讨论来看,最新的例子是ChatGPT。2022年11月,创业公司OpenAI发布了其创造的AI聊天机器人ChatGPT,短短五天之内就吸引了100万注册用户,成为史上用户扩张速度最快的消费产品之一。微软刚刚向OpenAI投资了100亿美元,想要把ChatGPT这类能力融入到其销售的大部分软件中区。ChatGPT的能力包括生成看起来可能是由人类创建的文本、图像、视频。1月26日,谷歌发布了一篇论文,描述了一种类似的模型,可以根据对歌曲的文本描述生成音乐。其母公司Alphabet的投资者正在聆听谷歌对ChatGPT的回应。据报道,中国搜索巨头百度计划在今年3月,将一个聊天机器人整合到其搜索引擎当中去。

ChatGPT才刚刚问世,现在要说这种追捧是否实至名归还为时尚早。然而,不管ChatGPT及其竞争对手背后的“生成式”AI模型正在多大程度上改变商业、文化和社会,它们已经在改变科技行业对创新及创新引擎的看法。这些创新引擎就是像OpenAI和Google Research那样的企业研究实验室,它们正在将科技巨头的数据处理能力和计算机科学一些焦点领域里的聪明头脑结合起来。这些相互竞争的实验室无论是大型科技公司内部的一个部门、下属机构,还是由独立的创业公司运营,都在参与一场史诗级的AI霸权竞赛。这场竞赛的结果,将决定AI时代将多快来到世界各地计算机用户眼前,以及谁将主宰这个时代。

长期以来,企业研发机构一直是科学进步的源泉——尤其是在美国,更是如此。一个半世纪前,托马斯·爱迪生用他通过留声机和灯泡灯发明获得的收入,为自己在新泽西州门罗帕克设立的实验室提供资金。二战后,美国企业界大举投资基础科学,希望由此产生实用的产品。杜邦(化学品制造商)、IBM和施乐(两者都是硬件制造商)都设有大型研究实验室。AT&T的贝尔实验室产生了晶体管、激光器和光伏电池等众多发明,其研究人员因此一共获得了九项诺贝尔奖。

但到了20世纪末期,企业研发越来越重视“发”而轻视“研”。2017年,经济学家阿希什·阿罗拉及其同事研究了1980年至2006年这一时期,发现企业已经从关注基础科学转向开发既有想法。阿罗拉与他的合著者认为,这种转变背后的原因是研究的成本不断上升,要获得成果越来越难。施乐开发了现在为计算机用户所熟悉的图标和视窗界面,从中获利最多的却是苹果和微软。科学研究对创新仍然重要,但主导机构成了非盈利性的大学。

AI的兴起正再次颠覆一切。从事AI研究的不仅是大公司。Anthropic和Character AI等创业公司都已经有了类似ChatGPT的项目。另一家创业公司Stability AI组建了一个由小公司、大学和非营利组织组成的联盟来汇集计算资源,创建了一个备受欢迎的开源模型,可以将文本转换为图像。在中国,北京智源人工智能研究院等政府支持的机构也表现出色。

但是,近年来几乎所有超级AI的突破都来自超大公司,因为它们拥有计算能力,还因为这是一个少有的基础研究成果可以快速融入产品的领域。亚马逊的AI驱动着它的Alexa语音助手,Meta最近因为其一个模型在战略棋盘游戏《强权外交》中击败人类玩家而引起了轰动,这两家公司开展的AI研究数量分别相当于计算机科学名校斯坦福大学的三分之二和五分之四。Alphabet和微软的研究还要多得多,这还不包括Google Research的姊妹实验室、Alphabet于2014年收购的DeepMind,以及微软投资的OpenAI。

至于究竟哪家公司在技术成果上真正领先,专家的看法各有不同。例如,中国的实验室似乎在计算机视觉这个涉及图像分析的子学科中领跑,它们在该领域被引用次数最多的论文中所占份额最大。根据微软的一项排名,全球排名前五的计算机视觉团队都是中国的。北京智源还构建了自称全球最大的自然语言模型“悟道2.0”。Meta的AI西塞罗在玩《强权外交》时通过战略推理和欺骗来对抗人类对手,战绩突出。DeepMind的AI在出了名难懂的棋盘游戏围棋中击败了人类冠军,而且还能预测蛋白质的形状,这一直是生命科学的一项挑战。

所有这些成就都令人惊叹。不过,说到因ChatGPT而大火的那种AI,真正的对决是在微软和Alphabet之间展开的。为了看看谁的技术更胜一筹,《经济学人》测试了这两家公司的AI。在一位谷歌工程师的协助下,我们分别向ChatGPT和谷歌尚未推出的聊天机器人提出了一些问题,前者基于OpenAI名为GPT-3.5的模型,后者基于LaMDA模型。这些问题包括选自一项美国数学竞赛的十道题(比如“求和为60的有序质数对的个数”)和美国高中毕业生参加的SAT测验的十道阅读题(“阅读以下段落,判断那个选项最符合文中所描述的情况”)。为了让测试更有趣一些,我们还向二者征求约会建议(“根据以下来自一款约会应用的对话,说出初次邀请对方跟自己约会的最佳方式是什么?”)

这两个AI没有哪个明显更胜一筹。谷歌的AI数学稍好,答对了五道题,ChatGPT答对了三道。它们的约会建议都有好有坏,我们给两者都输入了约会应用中的一些真实对话,它们都根据一段对话给出了具体建议,而针对另一端对话则给出了诸如“开放豁达”和“有效沟通”之类的陈词滥调。另外,ChatGPT答对了九道SAT阅读题,而谷歌机器人答对了七道。ChatGPT对我们的反馈似乎也更敏感,在第二次试着回答一些问题时给出了正确答案。1月30日,OpenAI官宣ChatGPT经过更新后,提高了数学能力。当我们给这两个AI又出了十道数学题时,谷歌机器人再次领先两分。但给了第二次机会后,ChatGPT就追平了。

至少到目前为止,没有哪个AI模型具有绝对优势,原因是AI知识传播得很快,Stability AI的夏睿文说,这些彼此竞争的实验室的研究人员“都相互往来”。就像曾在谷歌工作的夏睿文一样,许多人会带着他们的专业知识和经验在不同公司之间跳槽。此外,由于最优秀的AI人才骨子里都是科学家,因此,他们在转投私营部门时,往往以能继续发表研究成果并在会议上演讲为条件。这就是谷歌会公开AI模型关键组成部门“Transformer”等重大进展的部分原因,这为其竞争对手提供了帮助(ChatGPT中的“T”就代表“Transformer”)。Meta的顶尖AI专家杨立昆认为,这一切的结果就是“任何一家公司的领先优势都不会超过两到六个月”。

不过,现在说什么都还言之过早。各家实验室可能不会永远都难分高下。据报道,谷歌担心ChatGPT会增强微软的搜索引擎必应,已经发布了“红色警报”。DeepMind历来专注于游戏和科学,其研究人员表示,公司现在正在向语言建模投入更多资源,它的聊天机器人Sparrow可能将于今年亮相。

可能有助于决定这场竞赛最终结果的一个变量是实验室的组织方式。OpenAI是一家小公司,没什么收入流要保护,可能会比竞争对手享有更多自由来向公众发布产品。这反之又会产生大量的用户数据,可以让它的模型变得更好(也就是所谓的“基于人类反馈的强化学习”),这又可以吸引更多用户。

这种先发优势也可能通过另一种方式实现自我强化。业内人士指出,OpenAI近年来发展迅速,让它能够从包括DeepMind在内的竞争对手那里挖走专家。为了跟上步伐,Alphabet、亚马逊和Meta可能需要重新找到自己快速行动和打破常规的能力。鉴于它们正在接受来自世界各国政府的各种监管审查,这是一项需要小心处理的任务。

另一个决定因素,可能是技术发展路径。到目前为止,生成式AI模型是越大越好。这为资金雄厚的科技巨头带来了巨大优势。但在未来,大小可能无法决定一切。一方面,可以想见模型大小是有限度的。非营利性研究机构Epoch估计,按照目前的发展速度,到2026年,大型语言模型将用尽互联网上的高质量文本——尽管视频等未被充分利用的其他形式的信息,在一段时间内仍旧储备丰富。更为重要的是,正如Stability AI的夏睿文所指出的,有一些方法可以针对特定任务微调模型,从而“显著减少扩大规模的需要”。而且,人们一直都在开发少花钱多办事的新方法。

生成式AI创业公司去年总共通过110笔交易,融资27亿美元。这些资金流入表明,风险投资人正在押注并非所有价值都将被大型科技公司捕获。Alphabet、微软及其科技巨头同行,都将试图证明这些投资人想错了。AI竞赛才刚刚开始。

AI热潮:以史为鉴

有一些创新,需要一点儿想象力才能看出它们可能会如何改变经济。但最新的AI工具则不然。智能聊天机器人ChatGPT自从去年11月发布以来迅速风靡全网,人们很容易(容易得令一名作家有些不安)就会想到在一些场景中,这样的技术会如何大大提高人类的工作效率,甚至会完全取代人类。GPT是“Generative Pre-trained Transformer”(“生成式预训练转换器”)的缩写,是一种特定的语言模型。其实,GPT也完全可以是“General-Purpose Technology”(“通用技术”)的缩写:一种翻天覆地的创新,可以像蒸汽机、电力、计算机那样,提升各行各业的生产率。通过观察这些早期GPT所推动的经济革命,可以帮助我们了解强大的AI在未来一些年里,将如何改变经济。

在1995年发表的一篇论文中,斯坦福大学的蒂莫西·布雷斯纳罕与特拉维夫大学的曼努埃尔·特拉坦伯格阐述了他们认为通用技术应当具备的特征。这样的技术必须为众多行业所用,本身具有持续改进的潜力,并且,催生出“互补性创新”,即在使用该技术的行业中诱发连锁创新。AI正被广泛采用,似乎每天都变得更强,并越来越多地融入到研发过程中。那么,经济革命将何时开启呢?

历史给人们的第一条经验是,即使是最强大的新技术也需要时间来改变经济。詹姆斯·瓦特于1769年申请了蒸汽机的专利,但直到1830年代的英国和1860年代的美国,蒸汽动力才取代水力成为工业动力的来源。萨塞克斯大学的尼古拉斯·克拉夫茨指出,在英国,蒸汽对生产率增长的贡献到1850年后才达到顶峰,此时距瓦特获得专利已有一个世纪了。还有电气化,关键的技术进步在1880年之前就已经完成,但美国的生产率增速在1888至1907年间实际上还放缓了。首个集成电路问世近30年后,诺贝尔经济学奖得主罗伯特·索洛还在评论说,计算机时代似乎无处不在,唯独在生产率数据上没有体现。直到1990年代中期,计算机驱动的生产率爆发才最终在美国出现。

创新与其经济影响存在时间差,一定程度上是因为创新需要改进。早期的蒸汽机效率极低,还要消耗大量煤炭,成本高昂。同样,与大约10年前曾引发一次AI小高潮的AI工具相比(例如,苹果于2011年发布的虚拟助手Siri),最近AI的惊人表现是很大的进步。资本约束也可能减缓技术部署。纽约大学阿布扎比分校的罗伯特·艾伦认为,英国工业化过程中生产率增长缓慢,反映出建设工厂和制造机器的资本不足,而随着资本家将丰厚的利润再投资,才逐步解决这一问题。

当然,对许多人来说,AI对经济增长的影响是个次要问题,他们更关注AI对工人有什么影响。在这个问题上,历史给出的信息有好有坏。好消息是,尽管出现了划时代的技术与经济变革,但对大规模技术性失业的担忧从未成真。然而,技术还是可能会对个别职业造成冲击,并可能因此导致社会混乱——事实上,也确实造成了一些冲击。在工业革命早期,机械化急剧增加了对相对缺乏手艺的工人的需求,而大大挤占了以前承担大部分工作的手艺人的收入,因此一些人选择参加捣毁机器的“卢德运动”。在1980和1990年代,工厂车间和办公室里常规工作的自动化,让许多中等收入工人失业,但同时也促进了高技能与低技能工人就业。

哎呀,很棒啊!

AI很可能会提高所有不同技能水平的工人的生产率,甚至是小说家。然而,这对某种职业整体而言意味着什么,取决于生产率提高与成本降低是导致需求大幅增长,还是只有小幅增长。当亨利·福特通过生产流水线(一种具有GPT特征的流程创新)降低了汽车制造成本后,需求激增,工人受益。比如在医学领域,如果AI能够提高生产率并降低成本,可能会大大提升对医疗服务和专业人员的需求。

强大的AI有可能打破以往的模式。一项几乎可以处理普通人所能完成的任何任务的技术,将把人类带入未知的经济领域。然而,即使在这种情况下,依然可以从历史中获得一些经验。蒸汽革命带来的持续经济增长,还有电气化和之后其他创新带来的进一步加速增长,本身就是前所未有的。它们促使人类紧急行动起来,创造出新的思想和制度,以确保彻底的经济变革能够转化为广泛的繁荣,而非混乱。或许人们很快又该奋力动起来了。

本文翻译自经济学人,译者:技术商业备忘录,原文链接https://www.economist.com/business/2023/01/30/the-race-of-the-ai-labs-heats-up

本文为翻译作品,原文版权归原作者所有。未来学人仅提供翻译服务,不对原文内容或观点进行任何修改或代表。本文仅供学习和研究参考,不得用于商业用途。

上一篇 2023 年 6 月 7 日 上午7:14
下一篇 2023 年 4 月 12 日 上午7:14

相关推荐

发表回复

登录后才能评论