中国人工智能实验室DeepSeek推出的人工智能语言模型R1引起了巨大反响。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT,触发科技股市高达1万亿美元的抛售,并在硅谷引发末日般的评论。美国知名风险投资家马克·安德森将R1的发布誉为全球人工智能发展竞赛中的“斯普特尼克时刻”,比肩当年苏联通过发射卫星而令冷战对手美国震惊的历史性事件。
英伟达作为为AI模型提供支持的领先计算机芯片制造商,股价暴跌17%,市值蒸发近6000亿美元,跌幅创美国股市最高纪录。谷歌母公司损失了1000亿美元,微软损失了70亿美元。美国总统唐纳德·特朗普表示,DeepSeek应该成为“美国行业的警钟,我们需要全力以赴,专注于竞争以取得胜利”。
根据DeepSeek的说法,其R1模型在“各种基准测试”中表现优于OpenAI的o1-mini模型,Artificial Analysis的研究表明,R1模型在整体质量方面也超越了谷歌、Meta和Anthropic开发的模型。业界的震动不仅源于质量的高低,还在于DeepSeek声称仅花费不到600万美元就训练出了一款可与ChatGPT媲美的人工智能模型。相比之下,OpenAI的主要合作伙伴微软计划今年在人工智能基础设施上投入约800亿美元。
R1是一种“思维链”模型,这意味着当用户给它一个查询时,它会通过自我推理来给出答案,这种技巧极大地提高了回答质量。反复测试表明,DeepSeek-R1在解决数学和科学问题方面的能力与OpenAI于2024年9月在旧金山发布的o1模型相当。此外,R1不仅可以直接与o1进行比较,还增强了自身回答数学和编程问题的能力,在语言处理和自然语言推理任务中的表现也令人印象深刻。
R1不仅通过应用程序免费提供使用(而OpenAI的o1则需要每月支付20美元),而且对于开发者来说完全免费,可以下载并集成到他们的业务中。这鼓励更多科学家在日常研究中尝试使用大语言模型,而无需担心成本问题。除了低成本,R1的开放性可能会给科学研究带来颠覆性的变化:研究人员可以通过其应用程序接口(API)以较低的成本使用该模型,或者通过在线聊天机器人DeepThink免费查询。他们还可以将该模型下载到自己的服务器上,免费运行并在此基础上进行开发。
从人工智能研究的角度来看,DeepSeek展示了一种改进无数其他模型的方法。它通过使模型构建变得更便宜、更快速、更易于获取,代表了全球AI的重大进展。虽然LLM并不是通向先进AI的唯一途径,但DeepSeek的创新当得起“AI里程碑”的美誉。Anthropic的联合创始人杰克·克拉克表示,该公司的模型Claude也受到启发。另一位联合创始人达里奥·阿莫迪撰文指出,这背后是范式的改变。
DeepSeek在构建其R1模型时的重大创新是摒弃了人工反馈,设计算法来识别并纠正自身的错误。这使得R1的表现更容易被人们欣赏,就像2022年ChatGPT的聊天界面首次使人工智能变得触手可及一样。
R1的创建方法削弱了硅谷目前的AI发展方式。美国主导的方式是通过简单地增加更多的数据和计算能力来扩展现有模型,以实现更高的性能。这种方法导致了该行业能源需求的巨大增加,并使科技公司与政客紧密相连。市场对旧AI发展方式受到的冲击反应迅速且猛烈。《金融时报》报道称,对冲基金Elliott Management认为人工智能被“过度炒作”,而作为这一热潮的大赢家之一的英伟达正处于一个“泡沫”之中。
DeepSeek的发展引发了对AI基础设施重大投资必要性的质疑,并对美国科技公司在AI领域的市场领先地位产生了影响。美国投资银行高盛的分析师在2024年6月发布了一份题为《生成式AI:过多的支出,过少的收益?》的报告,敲响了AI投资的警钟。报告质疑未来几年内对AI的1万亿美元投资是否“值得”,并表达了对投资回报的担忧,而这种担忧现在被DeepSeek的案例所加剧。
短期来看,这对英伟达来说是个坏消息,因为它将抑制需求。然而,从长期来看,较低的成本(以及因此而降低的能耗)将为更多的初创企业和企业提供创建模型的机会,从而增加整体需求。这进一步验证了一个事实:仅依靠提供核心AI基础模型的供应商是不够的,此一颠覆性转变将进一步打开AI模型市场的大门。
R1发布的确切影响是无法预测的,但它展示了AI领域的特点:充满热度、不确定性和过度反应。可以确定的是,推动我们迈向下一个里程碑的因素仍然不确定——是规模、数据、微调、强化学习,还是完全不同的其他因素。DeepSeek R1代表了人工智能发展中的一个重要里程碑。AI行业现在正处于十字路口:通往AI主导地位的道路可能不再是由庞大的数据中心和巨额预算铺就,而是通过优雅的算法和无情的高效性,最终将人工智能从象牙塔带入到大众手中。梁文锋在接受采访时表示:“AI应该是人人都能负担得起并可获取的。”这一点,就是DeepSeek的最大意义之所在。(责任编辑:张小花 TT1000)