从人工智能研究的角度来看,DeepSeek展示了一种改进无数其他模型的方法。它通过使模型构建变得更便宜、更快速、更易于获取,代表了全球AI的重大进展。虽然LLM并不是通向先进AI的唯一途径,但DeepSeek的创新当得起“AI里程碑”的美誉。Anthropic的联合创始人杰克·克拉克表示,该公司的模型Claude也受到启发。另一位联合创始人达里奥·阿莫迪撰文指出,这背后是范式的改变。
DeepSeek在构建其R1模型时的重大创新是摒弃了人工反馈,设计算法来识别并纠正自身的错误。这使得R1的表现更容易被人们欣赏,就像2022年ChatGPT的聊天界面首次使人工智能变得触手可及一样。
R1的创建方法削弱了硅谷目前的AI发展方式。美国主导的方式是通过简单地增加更多的数据和计算能力来扩展现有模型,以实现更高的性能。这种方法导致了该行业能源需求的巨大增加,并使科技公司与政客紧密相连。市场对旧AI发展方式受到的冲击反应迅速且猛烈。《金融时报》报道称,对冲基金Elliott Management认为人工智能被“过度炒作”,而作为这一热潮的大赢家之一的英伟达正处于一个“泡沫”之中。
DeepSeek的发展引发了对AI基础设施重大投资必要性的质疑,并对美国科技公司在AI领域的市场领先地位产生了影响。美国投资银行高盛的分析师在2024年6月发布了一份题为《生成式AI:过多的支出,过少的收益?》的报告,敲响了AI投资的警钟。报告质疑未来几年内对AI的1万亿美元投资是否“值得”,并表达了对投资回报的担忧,而这种担忧现在被DeepSeek的案例所加剧。
短期来看,这对英伟达来说是个坏消息,因为它将抑制需求。然而,从长期来看,较低的成本(以及因此而降低的能耗)将为更多的初创企业和企业提供创建模型的机会,从而增加整体需求。这进一步验证了一个事实:仅依靠提供核心AI基础模型的供应商是不够的,此一颠覆性转变将进一步打开AI模型市场的大门。
R1发布的确切影响是无法预测的,但它展示了AI领域的特点:充满热度、不确定性和过度反应。可以确定的是,推动我们迈向下一个里程碑的因素仍然不确定——是规模、数据、微调、强化学习,还是完全不同的其他因素。DeepSeek R1代表了人工智能发展中的一个重要里程碑。AI行业现在正处于十字路口:通往AI主导地位的道路可能不再是由庞大的数据中心和巨额预算铺就,而是通过优雅的算法和无情的高效性,最终将人工智能从象牙塔带入到大众手中。梁文锋在接受采访时表示:“AI应该是人人都能负担得起并可获取的。”这一点,就是DeepSeek的最大意义之所在。(责任编辑:张小花 TT1000)