公开信息显示,DeepSeek员工人数不到140人,这与海外同行OpenAI等超千人的研发团队相比,规模仅约10%。
而且,与很多科技公司偏向于挖美国科技巨头的人才不同,DeepSeek打造的人才队伍是完全本土化的,这是该公司的另一个独特之处。DeepSeek员工都来自中国顶尖学校,例如北大、清华和北航的博士,而不是来自美国机构的专家或者“海归人才”。梁文峰的理念是必须自己培养顶尖人才,他本人获得了浙江大学电子信息工程本科和硕士学位。
或许也只有中国本土人才在“省钱”这方面能做到极致,他们懂得如何充分利用计算资源来更便宜地训练和运行模型。DeepSeek声称,它仅使用了2048个英伟达的H800芯片和560万美元,就训练了一个具有6710亿个参数的模型。相比之下,OpenAI和谷歌训练同等规模的AI模型所花费的费用要高出约十倍。
这意味着,大模型训练的护城河可能被打破,并改变整个人工智能行业未来的格局。“拥有600万美元资金的企业数量远多于拥有1亿美元或10亿美元资金的公司。”一位人工智能领域资深投资人表示。
美国加州大学伯克利分校人工智能政策研究员Ritwik Gupta表示:“第一个训练模型的人必须投入大量资源才能实现这一目标,但第二个人能以更便宜、更快的方式来实现这一目标。” 他还表示,中国的软件系统工程师人才库比美国大得多。
“DeepSeek效应”被夸大了吗?
但也有华尔街分析师和人工智能研究人员并不认同这一观点。“中国公司希望以500万美元来复制OpenAI的路径似乎不切实际,我们认为这真的不值得进一步讨论。”Bernstein分析师在给客户的一份报告中写道。另有一些研究人员认为,DeepSeek虽然能够在训练成本方面具有优势,但这仅仅表明它能够非常迅速地复制美国AI技术的最新发展,但长期来看难以保持领先。