生于1985年的梁文峰今年刚满40岁,他上周也成为被选中参加总理和企业家会议的人工智能企业代表。他早在量化交易基金时就开始为人工智能项目购买数千个英伟达GPU。
不过,据早期与梁文峰接触的商业伙伴透露,梁文峰有点“书呆子”,并“留着一头糟糕的发型”。当梁文峰大谈他要建立一个万卡芯片集群训练大模型的想法时,“谁都没有太把他当回事”。
梁文峰曾对他的伙伴说道:“我想建立万卡集群训练大模型,这将改变游戏规则。”但很多人都认为只有字节跳动或者阿里巴巴这样的巨头公司,才有可能在中国实现这一目标。
此前,梁文峰在量化基金时,已经利用人工智能和算法来识别可能影响股价的模式,并积累了巨额财富。他的团队擅长使用英伟达的芯片通过股票交易赚钱。
2023年,梁文峰注册1000万元人民币创立DeepSeek,宣布他计划开发人类级别的人工智能。为此,他把量化基金中最优秀的人才带到了DeepSeek,建立了一支出色的人工智能基础设施专业团队,他们真正了解芯片的工作原理,并能早于其他中国本土科技公司,率先寻找到创新的方法来最大限度地发挥有限数量芯片的计算能力。
高薪聘请专业技术人才
值得关注的是,DeepSeek目前仍然是一家纯技术公司,类似于谷歌旗下早期的DeepMind。它将模型开源,尚未进行货币化,也未向外部基金筹资。他认为,更多的投资不一定会带来更多的创新,否则大公司将会“接管所有的创新”。
得益于梁文峰此前在量化基金赚得的巨额财富,他有资本高薪聘请最优秀的人工智能人才。有网络招聘信息显示,DeepSeek招募的深度学习研究员月薪最高可达11万元人民币,核心系统研发工程师月薪也能高达9万元,年薪轻松超过百万。目前该公司在北京和杭州两地设有团队。