马斯克的Grok-3,担得起“地表最强AI”之名?北京时间2月18日12点30分左右,马斯克与xAI团队的三位技术负责人发布了公司最新推出的Grok-3基座大模型。在短短30分钟的发布过程中,他们介绍了Grok-3在数学、科学推理性能上的优势,并展示了其代码创作能力,同时公布了后续的开源计划。
马斯克曾称Grok-3是“地球上最聪明的人工智能”。从发布的性能来看,Grok-3确实在某些方面超越了DeepSeek-V3和OpenAI-4o等模型,但这是通过使用20万块英伟达GPU的算力实现的。在全球人工智能行业越来越注重性价比的情况下,Grok-3是否能被称为“地表最强AI”并带来市场变化仍需观察。
据马斯克介绍,Grok-3在数学推理、科学逻辑推理和代码写作等方面表现优异,在Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三项基准测试中均超过了Gemini-2 pro、DeepSeek-v3和GPT-4o。在Chatbot Arena(LMSYS)中,Grok-3得分达到1402分,超过了包括ChatGPT-4o和DeepSeek-R1在内的所有其他模型。此外,Grok-3还展示了寻找去火星时间窗口的信息收集和推理能力,以及创作了一款融合《宝石迷阵》和《俄罗斯方块》的游戏,展示了其创意能力。
目前,Grok-3已经在xAI内部运行两周,首批用户可以通过X平台预订体验。由于合规要求,最新的Grok-3模型暂时只能在网页上使用。马斯克表示,一周后将上线所有全新性能,并透露通常会在新模型发布时开源上一代模型,几个月后也会对Grok系列进行开源。
强大的性能背后,Grok-3的训练成本也引起了关注。据披露,Grok-3训练过程中累计消耗了20万块英伟达GPU,耗时122天完成第一个10万卡训练。相比之下,DeepSeek以远低于同行的成本训练出比肩OpenAI-01模型能力的R1模型,Grok-3的算力消耗是DeepSeek-v3的263倍。高昂的训练成本可能会限制许多用户的使用,尤其是那些希望私有化部署的企业用户。
当前,全球范围内越来越多的企业选择使用低成本的AI大模型,例如DeepSeek开源相关模型带来的成本下降和性能提升,已经掀起了一股大模型产品开源免费的热潮。OpenAI首席执行官萨姆·奥尔特曼也在考虑开源新的大模型,而百度公司也宣布旗下文心一言会员产品免费。对于Grok-3而言,高昂的训练成本及不开源策略可能成为其普及的一大障碍。
Grok-3发布后,三变科技股价迅速回落,部分投资者认为这是因为“马斯克发布会不及预期”。此前,马斯克曾提出以974亿美元收购OpenAI控股权,但遭到拒绝。双方矛盾公开化,马斯克强调此举旨在让OpenAI回归“开源、安全优先”的初心。尽管马斯克旗下的Grok-3拥有特斯拉和x社交平台等资源支持,但未来能否让更多企业和消费者用上这款产品,将是发展的关键。(责任编辑:卢其龙 CM0882)