权威解析

24小时热点

专家观点

精选军图

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价

2025-02-19 09:54:28 来源：新浪财经小大

马斯克的Grok-3，担得起“地表最强AI”之名？北京时间2月18日12点30分左右，马斯克与xAI团队的三位技术负责人发布了公司最新推出的Grok-3基座大模型。在短短30分钟的发布过程中，他们介绍了Grok-3在数学、科学推理性能上的优势，并展示了其代码创作能力，同时公布了后续的开源计划。

马斯克曾称Grok-3是“地球上最聪明的人工智能”。从发布的性能来看，Grok-3确实在某些方面超越了DeepSeek-V3和OpenAI-4o等模型，但这是通过使用20万块英伟达GPU的算力实现的。在全球人工智能行业越来越注重性价比的情况下，Grok-3是否能被称为“地表最强AI”并带来市场变化仍需观察。

据马斯克介绍，Grok-3在数学推理、科学逻辑推理和代码写作等方面表现优异，在Math（AIME 24）、Science（GPQA）和 Coding（LCB Oct-Feb）三项基准测试中均超过了Gemini-2 pro、DeepSeek-v3和GPT-4o。在Chatbot Arena（LMSYS）中，Grok-3得分达到1402分，超过了包括ChatGPT-4o和DeepSeek-R1在内的所有其他模型。此外，Grok-3还展示了寻找去火星时间窗口的信息收集和推理能力，以及创作了一款融合《宝石迷阵》和《俄罗斯方块》的游戏，展示了其创意能力。

目前，Grok-3已经在xAI内部运行两周，首批用户可以通过X平台预订体验。由于合规要求，最新的Grok-3模型暂时只能在网页上使用。马斯克表示，一周后将上线所有全新性能，并透露通常会在新模型发布时开源上一代模型，几个月后也会对Grok系列进行开源。

强大的性能背后，Grok-3的训练成本也引起了关注。据披露，Grok-3训练过程中累计消耗了20万块英伟达GPU，耗时122天完成第一个10万卡训练。相比之下，DeepSeek以远低于同行的成本训练出比肩OpenAI-01模型能力的R1模型，Grok-3的算力消耗是DeepSeek-v3的263倍。高昂的训练成本可能会限制许多用户的使用，尤其是那些希望私有化部署的企业用户。

12 3 全文共 3 页下一页

(责任编辑：)

关闭

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

中国空军15000米闪电出击，30秒击落间谍气球

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价

精选推荐

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

中国空军15000米闪电出击，30秒击落间谍气球

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相 成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀 核潜艇偷袭击沉伊朗护卫舰

马斯克的Grok-3，担得起“地表最强AI”之名？ 算力堆叠的代价

精选推荐

央视曝光东风-17新构型亮相成本更低更适合量产

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价