中华网 china.com

军事

专家观点

  • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
  • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
  • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
  • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

马斯克的Grok-3,担得起“地表最强AI”之名? 算力堆叠的代价

2025-02-19 09:54:28 来源:新浪财经

马斯克的Grok-3,担得起“地表最强AI”之名?北京时间2月18日12点30分左右,马斯克与xAI团队的三位技术负责人发布了公司最新推出的Grok-3基座大模型。在短短30分钟的发布过程中,他们介绍了Grok-3在数学、科学推理性能上的优势,并展示了其代码创作能力,同时公布了后续的开源计划。

马斯克曾称Grok-3是“地球上最聪明的人工智能”。从发布的性能来看,Grok-3确实在某些方面超越了DeepSeek-V3和OpenAI-4o等模型,但这是通过使用20万块英伟达GPU的算力实现的。在全球人工智能行业越来越注重性价比的情况下,Grok-3是否能被称为“地表最强AI”并带来市场变化仍需观察。

据马斯克介绍,Grok-3在数学推理、科学逻辑推理和代码写作等方面表现优异,在Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三项基准测试中均超过了Gemini-2 pro、DeepSeek-v3和GPT-4o。在Chatbot Arena(LMSYS)中,Grok-3得分达到1402分,超过了包括ChatGPT-4o和DeepSeek-R1在内的所有其他模型。此外,Grok-3还展示了寻找去火星时间窗口的信息收集和推理能力,以及创作了一款融合《宝石迷阵》和《俄罗斯方块》的游戏,展示了其创意能力。

目前,Grok-3已经在xAI内部运行两周,首批用户可以通过X平台预订体验。由于合规要求,最新的Grok-3模型暂时只能在网页上使用。马斯克表示,一周后将上线所有全新性能,并透露通常会在新模型发布时开源上一代模型,几个月后也会对Grok系列进行开源。

强大的性能背后,Grok-3的训练成本也引起了关注。据披露,Grok-3训练过程中累计消耗了20万块英伟达GPU,耗时122天完成第一个10万卡训练。相比之下,DeepSeek以远低于同行的成本训练出比肩OpenAI-01模型能力的R1模型,Grok-3的算力消耗是DeepSeek-v3的263倍。高昂的训练成本可能会限制许多用户的使用,尤其是那些希望私有化部署的企业用户。

(责任编辑)
关闭

精选推荐

下一页
×