地球最强AI来了,马斯克用20万张GPU砸出奇迹!2月18日中午12点,马斯克在X平台直播发布了“地球最强AI”Grok 3模型。发布会延迟了18分钟,让屏幕前的百万网友等待许久。除了马斯克外,还有来自xAI设计、图像和推理部门的三位工程师参与发言。发布会上宣布了Grok 3和Grok 3 mini两款模型。
目前Apple Store还未正式上线Grok 3,但第一批预订用户可以通过X平台或网页端提前体验。团队还推出了SuperGrok高级订阅服务,提供额外的推理和DeepSearch查询功能,月费30美元,年费300美元。
Grok 3在Chatbot竞技场盲测中,在代码、指令响应等方面排名第一。马斯克特别强调了其数学逻辑推理、科学逻辑推理以及计算机编程能力,称Grok 3能准确回答美国大部分测试题目,这种能力基于数学逻辑推理而非记忆。与Grok 3 mini、o3mini、o1、DeepSeek-R1以及Gemini-2相比,Grok 3表现更优。相较于前一代Grok 2,其能力提升了多个量级。为了展示Grok 3的数学逻辑推理能力,马斯克展示了它在AIME中的测试结果,表现同样优于其他模型。Grok 3还能修正自己推理中的错误。
马斯克希望通过Grok 3解决现实问题,如制造特斯拉和火箭,并将其应用于数据中心。Grok 3支持“Big Brain”模式,使用更多算力进行深度思考。例如,当被问及如何从地球发射火箭到火星并返回时,Grok 3不仅完成了复杂的计算,还生成了3D动画。马斯克预测明年11月将有重大突破,未来SpaceX可能按照Grok 3的演算过程发射探测器。他还预计三年内计算机将在某些领域超越人类。
发布会开始前几个小时,马斯克确认xAI将成立一家AI游戏公司。现场演示中,Grok 3融合了经典游戏“俄罗斯方块”和“宝石方块”,创造出新游戏。尽管演示环节出现了一些问题,但工程师表示很快会发布AI游戏设计社区,供用户设计和玩游戏。
Grok 3带来了新一代搜索引擎DeepSearch,支持联网,提供类似Agents的服务。用户搜索信息时,DeepSearch不仅给出答案,还会附上推理过程和网页来源。例如,询问下一次星舰发射时间时,Grok 3回答4月24日,并给出了推理过程。
工程师多次提到模型可能存在不足,但每天都在更新修正。发布会尾声,团队回答了网友的问题,如语音助手将在一周后上线。关于开源问题,尽管马斯克称赞DeepSeek的开源策略,Grok 3仍为闭源版本。团队计划在新版本发布后对旧版本进行开源,但Grok 3暂不会开源,以保障商业竞争力。OpenAI首席执行官奥尔特曼宣布下一个项目将开源,可能是o3-mini。
发布会结束后,部分网友实测了Grok 3。有人对其表示看好,也有人发现了编码方面的缺陷。一些网友质疑其订阅政策,担忧未来可能免费。Grok 3是否名副其实,还需等到全面上线后才能见分晓。
(责任编辑:卢其龙 CM0882)