中华网 china.com

军事

专家观点

  • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
  • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
  • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
  • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

反击梁文锋,马斯克的Grok 3“半成品”够格吗?

2025-02-19 10:15:55 来源:百家号

北京时间2月18日中午,马斯克旗下人工智能公司xAI举办了一场线上直播活动,正式推出新一代大模型Grok 3,并进行现场演示。

整场直播氛围轻松,马斯克与xAI团队的三名核心成员围坐在一张小桌前,身后是用于展示的巨型屏幕。这样的发布会形式,多少让人联想到OpenAI的发布会,但风格迥异——xAI采用的是更偏极客风格的暗色调,而OpenAI则更倾向于温馨居家的视觉设计。

从xAI成立之初,马斯克便将OpenAI作为最直接的竞争对手,此次Grok 3的发布,更是带着浓厚的挑战意味。在短短一个小时的发布会上,xAI公布了几项核心成果:

  • Grok 3在多项基准测试中超越了竞争对手,包括DeepSeek的V3以及OpenAI的GPT-4o;(责任编辑张佳鑫)

  • Grok 3在多项基准测试中超越了竞争对手,包括DeepSeek的V3以及OpenAI的GPT-4o;(责任编辑张佳鑫)

  • Grok 3在多项基准测试中超越了竞争对手,包括DeepSeek的V3以及OpenAI的GPT-4o;(责任编辑张佳鑫)

  • Grok 3在多项基准测试中超越了竞争对手,包括DeepSeek的V3以及OpenAI的GPT-4o;(责任编辑张佳鑫)

xAI的发展速度相当惊人,2023年7月成立,11月便推出了首款大模型Grok。2024年5月,xAI完成B轮融资,募资60亿美元;同年12月,再次获得C轮融资,估值突破400亿美元。从去年9月xAI搭建完成拥有10万张英伟达H100 GPU的Colossus计算集群开始,业界就对xAI的新一代模型充满期待。然而,从去年底开始,Grok 3的正式亮相一再推迟,直到今年初才得以发布。

而在这几个月间,AI市场风云突变。OpenAI启动了雄心勃勃的计算基础建设项目“星际之门”,DeepSeek则凭借高效低成本的推理模型迅速崛起。Grok 3此次登场,正面临着前所未有的竞争压力。

发布会伊始,xAI特别介绍了Grok 3背后的核心计算平台——Colossus超算集群。该集群最初由10万张英伟达H100 GPU构成,组建时间仅用了三个月,英伟达CEO黄仁勋甚至称之为“奇迹”。在发布会上,xAI首次披露,这一集群在训练进行到第92天时已扩展至20万张H100芯片。

强大的计算资源使得Grok 3的能力较前代提升了10倍。据xAI透露,Grok 3在多个关键AI基准测试中超越GPT-4o,例如AIME(衡量模型在数学问题上的表现)和GPQA(通过博士级物理、生物、化学问题进行评估)。此外,Grok 3的早期版本在Chatbot Arena测试中表现优异,成为历史上首个突破1400分的模型。这一平台通过众包方式,让不同AI模型进行对决,并由用户投票选出最佳回答。

Grok 3并非单一模型,而是一个系列。其中,Grok 3 mini版本具备更快的响应速度,但准确性略有牺牲。此外,Grok 3 Reasoning和Grok 3 mini Reasoning两个版本专注于“推理能力”,在回答问题前会进行更深入的思考,从而减少错误。这种设计类似于OpenAI的o3-mini和DeepSeek R1。

推理能力的增强使得Grok 3在多个基准测试中取得了优异表现。例如,在AIME 2025数学测试中,Grok 3 Reasoning超越了OpenAI o3-mini的最高版本o3-mini-high。推理模式可在Grok应用内启用,用户可以选择“思考(Think)”或使用“大脑(Big Brain)”模式,后者会额外消耗计算资源,但适用于复杂数学、科学和编程问题。

Grok 3的另一项重要功能是“DeepSearch”——一个由推理模型驱动的智能搜索代理,能够在互联网上及X平台上进行深度信息分析。演示显示,DeepSearch具备研究、头脑风暴、数据分析等能力,并可展示完整的“思考”过程。

这一命名显然是对OpenAI和DeepSeek的直接回应。就在两周前,OpenAI推出了AI代理“DeepResearch”,DeepSeek则在早前发布了推理模型R1。面对竞争对手的步步紧逼,xAI迅速跟进,力求在这一领域占据一席之地。

为了防止知识被竞品“蒸馏”学习,xAI对Grok 3的推理过程进行了部分模糊化处理。这种“防蒸馏”措施无疑是针对DeepSeek而设,后者此前被指控利用OpenAI的模型进行训练。

尽管Grok 3在技术表现上颇具竞争力,但此次发布会仍然显得有些仓促。马斯克在直播中坦言:“这只是一个测试版本,刚开始可能会有些不完美。如果你想要更完善的版本,可能需要等上一周。”

尤其值得注意的是,语音模式并未如预期般推出。就在发布会前几个小时,Neuralink高管希冯·齐利斯(Shivon Zilis)曾在X上大赞Grok 3的语音对话体验,称其是“人生中最意想不到且值得的时刻之一”。然而,马斯克随后回应称语音模式仍存问题,需要再等一周左右才能上线。最终,发布会结尾仅播放了一段简短的Grok 3语音演示,似乎印证了语音模式被临时取消的猜测。

此次发布会,xAI充分利用了X平台的流量优势。在直播进行半小时后,观看次数突破200万,一小时后达到300万。这一策略与Grok的推广路径一致——自去年起,Grok就已向X的订阅用户开放,并在去年底逐步向免费用户提供部分功能。今年1月,Grok的独立应用正式上线App Store,进一步与ChatGPT展开竞争。

不过,发布会并未提及特斯拉接入Grok的具体进展。尽管马斯克曾在1月初明确表示,Grok会集成至特斯拉车机系统,让车主能与汽车对话,但在本次发布会上,他并未透露具体时间表。

尽管马斯克对Grok 3信心满满,但竞争对手的步伐同样迅速。DeepSeek在端侧推理模型上的突破,引发了新一轮AI竞赛,而OpenAI也在迅速调整策略,例如向免费用户开放o3-mini,并推动DeepResearch功能。

对于xAI而言,当前的关键在于能否迅速完善Grok 3,并赢得企业级用户的认可,毕竟,xAI正在考虑以750亿美元估值融资100亿美元,而OpenAI的最新融资目标则高达3400亿美元。

Grok 3在多项基准测试中超越了竞争对手,包括DeepSeek的V3以及OpenAI的GPT-4o;(责任编辑张佳鑫)

(责任编辑张佳鑫)
关闭

精选推荐

下一页
×