中华网 china.com

军事

专家观点

  • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
  • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
  • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
  • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

马斯克口中最智能的Grok 3登场,号称性能超ChatGPT及DeepSeek

2025-02-18 15:13:39 来源:新浪财经

马斯克口中最智能的Grok 3登场,号称性能超ChatGPT及DeepSeek。2月18日午间,马斯克旗下xAI公司的新一代大模型Grok 3正式发布。发布会采用视频直播形式,观看人数超过100万人,马斯克本人也出现在直播间。

马斯克介绍,Grok 3在短时间内实现了功能比Grok 2强大一个数量级,多方面性能超过或媲美Gemini、DeepSeek和ChatGPT等对手。xAI工程师表示,尽管Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT。Grok 3的训练量是Grok 2的10倍,已在公司内部运行两周。MMLU是一个用于评估语言模型在多种任务上语言理解能力的基准测试。

此外,xAI推出了名为Deepsearch的Grok-3智能搜索引擎。xAI工程师强调,Deepsearch不仅帮助工程师、研究人员和科学家编写代码,也能回答日常问题。马斯克在现场演示了Grok 3的搜索能力,例如询问“下一次星舰发射是什么时候”,Grok 3会显示其浏览的网页、思考过程,并确认信息可信度后给出相关结论。最终,它以列表形式预测了下一次星舰的发射日期。

该搜索引擎在深度思考过程中还会显示不同的次任务,这种功能据称比现有搜索引擎更强大,可节省更多时间,因为对算法和逻辑进行了重新设计。对于用户何时可以体验到这款人工智能,马斯克称会首先向预定用户开放。由于模型仍在不断更新,苹果应用商店上线的Grok版本会相对落后,而网页版更新最为及时。据透露,Grok 3语音模式可能在一周后推出。

直播末尾,马斯克和xAI工程师回答了网友提问。关于是否会开源的问题,马斯克给出了肯定的答案,称每次做下一个版本时会开源上一个版本,几个月后会开源Grok 3。对于敏感的“Grok 3是男性还是女性”问题,马斯克称性别由模型自己定义,并提醒不要爱上Grok。

谈及开发Grok 3最难的部分,马斯克表示是训练模型和100%的逻辑推理过程,复杂程度如同随时随地预测宇宙的发展情况。如果Grok 3的推理能力真如视频中所讲的那样强大,可能会推动AI从“生成答案”向“逻辑推导”升级。

xAI公司成立于2023年7月,此前已推出过Grok-1、Grok-1.5、Grok-1.5 Vision、Grok-2等大模型产品。其中,Grok-1是迄今参数量最大的开源大语言模型;Grok-1.5具有改进的推理能力和128k的上下文长度;Grok-1.5 Vision是首个多模态智能模型;Grok-2在Chatbot Arena榜单排名第18位。

当前大模型行业竞争激烈。在Grok 3发布当日,奥特曼在X上表示试用GPT-4.5带来的感受远超预期,预示着GPT-4.5已经进入测试阶段,距离正式发布也不会太远。而在2月初,谷歌也发布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本。Grok 3能否占据主导地位还需进一步观察。

可以确定的是,包括OpenAI、谷歌在内的AI巨头近期都感受到了来自中国大模型公司DeepSeek带来的冲击波。以往坚持闭源的OpenAI也有了进一步开源的迹象。2月18日,奥特曼在X上发起投票,问大家希望下一个OpenAI开源的大模型是哪种,似乎在为开源某个大模型做预热。马斯克口中最智能的Grok 3登场,号称性能超ChatGPT及DeepSeek。(责任编辑卢其龙 CM0882)

(责任编辑卢其龙 CM0882)
关闭

精选推荐

下一页
×