中华网 china.com

军事

专家观点

  • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
  • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
  • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
  • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

DeepSeek离“中国版安卓”还有多远 重塑全球AI格局

2025-02-14 11:25:48 来源:网易新闻

DeepSeek离中国版安卓还有多远。2025年伊始,DeepSeek在全球技术领域掀起了一场风暴,吸引了几乎所有AI大模型的关注。DeepSeek的开源路线备受瞩目,甚至让OpenAI CEO山姆·奥尔特曼反思自家公司是否站在了“历史的错误一边”。DeepSeek以低成本高性能的表现打破了行业遵循“大力出奇迹”的原则,展示了大模型的更多可能性。

不仅业内将DeepSeek视为颠覆者,它还破圈融入了更多领域,不少非AI行业的用户也开始使用DeepSeek进行算命、聊天、工作,甚至有人用它赚钱。上线仅20天,DeepSeek的日活跃用户就突破了2000万,迅速超越ChatGPT成为全球增速最快的AI应用。

这家起源于中国杭州的科技公司,让人兴奋不已。过去关于中国人工智能与美国差距的问题一直存在争议,有乐观者认为只有几个月的差距,也有悲观者认为还有十年之遥。但DeepSeek的出现似乎让人们看到了更清晰的前景,原来中国的人工智能一直在逐步追赶,择机超越。

DeepSeek的火热让国内用户更加自信,悲观者也再次乐观起来。它像一条搅动AI发展进程的鲶鱼,迫使全球人工智能赛道上的选手重新评估自身的技术水平和位置。人们开始讨论DeepSeek的技术水平以及其成功是否会成为中国人工智能赶超美国的加速点。

两年前,2023年初,ChatGPT爆火,拉开了AI大模型浪潮的序幕。当时,ChatGPT无疑是这场浪潮的引领者,而Open AI CEO山姆·奥尔特曼被《时代》周刊评为2023年度CEO,被誉为“硅谷的造王者”。Open AI的成功让行业纷纷跟随其发展路径,坚信更多的数据和更强的算力能训练出更优秀的模型。

为了赶上这股潮流,许多科技巨头在数据和算力上投入巨资,但这些努力并没有让他们快速胜出,反而成就了显卡霸主英伟达的万亿市值。然而,DeepSeek的出现打破了这一局面。根据公开资料,DeepSeek的R1模型训练成本仅为560万美元,远低于其他科技巨头动辄数亿、数十亿美元的投入。斯坦福大学教授吴恩达表示,OpenAI - o1模型每百万输出token的成本为60美元,而Deepseek-R1只需2.19美元,成本差距近30倍。

成本大幅下降的原因在于DeepSeek在算法和硬件利用率方面的革新。传统大模型遵循“预训练-监督微调(SFT)-强化学习(RL)”的三段式训练流程,其中SFT阶段需标注海量数据,成本占比超过40%。DeepSeek-R1跳过了SFT阶段,直接用纯强化学习模式实现推理能力。此外,DeepSeek将单GPU算力利用率从行业平均的15%提升至23%,通过FP8混合精度训练、动态序列长度调整和DualPipe并行架构优化,极大程度上榨干了硬件潜能。

除了低成本,DeepSeek还采取了开源路线。创始人梁文锋认为,先建立一个强大的技术生态更为重要。开源可以吸引更多大厂和技术人才参与,共建共创更强大的人工智能大模型生态。“低成本+开源路线”的组合拳大大降低了AI应用的门槛,打破了传统AI巨头的垄断地位,使更多中小企业也能入局训练自己的AI,提供了更多发展可能性。

不到一个月时间,各大厂商纷纷接入DeepSeek。在国内市场,华为云、腾讯云、阿里云等头部云服务厂商率先行动。华为云基于昇腾云服务推出了DeepSeek - R1/V3推理服务;腾讯云则支持DeepSeek-R1的快速一键部署,并提供限时免费体验;阿里云也在PAI Model Gallery中加入了对DeepSeek-V3和R1模型的一键部署支持,简化了从模型训练到推理的全过程,并采用按需计费模式降低企业使用AI技术的成本。

海外科技大厂如微软Azure平台、亚马逊AWS、英伟达也相继跟进,实现了对DeepSeek-R1模型的支持。这种短时间内集体接入的现象充分说明了DeepSeek的价值。不过,DeepSeek也面临诸多质疑。马斯克质疑中国公司是否从美国获得了高端芯片,特朗普则称DeepSeek在“给美国产业敲响警钟”,呼吁集中精力赢得竞争。在美国参议院外交关系委员会听证会上,智库代表提议“偷走中国最好的工程师”。

这些质疑声表明,DeepSeek的出现让美国感到焦虑。一方面,DeepSeek证明了中国人工智能在成本上的显著优势,有可能赶超美国。另一方面,通过开源路线,DeepSeek正在构建自己的AI生态,更多开发者的加入将加快技术的应用和迭代。

尽管如此,DeepSeek在追求AGI的过程中仍面临挑战。模型能力与泛化性的难题、成本控制与效率优化的现实困境、以及激烈的竞争和开源压力都是亟待解决的问题。近期随着用户规模的快速扩张,服务器负载过重、响应延迟等问题已经暴露出来,要求DeepSeek在技术架构和服务模式上进行深度革新。

DeepSeek的横空出世为全球AI领域注入了一股新生力量,以低成本高性能的创新模式和开源路线打破了传统AI巨头的垄断格局,重塑了全球AI市场的竞争生态,为中国人工智能赶超美国带来了新的希望。未来,DeepSeek需要在技术、成本控制、竞争压力等方面做出更为成熟的考虑,继续在人工智能赛道上走得更远。(责任编辑卢其龙 CM0882)

(责任编辑卢其龙 CM0882)
关闭

精选推荐

下一页
×