权威解析

24小时热点

专家观点

精选军图

台名嘴：DeepSeek展现惊人推理能力打破AI市场格局

2025-02-08 08:12:55 来源：澎湃新闻小大

DeepSeek展现惊人推理能力！2025年，大模型站在了新周期的起点。幻方量化旗下的AI初创公司DeepSeek凭借基于深度学习的量化交易模型在全球人工智能市场引起了轰动，这也成为美国和日本对中国半导体产业实施出口管制的原因之一。

OpenAI的大语言模型推动了具身智能的发展，而DeepSeek则证明了通过调整大模型的基础结构并有效利用有限资源，同样可以取得成功。这表明以往单纯依靠堆算力和扩大模型尺寸的路径已被打破。大模型正在从追求规模转向追求性价比，用更低的能耗和资源实现更高的效能，并从海量数据转向高质量数据，提高解决垂直行业问题的能力。

过去一年，AI智能体、AIGC和多模态技术塑造了大模型的应用场景。新的一年，DeepSeek引发的技术拐点将更加明显，全球大模型市场竞争格局有望被改写。

DeepSeek作为一家成立不到两年的大模型公司，在融资和技术进展方面并不出名，其母公司幻方量化也仅在私募圈有名。然而，这家公司的突破却震动了全球科技行业。DeepSeek的成功验证了“即将消灭你的那个人，迄今还没有出现在你的敌人名单上”这句话。

2023年，梁文锋宣布进军通用人工智能领域，创办了DeepSeek。尽管团队规模不大，但取得了显著成果。2024年5月，DeepSeek发布了DeepSeek-V2模型，采用了创新架构，以实现高经济性的训练效果和高效的推理。同年12月，DeepSeek-V3模型发布，多项评测成绩超越了许多其他开源和闭源模型。DeepSeek-V3的成本仅为OpenAI GPT-4o的十分之一，展示了极高的性价比。

今年1月20日，DeepSeek发布了DeepSeek-R1模型，该模型在数学、代码和自然语言推理等任务上表现出色。安德烈·卡帕西称赞DeepSeek在有限资源下展现了惊人的工程能力，可能重新定义大模型研发的规则。马克·安德森则认为这是最令人惊叹的突破之一。

12 3 全文共 3 页下一页

(责任编辑：)

关闭

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

抢先打捞中国坠海歼-35？美媒竟公开支招

台名嘴：DeepSeek展现惊人推理能力打破AI市场格局

精选推荐

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相 成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀 核潜艇偷袭击沉伊朗护卫舰

抢先打捞中国坠海歼-35？美媒竟公开支招

台名嘴：DeepSeek展现惊人推理能力 打破AI市场格局

精选推荐

央视曝光东风-17新构型亮相成本更低更适合量产

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

台名嘴：DeepSeek展现惊人推理能力打破AI市场格局