权威解析

24小时热点

专家观点

精选军图

海外研究者揭穿围绕DeepSeek的谣言澄清五大误解

2025-02-05 20:16:49 来源：机器之心Pro 小大

围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型，全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进，到是不是真的只用了 550W 进行训练，再到神秘的研究团队，每个角度都是话题。

虽然 R1 是开源的，各种夸张猜测还是层出不穷，有人说训练 R1 实际上使用的算力远超论文所说的，有人质疑 R1 的技术创新，甚至还有人说 DeepSeek 实际的目标是做空。近日，知名生成式 AI 创业公司 Stability AI 的前研究主管 Tanishq Abraham 撰文揭穿了围绕 DeepSeek 的一系列谬论。

今年 1 月 20 日，DeepSeek 开源的强推理模型 R1 震撼了世人，与其他所有开源大语言模型（LLM）相比，该模型的不同之处在于以下几点：性能实际上与 OpenAI 的 o1 一样好，这是一个先进的模型，标志着开源首次真正赶上闭源；与其他先进模型相比，R1 是在相对较低的训练预算下完成的；易于使用的用户界面，加上其网站和应用程序中具有可见思路链的良好用户体验，吸引了数百万新用户。

鉴于 DeepSeek 是一家中国公司，美国及其一众科技公司纷纷指责新模型存在各种「国家安全问题」。因此，有关该模型的错误信息泛滥成灾。这篇博文旨在反驳自 DeepSeek 发布以来许多与人工智能相关的极其糟糕的评论，并以一名工作在生成式人工智能前沿的 AI 研究人员的身份提供客观的看法。

误解 1：DeepSeek 是一家突然冒出来的中国公司

完全错误。到 2025 年 1 月，全球几乎所有生成式 AI 研究人员都听说过 DeepSeek。DeepSeek 甚至在 R1 全面发布前几个月就已经预告了发布！传播这种误解的人很可能不是从事人工智能工作的人。如果你不积极参与某个领域，就认为你对这个领域正在发生的事情了如指掌，这是荒谬且极其傲慢的。

12 3 4...7 全文共 7 页下一页

(责任编辑：)

关闭

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

抢先打捞中国坠海歼-35？美媒竟公开支招

海外研究者揭穿围绕DeepSeek的谣言澄清五大误解

精选推荐

中华网 china.com

权威解析

让B-52H轰炸机这个“老爷爷”上阵，美军实在是没辙了

中国第三种六代机亮相，美媒都蒙了：航母舰载机？高端无人战斗机？

24小时热点

专家观点

精选军图

美媒：东海舰队055首次演习就针对日本！

央视曝光东风-17新构型亮相 成本更低更适合量产

东海舰队喜提两艘055！中国神盾舰突破50艘

美军拿下时隔16年首杀 核潜艇偷袭击沉伊朗护卫舰

抢先打捞中国坠海歼-35？美媒竟公开支招

海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

精选推荐

央视曝光东风-17新构型亮相成本更低更适合量产

美军拿下时隔16年首杀核潜艇偷袭击沉伊朗护卫舰

海外研究者揭穿围绕DeepSeek的谣言澄清五大误解