中华网 china.com

军事

24小时热点

    专家观点

    • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
    • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
    • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
    • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

    海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

    2025-02-05 20:16:49 来源:机器之心Pro

    围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

    虽然 R1 是开源的,各种夸张猜测还是层出不穷,有人说训练 R1 实际上使用的算力远超论文所说的,有人质疑 R1 的技术创新,甚至还有人说 DeepSeek 实际的目标是做空。近日,知名生成式 AI 创业公司 Stability AI 的前研究主管 Tanishq Abraham 撰文揭穿了围绕 DeepSeek 的一系列谬论。

    今年 1 月 20 日,DeepSeek 开源的强推理模型 R1 震撼了世人,与其他所有开源大语言模型(LLM)相比,该模型的不同之处在于以下几点:性能实际上与 OpenAI 的 o1 一样好,这是一个先进的模型,标志着开源首次真正赶上闭源;与其他先进模型相比,R1 是在相对较低的训练预算下完成的;易于使用的用户界面,加上其网站和应用程序中具有可见思路链的良好用户体验,吸引了数百万新用户。

    鉴于 DeepSeek 是一家中国公司,美国及其一众科技公司纷纷指责新模型存在各种「国家安全问题」。因此,有关该模型的错误信息泛滥成灾。这篇博文旨在反驳自 DeepSeek 发布以来许多与人工智能相关的极其糟糕的评论,并以一名工作在生成式人工智能前沿的 AI 研究人员的身份提供客观的看法。

    误解 1:DeepSeek 是一家突然冒出来的中国公司

    完全错误。到 2025 年 1 月,全球几乎所有生成式 AI 研究人员都听说过 DeepSeek。DeepSeek 甚至在 R1 全面发布前几个月就已经预告了发布!传播这种误解的人很可能不是从事人工智能工作的人。如果你不积极参与某个领域,就认为你对这个领域正在发生的事情了如指掌,这是荒谬且极其傲慢的。

    1234...7全文 7 下一页
    (责任编辑)
    关闭

    精选推荐

    下一页