中华网 china.com

军事

24小时热点

    专家观点

    • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
    • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
    • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
    • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

    台名嘴:DeepSeek展现惊人推理能力 打破AI市场格局

    2025-02-08 08:12:55 来源:澎湃新闻

    DeepSeek展现惊人推理能力!2025年,大模型站在了新周期的起点。幻方量化旗下的AI初创公司DeepSeek凭借基于深度学习的量化交易模型在全球人工智能市场引起了轰动,这也成为美国和日本对中国半导体产业实施出口管制的原因之一。

    OpenAI的大语言模型推动了具身智能的发展,而DeepSeek则证明了通过调整大模型的基础结构并有效利用有限资源,同样可以取得成功。这表明以往单纯依靠堆算力和扩大模型尺寸的路径已被打破。大模型正在从追求规模转向追求性价比,用更低的能耗和资源实现更高的效能,并从海量数据转向高质量数据,提高解决垂直行业问题的能力。

    过去一年,AI智能体、AIGC和多模态技术塑造了大模型的应用场景。新的一年,DeepSeek引发的技术拐点将更加明显,全球大模型市场竞争格局有望被改写。

    DeepSeek作为一家成立不到两年的大模型公司,在融资和技术进展方面并不出名,其母公司幻方量化也仅在私募圈有名。然而,这家公司的突破却震动了全球科技行业。DeepSeek的成功验证了“即将消灭你的那个人,迄今还没有出现在你的敌人名单上”这句话。

    2023年,梁文锋宣布进军通用人工智能领域,创办了DeepSeek。尽管团队规模不大,但取得了显著成果。2024年5月,DeepSeek发布了DeepSeek-V2模型,采用了创新架构,以实现高经济性的训练效果和高效的推理。同年12月,DeepSeek-V3模型发布,多项评测成绩超越了许多其他开源和闭源模型。DeepSeek-V3的成本仅为OpenAI GPT-4o的十分之一,展示了极高的性价比。

    今年1月20日,DeepSeek发布了DeepSeek-R1模型,该模型在数学、代码和自然语言推理等任务上表现出色。安德烈·卡帕西称赞DeepSeek在有限资源下展现了惊人的工程能力,可能重新定义大模型研发的规则。马克·安德森则认为这是最令人惊叹的突破之一。

    (责任编辑)
    关闭

    精选推荐

    下一页