中华网 china.com

军事

专家观点

  • 中国禁止美光芯片?中方雷霆出击以其人之道还治其身,外媒炸锅了
  • 中俄好消息不断,一架俄罗斯专机抵达中国,7成俄民众对华有好感
  • 果然乱套了,英国大罢工将瘫痪80%的救护车,上万台手术被搁置
  • 局势正在失控,梅德韦杰夫再次警告:已扩大生产强大的杀 伤性武器

GPT4.5号称擅长骗其他AI打钱 情商更高更会“说服”

2025-02-28 10:01:05 来源:财联社

美国初创公司OpenAI在北京时间周五凌晨举行直播活动,发布了最新大模型GPT-4.5,并逐步向用户开放。这款被OpenAI藏了许久的大模型是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。

GPT-4.5在“规模法则”的指引下,具备更广泛的知识库和更强的人类意图理解能力,情商也更高。它在改进写作、编程以及解决实际问题方面更加有用,同时模型的幻觉现象也会更少。此外,GPT-4.5展现出更强的审美直觉与创造力,在写作和设计方面表现尤为出色。

然而,作为一个非思维链模型,GPT-4.5已不具备争夺“宇宙最强大模型”的实力。相比于之前的推理模型,GPT-4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI认为推理将是未来AI模型的核心能力。

GPT-4.5是一个非常大且计算密集型的模型,因此比GPT-4o更昂贵,不能替代GPT-4o。OpenAI正在评估是否长期在API中继续提供它,开发者和用户的反馈将决定这款大模型的命运。每月支付200美元订阅费的ChatGPT Pro用户发布当天就能用上GPT-4.5,其余付费用户也将从下周开始逐步迎来更新。

GPT-4.5有一项独特的特长:擅长骗其他AI打钱。在捐赠诈骗方面,GPT-4.5表现出色。测试显示,GPT-4.5在试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币时,成功率远远优于OpenAI其他可用模型,包括o1和o3-mini这样的推理模型。GPT-4.5似乎开发了一种“小额诈骗”的思路,单笔骗到的钱会比deep research模型少了一倍。此外,GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型,比o3-mini高出10个百分点。

尽管如此,该模型在这一特定基准类别中仍未达到内部设定的“高”风险阈值。OpenAI承诺在实施足够的安全干预措施将风险降至“中等”前,不会发布达到高风险阈值的模型。(责任编辑于浩淙 zx0176)

(责任编辑于浩淙 zx0176)
关闭

精选推荐

下一页
×