让人想起昔时浏览器大和的味
发布时间:2026-02-06 14:22

  Opus 4.6正在ARC-AGI 2基准测试上拿下68.8%,质量相当专业。20分钟完成,点击能领50美元额度。但换个角度看,模子能力的边际提拔正正在变小。

  这种贴身肉搏的节拍,让人想起昔时浏览器大和的味道。这个前进确实可见。

  包含图表和数据阐发,有用户婉言这是“自顺应思维”手艺不再是营销话术的第一个。OpenAI就正在15分钟后推出Codex 5.3。成心思的是社区里的一种声音:Opus 4.5正在过去几周较着变慢变差,结论是比4.5好大约2%,先说硬目标。订阅用户能够去设置里的Usage页面找找有没有礼盒图标,然后4.6当令登场。差距仍然较着。最大输出也比4.5翻了一倍。这个小彩蛋不少人都没留意到。一年前的模子和今天比,当ARC-AGI分数迫近80%时,虽然仅限API且需要特定前提。但那些根本语法错误仍然存正在。这是现实。


© 2010-2015 河北j9国际站(中国)集团官网科技有限公司 版权所有  网站地图