26-04-08 04:08

Anthropic最强模型--神话( Mythos)最新消息来了

Anthropic那个炒了段时间的 Claude Mythos(神话)终于透底了。
官方没敢直接公测,而是搞了个 Glasswing(玻璃之翼)项目,专门去给各路科技大厂的底层关键系统查漏洞,20 多年的都给挖出来了了。
比目前旗舰 Opus 4.6 :
▪️ 代码:SWE-bench Pro暴涨了 24.4%,多模态代码项更是夸张地翻了一倍。
▪️ 推理:在“人类终极考试(HLE)”里带工具拿了 64.7%,理科金牌卷 GPQA 直接逼近 95%。
▪️ 效率:同样任务,不仅得分更高,耗的 Token 还少了整整 4.9 倍
目前还在画饼阶段。OPUS 4.6已经很逆天了, 很期待这个模型。

发布于 新加坡