7月1日週三02:46Model/API

Anthropic 新 Claude Sonnet 5 缩小与 Opus 系列差距

Anthropic 推出 Claude Sonnet 5，该模型在所有基准测试中均胜过前代 Sonnet 4.6，并在 GDPval-AA v2 知识工作测试中以 1,618 分略超更大规模的 Opus 4.8。Anthropic 还指出，该模型在网络安全任务上的得分远低于美国政府目前封锁的模型，这可能是针对当前辩论而刻意释放的信号。

Decision Brief

變化Anthropic 发布 Claude Sonnet 5，在各项基准测试中超越前代 Sonnet 4.6，并在知识工作测试中略超 Opus 4.8。

為什麼重要模型性能对比影响 AI builder 对模型选型和成本效益的决策。

誰該關注依賴模型 API 的團隊

受影響技術棧Claude

建議動作評估

來源可信度中 · 可靠媒體或一手報導

摘要依據：官方/RSS 來源如果不是「已讀全文」，這條詳摘只基於公開可取得內容，不會假裝讀過受限原文。

查看原文

來源

The Decoder：AI News
The Decoder：AI News