今日,Anthropic 最新小型模型 Claude Haiku 4.5 上線。價格僅為 Claude Sonnet 4 的三分之一,速度卻提升了一倍多。
Claude Haiku 4.5 還提升了編碼體驗的響應速度,在某些電腦任務上甚至超越了 Claude Sonnet 4。這些改進使得 Claude for Chrome 等應用程序比以往更實用。
總體性能雖比不上 Sonnet 4.5, 但 Claude Haiku 4.5 為那些希望獲得接近前沿性能且經濟高效的用戶提供了一個新的選擇。目前價格為每百萬輸入和輸出代幣 1/5 美元。
它還開辟了模型組合使用的新方式。例如,Sonnet 4.5 可以將一個復雜的問題分解成多個步驟的計劃,然后協調一個由多個 Haiku 4.5 組成的團隊并行完成子任務。
基準測試
在代理編碼領域,Haiku 4.5 的性能已經超過了 Sonnet 4 和 ChatGPT 5(high),達到 73.3% 的準確率。
在數學能力的測試中,Haiku 4.5 雖然成功率不及 ChatGPT 5 和 Sonnet 4,但其在使用工具的情況下也能達到 96.3% 的準確率。
視覺推理方面,Haiku 4.5 的能力就相對弱了些,是幾個模型中分數最低的。
但總體而言,用戶對 Haiku 4.5 的能力很滿意,紛紛給出好評。
最安全的模型
安全方面,Claude Haiku 4.5 表現出較低的令人擔憂的行為發生率,并且比 Claude Haiku 3.5 的一致性顯著提高。
在自動一致性評估中,Claude Haiku 4.5 的總體偏差行為發生率也顯著低于 Claude Sonnet 4.5 和 Claude Opus 4.1,因此,根據這一指標,Claude Haiku 4.5 是 Anthropic 迄今為止最安全的模型。
安全測試還表明,Claude Haiku 4.5 在生產化學、生物、放射性和核武器 (CBRN) 方面的風險有限。
Claude Haiku 4.5 現已在 Claude Code 和 Anthropic 的應用程序上線。開發人員可以在 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用 Claude Haiku 4.5。
參考資料: https://www.anthropic.com/news/claude-haiku-4-5