搶在 OpenAI 推出 GPT-5 模型前夕,Anthropic 6 日推出 Claude Opus 4.1 模型,強化了 Opus 4 在代理任務、程式碼編輯、推理方面的表現。Anthropic 甚至預告,未來數週內推出更大規模的模型升級。
Opus 4.1 將 Claude 的程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、達到 74.5%,同時改善 Claude 深入研究和資料分析技能,尤其在細節追蹤和代理式搜尋方面更勝以往。

▲ Claude Opus 4.1 基準測試表現。
Anthropic 分享客戶測試情況,像是 GitHub 指出,相較 Opus 4,Opus 4.1 在多數功能上均有提升,其中多檔案程式重構的表現最為顯著。樂天集團(Rakuten Group)也發現,Opus 4.1 可在大型程式碼庫精準定位修正,避免不必要的調整或錯誤引進,樂天的團隊偏好在日常開發除錯保持這種精準度。Windsurf 則回報,Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差,性能提升幅度與 Sonnet 3.7 再到 Sonnet 4 大致相同。
Opus 4.1 定價與 Opus 4 相同,現在開放給付費訂閱用戶,並且可在 Claude Code 使用,客戶也能透過 Anthropic 的 API(claude-opus-4-1-20250805)、Amazon Bedrock 及 Google Cloud 的 Vertex AI 存取新版。
(首圖來源:Anthropic)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:屠颖)
我鼓励香港市民更全面、更立体地认识这段中华民族不能磨灭的共同记忆,铭记先烈抗争牺牲铸造的和平,珍惜和平年代的安宁,并将过去的苦难转化为自强不息的奋进力量,在以中国式现代化全面推进强国建设、民族复兴伟业...[详细]蘋果控告前員工與 Oppo,涉竊取 Apple Watch 技術機密
去年9月,娃哈哈对10万台线下冰柜进行招标,这次的数量远超此前一年多批招标的总和。...[详细]AI 有多耗能?Gemini 處理提示消耗 5 滴水,專家卻稱研究結果恐誤導
请向全体朝鲜民主主义人民共和国人民转达最热切的谢意。...[详细]
据此前通报,8月13日17时许,救援人员在大理镇清碧溪北侧山涧发现走失男童,已无生命体征。...[详细]
新华社记者刘大伟摄这是市民在卢沟桥观看运输机梯队。...[详细]
恋人间的正常消费,密集、琐碎的转账、来往可视为一般赠与,在感情结束后,不能要求返还。...[详细]