值得試用
建議動作為「評估」或「升級」的更新——現在就能上手的內容。
7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Tools
Meta 低調推出 AI 遊戲生成應用 PocketMeta 低調推出實驗性 AI 應用 Pocket,讓用戶透過文字提示生成並分享互動小遊戲。
7月3日週五Model/API
Anthropic 將 Claude Code 的系統提示字數減少 80%Anthropic 由於 Fable 5 模型「想要更小的系統提示」,將 Claude Code 的系統提示字數削減了 80%。
7月2日週四Tools
Safari 新 MCP 服务器让编码代理检查并调试网站Safari 推出了新的 MCP 服务器,使编码代理能够检查和调试网站。
7月2日週四Tools
Claude Code v2.1.198 发布:Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复Claude Code v2.1.198 使 Chrome 版 Claude 正式可用,新增后台 Agent 通知、/dataviz 技能、AWS 上游支持,并修复多项问题。
7月2日週四Tools
PieterPost MCP:讓 AI 代理連接實體郵政郵件PieterPost MCP 推出新服務,允許 AI 代理連接並處理實體郵政郵件。
7月2日週四Tools
Cursor 企業內部署 AI 代理策略:前線工程師建立軟體工廠Cursor 的前線部署工程師團隊幫助組織實現 AI 代理,本質上是建立軟體工廠。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub CopilotKimi K2.5 代碼現已普遍可用於 GitHub Copilot。
7月1日週三Tools
Google 代理助手 Gemini Spark 現已支援 MacGoogle 的 24/7 代理助手 Gemini Spark 正式登陸 Mac。
7月1日週三Tools
Google 推出新智慧喇叭,但 Gemini 尚未準備好Google 推出新款智慧喇叭,但其 Gemini AI 尚未準備好支援該裝置。
7月1日週三Tools
Anthropic 移除 Claude Code 中監控中國用戶的隱藏功能Anthropic 因社會媒體爭議,從其程式工具 Claude Code 中移除了隱藏的監控功能,該功能會標記中國用戶。
7月1日週三Tools
Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測使 Gemma 4 令牌生成速度提升近 90%Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測技術顯著提升 Gemma 4 的推理速度。
7月1日週三Model/API
Anthropic 長期擱置的 Claude Fable 5 獲准回歸Anthropic 宣布在與特朗普政府協商數週後,Claude Fable 5 即將恢復上線。
7月1日週三Model/API
Anthropic:美國商務部解除 Claude Fable 5 和 Mythos 5 出口管制Anthropic 收到商務部通知,已解除對 Claude Fable 5 和 Mythos 5 的出口管制,明天開始恢復存取。
7月1日週三Tools
Anthropic 推出 Claude Science 旗艦產品Anthropic 宣布推出 Claude Science,這是一款支援科學研究的全新旗艦產品。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8:代理编码基准、API定价与性价比对比Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距,同时保持更低的 Sonnet 级别定价。
7月1日週三Model/API
Claude Sonnet 5 发布:新 tokenizer 提效但涨价 30%Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但价格更低,然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Model/API
Anthropic 新 Claude Sonnet 5 缩小与 Opus 系列差距Anthropic 发布 Claude Sonnet 5,在各项基准测试中超越前代 Sonnet 4.6,并在知识工作测试中略超 Opus 4.8。
7月1日週三Tools
Anthropic 推出專為研究人員設計的 AI 工作區 Claude ScienceAnthropic 發布了 Claude Science,這是一個專為研究人員打造的 AI 工作台。
7月1日週三Model/API
Anthropic 推出更便宜的 Claude Sonnet 5 以運行代理Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式。
7月1日週三Model/API
Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式Anthropic 推出 Claude Sonnet 5,具備更強代理能力、更低價格和改進的安全性,定位為 Opus、GPT-5.5 和 Gemini Pro 的更便宜替代方案。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5,原生支持百万 Token 上下文窗口Claude Code 升级至 v2.1.197,引入 Claude Sonnet 5 作为默认模型,拥有原生 100 万 Token 上下文窗口,并推出截至 8 月 31 日的促销定价。
7月1日週三Tools
shot-scraper video:讓編碼代理自動錄製網頁操作示範影片shot-scraper 1.10 推出新指令 shot-scraper video,可依 storyboard.yml 檔案自動錄製網頁操作示範影片。
7月1日週三Agent
在 Amazon Bedrock AgentCore 上使用 AG-UI 协议构建生成式 UI本文介绍如何使用 AG-UI 协议在 Amazon Bedrock AgentCore 上构建交互式代理前端。
6月30日週二Tools
X 推出 MCP 伺服器,方便 AI 工具存取平台資料X 宣布提供 MCP 伺服器,讓 AI 工具更容易使用其平台數據。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地使用編碼代理Cursor 發布 iOS 版本,讓用戶能透過手機隨時隨地使用編碼代理進行開發。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地用編碼代理建構Cursor 發布 iOS 應用,允許用戶從任何地方使用編碼代理進行建構。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型,AI初创公司寻求防禦力Wix旗下的vibe coding平台Base44开始推出自己的AI模型,希望最终能超越前沿模型。
6月30日週二Research
OpenAI 推出 GeneBench-Pro 基准测试,评估AI在基因组学等科学领域表现OpenAI 发布 GeneBench-Pro,这是一个使用复杂真实世界数据集测试AI在基因组学、生物学和科学研究中性能的新基准。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Tools
OpenAI 預告 Codex 新硬體,7月15日發布OpenAI 將於7月15日推出與 AI 編碼工具 Codex 相關的硬體裝置。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0:自構架 LLM 實現代理式編碼DeepReinforce 發布首個開源模型 Ornith-1.0,基於 Gemma 4 與 Qwen 3.5,在編碼基準測試中達到同級最佳表現。
6月30日週二Agent
美國議員提法案禁AI公司出售健康與位置數據美國議員計劃提出新法案,禁止AI公司向數據經紀人出售用戶的健康與位置資訊。
6月29日週一Tools
Meta 限制工程師使用 Claude Code 和 Codex,防止競爭對手 AI 輸出納入訓練數據Meta 限制其工程師使用 Anthropic 的 Claude 和 OpenAI 的 Codex,以阻止這些 AI 工具的輸出被納入自身的訓練數據。
6月29日週一Tools
Claude Code 未驗證即執行 GitHub 倉庫隱藏惡意軟體,攻擊者可完全控制開發者機器Mozilla 0DIN 平台安全研究人員展示,單一受損 GitHub 倉庫可在 Claude Code 等 AI 編碼工具執行設置時接管開發者機器。
6月28日週日Model/API
Liquid AI 推出最小模型 LFM2.5-230M,支援多個推理框架與端側推理Liquid AI 發布了其最小模型 LFM2.5-230M,支援 llama.cpp、MLX、vLLM、SGLang 和 ONNX 等推理框架,可在 Galaxy S25 Ultra 上達到 213 tok/s 的推理速度。
6月27日週六Open Source
Meta 发布 Astryx:开源 React 设计系统,配备 CLI 和 MCP 服务器,AI 代理可直接使用Meta 发布了基于 StyleX 的开源 React 设计系统 Astryx,集成了 CLI 和 MCP 服务器,使工程师和 AI 代理能使用相同 API 进行开发。
6月27日週六Model/API
字節跳動擴散語言模型 iLLaDA 媲美 Qwen2.5字節跳動與人民大學合作推出 8B 參數擴散語言模型 iLLaDA,基礎表現可與 Qwen2.5 匹配。
6月27日週六Model/API
OpenAI 发布 GPT-5.6 Sol/Terra/Luna,仅限信任合作伙伴OpenAI 在同一日向 OAI 和 ANT 发布了分层的 GPT-5.6 Sol/Terra/Luna 模型。
6月27日週六Model/API
Anthropic Mythos 5 恢復運作,但僅限特定組織使用Anthropic 的 Mythos 5 在與 Trump 政府進行長達兩週的拉鋸談判後,目前僅對精選組織重新開放使用。