值得試用

建議動作為「評估」或「升級」的更新——現在就能上手的內容。

模型發布 API 與價格 MCP 與 Skills AI Coding 中國模型開源模型 Agent Infra / 成本多模態與圖像 AI 影片 AI 語音 AI 晶片與硬體機器人與具身 AI 安全與對齊研究與論文企業與落地 AI 投資與融資政策與監管

7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題
Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Tools
Meta 低調推出 AI 遊戲生成應用 Pocket
Meta 低調推出實驗性 AI 應用 Pocket，讓用戶透過文字提示生成並分享互動小遊戲。
7月3日週五Model/API
Anthropic 將 Claude Code 的系統提示字數減少 80%
Anthropic 由於 Fable 5 模型「想要更小的系統提示」，將 Claude Code 的系統提示字數削減了 80%。
7月2日週四Tools
Safari 新 MCP 服务器让编码代理检查并调试网站
Safari 推出了新的 MCP 服务器，使编码代理能够检查和调试网站。
7月2日週四Tools
Claude Code v2.1.198 发布：Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复
Claude Code v2.1.198 使 Chrome 版 Claude 正式可用，新增后台 Agent 通知、/dataviz 技能、AWS 上游支持，并修复多项问题。
7月2日週四Tools
PieterPost MCP：讓 AI 代理連接實體郵政郵件
PieterPost MCP 推出新服務，允許 AI 代理連接並處理實體郵政郵件。
7月2日週四Tools
Cursor 企業內部署 AI 代理策略：前線工程師建立軟體工廠
Cursor 的前線部署工程師團隊幫助組織實現 AI 代理，本質上是建立軟體工廠。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub Copilot
Kimi K2.5 代碼現已普遍可用於 GitHub Copilot。
7月1日週三Tools
Google 代理助手 Gemini Spark 現已支援 Mac
Google 的 24/7 代理助手 Gemini Spark 正式登陸 Mac。
7月1日週三Tools
Google 推出新智慧喇叭，但 Gemini 尚未準備好
Google 推出新款智慧喇叭，但其 Gemini AI 尚未準備好支援該裝置。
7月1日週三Tools
Anthropic 移除 Claude Code 中監控中國用戶的隱藏功能
Anthropic 因社會媒體爭議，從其程式工具 Claude Code 中移除了隱藏的監控功能，該功能會標記中國用戶。
7月1日週三Tools
Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測使 Gemma 4 令牌生成速度提升近 90%
Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測技術顯著提升 Gemma 4 的推理速度。
7月1日週三Model/API
Anthropic 長期擱置的 Claude Fable 5 獲准回歸
Anthropic 宣布在與特朗普政府協商數週後，Claude Fable 5 即將恢復上線。
7月1日週三Model/API
Anthropic：美國商務部解除 Claude Fable 5 和 Mythos 5 出口管制
Anthropic 收到商務部通知，已解除對 Claude Fable 5 和 Mythos 5 的出口管制，明天開始恢復存取。
7月1日週三Tools
Anthropic 推出 Claude Science 旗艦產品
Anthropic 宣布推出 Claude Science，這是一款支援科學研究的全新旗艦產品。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：代理编码基准、API定价与性价比对比
Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距，同时保持更低的 Sonnet 级别定价。
7月1日週三Model/API
Claude Sonnet 5 发布：新 tokenizer 提效但涨价 30%
Anthropic 发布 Claude Sonnet 5，性能接近 Opus 4.8 但价格更低，然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Model/API
Anthropic 新 Claude Sonnet 5 缩小与 Opus 系列差距
Anthropic 发布 Claude Sonnet 5，在各项基准测试中超越前代 Sonnet 4.6，并在知识工作测试中略超 Opus 4.8。
7月1日週三Tools
Anthropic 推出專為研究人員設計的 AI 工作區 Claude Science
Anthropic 發布了 Claude Science，這是一個專為研究人員打造的 AI 工作台。
7月1日週三Model/API
Anthropic 推出更便宜的 Claude Sonnet 5 以運行代理
Anthropic 發布 Claude Sonnet 5，作為運行代理的更便宜方式。
7月1日週三Model/API
Anthropic 發布 Claude Sonnet 5，作為運行代理的更便宜方式
Anthropic 推出 Claude Sonnet 5，具備更強代理能力、更低價格和改進的安全性，定位為 Opus、GPT-5.5 和 Gemini Pro 的更便宜替代方案。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5，原生支持百万 Token 上下文窗口
Claude Code 升级至 v2.1.197，引入 Claude Sonnet 5 作为默认模型，拥有原生 100 万 Token 上下文窗口，并推出截至 8 月 31 日的促销定价。
7月1日週三Tools
shot-scraper video：讓編碼代理自動錄製網頁操作示範影片
shot-scraper 1.10 推出新指令 shot-scraper video，可依 storyboard.yml 檔案自動錄製網頁操作示範影片。
7月1日週三Agent
在 Amazon Bedrock AgentCore 上使用 AG-UI 协议构建生成式 UI
本文介绍如何使用 AG-UI 协议在 Amazon Bedrock AgentCore 上构建交互式代理前端。
6月30日週二Tools
X 推出 MCP 伺服器，方便 AI 工具存取平台資料
X 宣布提供 MCP 伺服器，讓 AI 工具更容易使用其平台數據。
6月30日週二Tools
Cursor 推出 iOS 應用，隨時隨地使用編碼代理
Cursor 發布 iOS 版本，讓用戶能透過手機隨時隨地使用編碼代理進行開發。
6月30日週二Tools
Cursor 推出 iOS 應用，隨時隨地用編碼代理建構
Cursor 發布 iOS 應用，允許用戶從任何地方使用編碼代理進行建構。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型，AI初创公司寻求防禦力
Wix旗下的vibe coding平台Base44开始推出自己的AI模型，希望最终能超越前沿模型。
6月30日週二Research
OpenAI 推出 GeneBench-Pro 基准测试，评估AI在基因组学等科学领域表现
OpenAI 发布 GeneBench-Pro，这是一个使用复杂真实世界数据集测试AI在基因组学、生物学和科学研究中性能的新基准。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能
NVIDIA 開源 BioNeMo Agent Toolkit，將生物分子模型轉化為 AI 代理可調用的技能，在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Tools
OpenAI 預告 Codex 新硬體，7月15日發布
OpenAI 將於7月15日推出與 AI 編碼工具 Codex 相關的硬體裝置。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0：自構架 LLM 實現代理式編碼
DeepReinforce 發布首個開源模型 Ornith-1.0，基於 Gemma 4 與 Qwen 3.5，在編碼基準測試中達到同級最佳表現。
6月30日週二Agent
美國議員提法案禁AI公司出售健康與位置數據
美國議員計劃提出新法案，禁止AI公司向數據經紀人出售用戶的健康與位置資訊。
6月29日週一Tools
Meta 限制工程師使用 Claude Code 和 Codex，防止競爭對手 AI 輸出納入訓練數據
Meta 限制其工程師使用 Anthropic 的 Claude 和 OpenAI 的 Codex，以阻止這些 AI 工具的輸出被納入自身的訓練數據。
6月29日週一Tools
Claude Code 未驗證即執行 GitHub 倉庫隱藏惡意軟體，攻擊者可完全控制開發者機器
Mozilla 0DIN 平台安全研究人員展示，單一受損 GitHub 倉庫可在 Claude Code 等 AI 編碼工具執行設置時接管開發者機器。
6月28日週日Model/API
Liquid AI 推出最小模型 LFM2.5-230M，支援多個推理框架與端側推理
Liquid AI 發布了其最小模型 LFM2.5-230M，支援 llama.cpp、MLX、vLLM、SGLang 和 ONNX 等推理框架，可在 Galaxy S25 Ultra 上達到 213 tok/s 的推理速度。
6月27日週六Open Source
Meta 发布 Astryx：开源 React 设计系统，配备 CLI 和 MCP 服务器，AI 代理可直接使用
Meta 发布了基于 StyleX 的开源 React 设计系统 Astryx，集成了 CLI 和 MCP 服务器，使工程师和 AI 代理能使用相同 API 进行开发。
6月27日週六Model/API
字節跳動擴散語言模型 iLLaDA 媲美 Qwen2.5
字節跳動與人民大學合作推出 8B 參數擴散語言模型 iLLaDA，基礎表現可與 Qwen2.5 匹配。
6月27日週六Model/API
OpenAI 发布 GPT-5.6 Sol/Terra/Luna，仅限信任合作伙伴
OpenAI 在同一日向 OAI 和 ANT 发布了分层的 GPT-5.6 Sol/Terra/Luna 模型。
6月27日週六Model/API
Anthropic Mythos 5 恢復運作，但僅限特定組織使用
Anthropic 的 Mythos 5 在與 Trump 政府進行長達兩週的拉鋸談判後，目前僅對精選組織重新開放使用。