API 與價格

模型 API 的能力變更、定價調整、token 與速率政策。

模型發布 MCP 與 Skills AI Coding 中國模型開源模型 Agent Infra / 成本多模態與圖像 AI 影片 AI 語音 AI 晶片與硬體機器人與具身 AI 安全與對齊研究與論文企業與落地 AI 投資與融資政策與監管值得試用

7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題
Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Tools
Weber 國慶日促銷：燒烤爐與煎盤價格創歷史新低
Weber 在國慶日前對多款燒烤爐、煙燻爐、煎盤及配件提供大規模折扣，價格達歷史新低。
7月2日週四Tools
Scritty：每個 AI 編碼代理的共享可搜索記憶體
Scritty 為每個 AI 編碼代理提供共享且可搜索的記憶體。
7月2日週四Agent
在AWS上構建無伺服器A2A閘道實現代理發現、路由與存取控制
AWS Machine Learning Blog 發表文章，示範如何在 AWS 上建立無伺服器 A2A 閘道，透過路徑式路由 /agents/{agentId} 在單一網域下託管多個代理，且標準 A2A 客戶端無需修改即可運作。
7月1日週三Model/API
Claude Sonnet 5 隱藏漲價：每任務 token 消耗增 40%，實際成本翻倍
Claude Sonnet 5 雖在部分任務上超越 Opus 4.8，但每任務 token 消耗增加約 40%，導致實際成本幾乎翻倍，延續 Anthropic 隱藏漲價的模式。
7月1日週三Model/API
NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型
NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：代理编码基准、API定价与性价比对比
Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距，同时保持更低的 Sonnet 级别定价。
7月1日週三Model/API
Claude Sonnet 5 发布：新 tokenizer 提效但涨价 30%
Anthropic 发布 Claude Sonnet 5，性能接近 Opus 4.8 但价格更低，然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Model/API
Anthropic 推出更便宜的 Claude Sonnet 5 以運行代理
Anthropic 發布 Claude Sonnet 5，作為運行代理的更便宜方式。
7月1日週三Model/API
Anthropic 發布 Claude Sonnet 5，作為運行代理的更便宜方式
Anthropic 推出 Claude Sonnet 5，具備更強代理能力、更低價格和改進的安全性，定位為 Opus、GPT-5.5 和 Gemini Pro 的更便宜替代方案。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5，原生支持百万 Token 上下文窗口
Claude Code 升级至 v2.1.197，引入 Claude Sonnet 5 作为默认模型，拥有原生 100 万 Token 上下文窗口，并推出截至 8 月 31 日的促销定价。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型，AI初创公司寻求防禦力
Wix旗下的vibe coding平台Base44开始推出自己的AI模型，希望最终能超越前沿模型。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能
NVIDIA 開源 BioNeMo Agent Toolkit，將生物分子模型轉化為 AI 代理可調用的技能，在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0：自構架 LLM 實現代理式編碼
DeepReinforce 發布首個開源模型 Ornith-1.0，基於 Gemma 4 與 Qwen 3.5，在編碼基準測試中達到同級最佳表現。
6月27日週六Open Source
Meta 发布 Astryx：开源 React 设计系统，配备 CLI 和 MCP 服务器，AI 代理可直接使用
Meta 发布了基于 StyleX 的开源 React 设计系统 Astryx，集成了 CLI 和 MCP 服务器，使工程师和 AI 代理能使用相同 API 进行开发。
6月27日週六Tools
從 NVIDIA Open-SWE-Traces 構建監督式微調資料：軌跡解析、補丁分析、Token 預算與工具使用指標
一篇教學文章介紹如何透過串流 Hugging Face 上的 NVIDIA Open-SWE-Traces 資料集，在 Google Colab 中高效處理代理式軟體工程軌跡，生成可用於微調的資料子集。
6月27日週六Tools
MRAgent 代理記憶系統將 Token 用量降低 27 倍
MRAgent 通過優化 AI 代理記憶管理，將 Token 消耗最多減少 27 倍。
6月27日週六Model/API
OpenAI 推出 GPT‑5.6 系列模型：Sol、Terra 與 Luna 限時預覽
OpenAI 開始 GPT‑5.6 系列（Sol、Terra、Luna）的有限預覽，計劃在數週內全面開放。
6月26日週五Model/API
OpenAI 內部 Codex 輸出量暴增：研究部門增長 56 倍
自 2025 年 11 月以來，OpenAI 內部 Codex 輸出 token 數中位數在研究部門增長 56 倍。
6月26日週五Tools
GitHub Copilot 代理框架跨模型與任務的性能與效率評估
GitHub 發布對 Copilot 代理框架在多重基準測試中表現與 token 效率的評估結果。
6月26日週五Research
微軟宣布8月Xbox全線漲價，Prime Day折扣仍在
微軟宣佈所有Xbox型號將於8月漲價，這是不到一年內的第二次漲價。
6月26日週五Agent
改造而非重建：Agentic Overlays 改造傳統企業服務
AWS 提出 agentic overlays 方案，將傳統 REST 服務轉變為支援 A2A 互動的智能體，並相容 MCP 協議。
6月25日週四Model/API
Google 推出實驗性自託管 API OpenRL 用於 LLM 後訓練微調
Google 推出實驗性自託管 API OpenRL，用於 LLM 後訓練微調。
6月25日週四Model/API
Snowflake CEO發現GLM-5.2成本僅Opus 4.7的五分之一，性能接近
智譜AI的GLM-5.2在Snowflake基準測試中接近Claude Opus 4.7，但輸出成本僅五分之一。
6月25日週四Tools
Figma 在 Config 2026 押注人類判斷，但畫布上的 AI 來自其他公司
Figma 在 Config 2026 將畫布轉變為整合程式碼、動畫、著色器和 AI 代理的完整工作空間，但其 AI 能力來自 API 提供商，利潤受到擠壓，且其中一家提供商正在開發競爭性的設計工具。
6月24日週三Tools
使用 Graphify 和 NetworkX 將 Python 程式碼庫映射為知識圖譜
本教學展示如何建立完全離線的 Graphify 管道，將多模組 Python 應用程式轉換為知識圖譜。
6月24日週三Research
DFlash 推測解碼：並行生成整塊 Token，在 NVIDIA Blackwell 上實現最高 15 倍吞吐量提升
UC San Diego 的 DFlash 用輕量級區塊擴散模型取代自回歸草稿生成，在單次前向傳播中並行生成整塊 token，實現推測解碼加速。
6月24日週三Tools
AI記憶初創公司專注降低Token成本，融資9800萬美元
一家專注於降低AI記憶Token成本的初創公司獲得9800萬美元融資。
6月24日週三Model/API
Mistral OCR 4 發布：為 RAG、Agent 和企業搜尋提供可引用結構化輸出
Mistral AI 於 2026 年 6 月 23 日發布 OCR 4，從純文字萃取轉變為結構化文件輸出，支援 170 種語言並可自託管容器運作。
6月24日週三Tools
Prime Day 推出多款 4K 電視優惠
Amazon Prime Day 期間，多款 2026 年新款 4K 電視推出折扣優惠。
6月23日週二Tools
專注降低Token成本的AI記憶初創公司融資9800萬美元
一家專注於降低Token成本的AI記憶初創公司成功融資9800萬美元。
6月23日週二Tools
Transformers.js 實驗跨來源儲存 API
在 Transformers.js 中實驗提議中的 Cross-Origin Storage API，探索瀏覽器端 AI 儲存新可能。
6月23日週二Tools
Stripe.Directory 上線：新的商家搜尋方式
Stripe 推出 Stripe.Directory，讓用戶和 AI 代理在 Stripe 上搜尋商家。
6月23日週二Model/API
Google 將 Interactions API 設為 Gemini 模型與代理的默認介面
Google DeepMind 已將 Interactions API 設為 Gemini 模型和代理的默認介面，取代舊的 generateContent API。
6月20日週六Tools
MCP 的真正價值在於將認證流程隔離在代理上下文之外
Sean Lynch 指出 MCP 相較於 skills/CLI 的真正價值在於將認證流程隔離在代理上下文之外，甚至完全脫離 harness。
6月19日週五Tools
Amazon Bedrock AgentCore Harness 正式可用：兩步 API 呼叫，數秒內建立生產級 AI Agent
Amazon Bedrock AgentCore Harness 正式推出，開發者只需兩個 API 呼叫就能在隔離環境中快速建立、執行並追蹤可生產的 AI Agent。
6月18日週四Model/API
中國Z.ai實驗室發布GLM-5.2成為最強開源文本大型語言模型
中國Z.ai實驗室於6月16日開源發布了具有7530億參數的文本輸入大型語言模型GLM-5.2。
6月18日週四Model/API
Amazon SageMaker AI Async Inference 現支持內聯請求載荷
Amazon SageMaker AI Async Inference 現可直接在 InvokeEndpointAsync API 請求體中傳送推理載荷，無需先上傳至 Amazon S3。
6月18日週四Tools
企業推動AI使用過度導致預算快速耗盡，正尋找投資回報率
多家企業因推動AI使用過度，AI預算迅速耗盡，正努力摸索AI投資回報率。
6月17日週三Model/API
Microsoft Copilot Cowork 轉向用量計費，可能採用 DeepSeek
Microsoft 正在考慮使用 DeepSeek V4 的精調版本作為 Copilot Cowork 的低成本模型選擇，並轉向用量計費。