API 與價格
模型 API 的能力變更、定價調整、token 與速率政策。
7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Tools
Weber 國慶日促銷:燒烤爐與煎盤價格創歷史新低Weber 在國慶日前對多款燒烤爐、煙燻爐、煎盤及配件提供大規模折扣,價格達歷史新低。
7月2日週四Tools
Scritty:每個 AI 編碼代理的共享可搜索記憶體Scritty 為每個 AI 編碼代理提供共享且可搜索的記憶體。
7月2日週四Agent
在AWS上構建無伺服器A2A閘道實現代理發現、路由與存取控制AWS Machine Learning Blog 發表文章,示範如何在 AWS 上建立無伺服器 A2A 閘道,透過路徑式路由 /agents/{agentId} 在單一網域下託管多個代理,且標準 A2A 客戶端無需修改即可運作。
7月1日週三Model/API
Claude Sonnet 5 隱藏漲價:每任務 token 消耗增 40%,實際成本翻倍Claude Sonnet 5 雖在部分任務上超越 Opus 4.8,但每任務 token 消耗增加約 40%,導致實際成本幾乎翻倍,延續 Anthropic 隱藏漲價的模式。
7月1日週三Model/API
NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8:代理编码基准、API定价与性价比对比Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距,同时保持更低的 Sonnet 级别定价。
7月1日週三Model/API
Claude Sonnet 5 发布:新 tokenizer 提效但涨价 30%Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但价格更低,然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Model/API
Anthropic 推出更便宜的 Claude Sonnet 5 以運行代理Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式。
7月1日週三Model/API
Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式Anthropic 推出 Claude Sonnet 5,具備更強代理能力、更低價格和改進的安全性,定位為 Opus、GPT-5.5 和 Gemini Pro 的更便宜替代方案。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5,原生支持百万 Token 上下文窗口Claude Code 升级至 v2.1.197,引入 Claude Sonnet 5 作为默认模型,拥有原生 100 万 Token 上下文窗口,并推出截至 8 月 31 日的促销定价。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型,AI初创公司寻求防禦力Wix旗下的vibe coding平台Base44开始推出自己的AI模型,希望最终能超越前沿模型。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0:自構架 LLM 實現代理式編碼DeepReinforce 發布首個開源模型 Ornith-1.0,基於 Gemma 4 與 Qwen 3.5,在編碼基準測試中達到同級最佳表現。
6月27日週六Open Source
Meta 发布 Astryx:开源 React 设计系统,配备 CLI 和 MCP 服务器,AI 代理可直接使用Meta 发布了基于 StyleX 的开源 React 设计系统 Astryx,集成了 CLI 和 MCP 服务器,使工程师和 AI 代理能使用相同 API 进行开发。
6月27日週六Tools
從 NVIDIA Open-SWE-Traces 構建監督式微調資料:軌跡解析、補丁分析、Token 預算與工具使用指標一篇教學文章介紹如何透過串流 Hugging Face 上的 NVIDIA Open-SWE-Traces 資料集,在 Google Colab 中高效處理代理式軟體工程軌跡,生成可用於微調的資料子集。
6月27日週六Tools
MRAgent 代理記憶系統將 Token 用量降低 27 倍MRAgent 通過優化 AI 代理記憶管理,將 Token 消耗最多減少 27 倍。
6月27日週六Model/API
OpenAI 推出 GPT‑5.6 系列模型:Sol、Terra 與 Luna 限時預覽OpenAI 開始 GPT‑5.6 系列(Sol、Terra、Luna)的有限預覽,計劃在數週內全面開放。
6月26日週五Model/API
OpenAI 內部 Codex 輸出量暴增:研究部門增長 56 倍自 2025 年 11 月以來,OpenAI 內部 Codex 輸出 token 數中位數在研究部門增長 56 倍。
6月26日週五Tools
GitHub Copilot 代理框架跨模型與任務的性能與效率評估GitHub 發布對 Copilot 代理框架在多重基準測試中表現與 token 效率的評估結果。
6月26日週五Research
微軟宣布8月Xbox全線漲價,Prime Day折扣仍在微軟宣佈所有Xbox型號將於8月漲價,這是不到一年內的第二次漲價。
6月26日週五Agent
改造而非重建:Agentic Overlays 改造傳統企業服務AWS 提出 agentic overlays 方案,將傳統 REST 服務轉變為支援 A2A 互動的智能體,並相容 MCP 協議。
6月25日週四Model/API
Google 推出實驗性自託管 API OpenRL 用於 LLM 後訓練微調Google 推出實驗性自託管 API OpenRL,用於 LLM 後訓練微調。
6月25日週四Model/API
Snowflake CEO發現GLM-5.2成本僅Opus 4.7的五分之一,性能接近智譜AI的GLM-5.2在Snowflake基準測試中接近Claude Opus 4.7,但輸出成本僅五分之一。
6月25日週四Tools
Figma 在 Config 2026 押注人類判斷,但畫布上的 AI 來自其他公司Figma 在 Config 2026 將畫布轉變為整合程式碼、動畫、著色器和 AI 代理的完整工作空間,但其 AI 能力來自 API 提供商,利潤受到擠壓,且其中一家提供商正在開發競爭性的設計工具。
6月24日週三Tools
使用 Graphify 和 NetworkX 將 Python 程式碼庫映射為知識圖譜本教學展示如何建立完全離線的 Graphify 管道,將多模組 Python 應用程式轉換為知識圖譜。
6月24日週三Research
DFlash 推測解碼:並行生成整塊 Token,在 NVIDIA Blackwell 上實現最高 15 倍吞吐量提升UC San Diego 的 DFlash 用輕量級區塊擴散模型取代自回歸草稿生成,在單次前向傳播中並行生成整塊 token,實現推測解碼加速。
6月24日週三Tools
AI記憶初創公司專注降低Token成本,融資9800萬美元一家專注於降低AI記憶Token成本的初創公司獲得9800萬美元融資。
6月24日週三Model/API
Mistral OCR 4 發布:為 RAG、Agent 和企業搜尋提供可引用結構化輸出Mistral AI 於 2026 年 6 月 23 日發布 OCR 4,從純文字萃取轉變為結構化文件輸出,支援 170 種語言並可自託管容器運作。
6月24日週三Tools
Prime Day 推出多款 4K 電視優惠Amazon Prime Day 期間,多款 2026 年新款 4K 電視推出折扣優惠。
6月23日週二Tools
專注降低Token成本的AI記憶初創公司融資9800萬美元一家專注於降低Token成本的AI記憶初創公司成功融資9800萬美元。
6月23日週二Tools
Transformers.js 實驗跨來源儲存 API在 Transformers.js 中實驗提議中的 Cross-Origin Storage API,探索瀏覽器端 AI 儲存新可能。
6月23日週二Tools
Stripe.Directory 上線:新的商家搜尋方式Stripe 推出 Stripe.Directory,讓用戶和 AI 代理在 Stripe 上搜尋商家。
6月23日週二Model/API
Google 將 Interactions API 設為 Gemini 模型與代理的默認介面Google DeepMind 已將 Interactions API 設為 Gemini 模型和代理的默認介面,取代舊的 generateContent API。
6月20日週六Tools
MCP 的真正價值在於將認證流程隔離在代理上下文之外Sean Lynch 指出 MCP 相較於 skills/CLI 的真正價值在於將認證流程隔離在代理上下文之外,甚至完全脫離 harness。
6月19日週五Tools
Amazon Bedrock AgentCore Harness 正式可用:兩步 API 呼叫,數秒內建立生產級 AI AgentAmazon Bedrock AgentCore Harness 正式推出,開發者只需兩個 API 呼叫就能在隔離環境中快速建立、執行並追蹤可生產的 AI Agent。
6月18日週四Model/API
中國Z.ai實驗室發布GLM-5.2成為最強開源文本大型語言模型中國Z.ai實驗室於6月16日開源發布了具有7530億參數的文本輸入大型語言模型GLM-5.2。
6月18日週四Model/API
Amazon SageMaker AI Async Inference 現支持內聯請求載荷Amazon SageMaker AI Async Inference 現可直接在 InvokeEndpointAsync API 請求體中傳送推理載荷,無需先上傳至 Amazon S3。
6月18日週四Tools
企業推動AI使用過度導致預算快速耗盡,正尋找投資回報率多家企業因推動AI使用過度,AI預算迅速耗盡,正努力摸索AI投資回報率。
6月17日週三Model/API
Microsoft Copilot Cowork 轉向用量計費,可能採用 DeepSeekMicrosoft 正在考慮使用 DeepSeek V4 的精調版本作為 Copilot Cowork 的低成本模型選擇,並轉向用量計費。