Agent
自主 Agent、tool use、computer use、multi-agent 與 agent 框架的進展。
7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Agent
阿里巴巴 Page Agent:透過自然語言操控網頁的 JavaScript GUI Agent阿里巴巴推出 Page Agent,以客戶端 JavaScript 直接讀取 DOM 並執行自然語言指令,無需截圖或多模態模型。
7月3日週五Research
使用 DSPy 評估並改進 Datasette Agent 的 SQL 系統提示詞一項研究使用 DSPy 對 Datasette Agent 的 SQL 系統提示詞進行評估與改進。
7月3日週五Tools
Amazon SageMaker AI 多輪強化學習最佳實踐發布AWS 分享在 SageMaker AI 中進行可靠多輪 RL 訓練的最佳實踐,涵蓋環境構建、外部評估、獎勵設計、Agent 多次運行時的變化管理及監控指標。
7月2日週四Tools
Scritty:每個 AI 編碼代理的共享可搜索記憶體Scritty 為每個 AI 編碼代理提供共享且可搜索的記憶體。
7月2日週四Agent
自研究:自我改进Agent背后的反馈循环Introspection联合创始人Roland Gavrilescu解释自研究、Agent“配方”、自我改进循环以及人类在软件工厂中的核心地位。
7月2日週四Tools
使用Lift將研究PDF轉換為結構化JSON:可控、架構引導的欄位級評估本教程圍繞Lift構建了一個完整的PDF到結構化資料的工作流程,專注於可控評估而非一次性展示。
7月2日週四Tools
Claude Code v2.1.198 发布:Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复Claude Code v2.1.198 使 Chrome 版 Claude 正式可用,新增后台 Agent 通知、/dataviz 技能、AWS 上游支持,并修复多项问题。
7月2日週四Agent
在AWS上構建無伺服器A2A閘道實現代理發現、路由與存取控制AWS Machine Learning Blog 發表文章,示範如何在 AWS 上建立無伺服器 A2A 閘道,透過路徑式路由 /agents/{agentId} 在單一網域下託管多個代理,且標準 A2A 客戶端無需修改即可運作。
7月1日週三Tools
Google 代理助手 Gemini Spark 現已支援 MacGoogle 的 24/7 代理助手 Gemini Spark 正式登陸 Mac。
7月1日週三Tools
Linq 推出 iMessage Apps,將支付、票務、航班和遊戲整合進 iMessage 對話中Linq 推出 iMessage Apps,通過互動式 imessage_app 卡片,在 iMessage 對話中為智能體提供支付、票務、航班和遊戲功能。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8:代理编码基准、API定价与性价比对比Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距,同时保持更低的 Sonnet 级别定价。
7月1日週三Tools
shot-scraper video:讓編碼代理自動錄製網頁操作示範影片shot-scraper 1.10 推出新指令 shot-scraper video,可依 storyboard.yml 檔案自動錄製網頁操作示範影片。
7月1日週三Agent
SkillOpt:將智能體技能視為可訓練參數微軟研究團隊推出 SkillOpt,將智能體指令編輯轉化為訓練過程,在不改變模型權重的前提下提升行為可靠性。
6月30日週二Tools
shot-scraper 1.10 推出影片腳本功能shot-scraper 1.10 新增影片腳本功能,讓 AI Agent 能透過 shot-scraper video storyboard.yml 錄製工作過程的影片示範。
6月30日週二Tools
NVIDIA 提出三種合成資料與微調工作流程提升視覺 AI 代理準確度NVIDIA 部落格介紹三種利用合成資料和微調來提升視覺 AI 代理準確度的工作流程。
6月30日週二Research
利用合成資料與微調提升視覺AI代理準確度的三種工作流程NVIDIA 介紹三種透過合成資料與微調提升視覺 AI 代理準確度的工作流程。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Agent
用 Amazon Bedrock 與 AWS HealthLake 打造代理式 AI 醫療索賠處理管線AWS 部落格展示如何結合 Amazon Bedrock Data Automation 與 AgentCore 建置自動化醫療索賠處理管線,將表單資料萃取為 FHIR 資源存入 HealthLake。
6月27日週六Tools
Receiptor AI 推出 Agent Mode:自動記帳代理模式Receiptor AI 發布 Agent Mode,實現無需人工介入的書面記錄。
6月27日週六Open Source
Meta 发布 Astryx:开源 React 设计系统,配备 CLI 和 MCP 服务器,AI 代理可直接使用Meta 发布了基于 StyleX 的开源 React 设计系统 Astryx,集成了 CLI 和 MCP 服务器,使工程师和 AI 代理能使用相同 API 进行开发。
6月27日週六Agent
Perplexity 推出 Computer for Counsel:面向法律工作流程的多模型 Agent 层Perplexity 发布 Computer for Counsel,将 Perplexity Computer 扩展至法律团队,可路由 20 多个模型并生成可验证的引用输出。
6月26日週五Agent
在 Google Colab 中構建 Nanobot 風格的 AI Agent:工具呼叫、對話記憶、技能與 MCP 伺服器本教程講解如何在 Google Colab 中從零構建輕量級個人 AI Agent,包含工具註冊、對話記憶、生命週期鉤子、技能和 MCP 風格的工具伺服器。
6月26日週五Tools
GitHub Copilot 代理框架跨模型與任務的性能與效率評估GitHub 發布對 Copilot 代理框架在多重基準測試中表現與 token 效率的評估結果。
6月26日週五Agent
改造而非重建:Agentic Overlays 改造傳統企業服務AWS 提出 agentic overlays 方案,將傳統 REST 服務轉變為支援 A2A 互動的智能體,並相容 MCP 協議。
6月26日週五Agent
AWS 發佈 Chaplin:用 Amazon Bedrock AI Agent 實現自服務健康分析AWS 推出開源解決方案 Chaplin,基於 Amazon Bedrock 的 AI Agent 透過 MCP 協定提供自服務健康事件分析。
6月25日週四Tools
Databricks技術領袖暢談開放生態系統對構建Agent Cloud的重要性Databricks的Matei Zaharia和Reynold Xin在罕見的雙人訪談中討論了為何每個公司都需開放的前沿生態系統來構建Agent Cloud。
6月25日週四Model/API
Gemini 3.5 Flash 引入计算机使用功能Google DeepMind 在 Gemini 3.5 Flash 中引入了计算机使用功能。
6月25日週四Agent
亞馬遜將在 VB Transform 2026 展示可信 AI Agent 框架亞馬遜將在 VB Transform 2026 大會上展示其建構可信 AI Agent 的框架。
6月24日週三Tools
Nous Research 為 Hermes Agent 技能系統新增 /learn,無需手寫 SKILL.md 即可捕獲工作流程為斜線命令Nous Research 在 Hermes Agent 的技能系統中新增了 /learn 命令,能從本地目錄、文檔 URL、過往對話或筆記自動生成符合標準的 SKILL.md 文件,無需手寫或額外的攝取引擎。
6月24日週三Model/API
Mistral OCR 4 發布:為 RAG、Agent 和企業搜尋提供可引用結構化輸出Mistral AI 於 2026 年 6 月 23 日發布 OCR 4,從純文字萃取轉變為結構化文件輸出,支援 170 種語言並可自託管容器運作。
6月24日週三Tools
Anthropic 推出 Claude Tag,將 AI 引入 Slack 掌握企業知識Anthropic 的新功能 Claude Tag 將 AI 助手直接整合到 Slack 中,學習組織對話與工作流程。
6月23日週二Tools
Clarify 推出「客戶關係代理」功能,讓 CRM 不再需要你手動管理Clarify 發布了 Customer Relationship Agents,讓 AI 代理自動管理客戶關係,減少人工操作。
6月23日週二Model/API
Sakana AI 推出 Sakana Fugu:跨可交换前沿大模型路由任务的编排模型Sakana AI 发布 Sakana Fugu 和 Fugu Ultra,通过可交换模型池路由任务,在多数编码、推理和智能体基准中领先。
6月23日週二Tools
在 Amazon SageMaker AI 處理任務上運行 ComfyUI 工作流程AWS 發布了如何在 Amazon SageMaker AI 處理任務上部署 ComfyUI 工作流程以批量生成高質量圖像的指南。
6月22日週一Tools
Bluerails Discovery:AI智能体的发现与支付轨道Bluerails Discovery 提供AI智能体用于发现并与你建立联系和支付的通道。
6月21日週日Tools
Crawlee for Python:構建包含機器人處理、鏈接圖譜和 RAG 區塊導出的網頁爬取管道本文教程演示如何使用 Crawlee for Python 從設置到生成 AI 就緒輸出,構建完整的網頁爬取工作流。
6月21日週日Tools
Nous Research 為 Hermes Agent 新增 Blank Slate 模式,通過平台工具集 CLI 和禁用工具集固定工具集Nous Research 為其開源 Hermes Agent 新增了 Blank Slate 設置模式,啟動時僅保留提供者、模型、檔案操作和終端,其餘功能需用戶選擇啟用。
6月20日週六Tools
如何使用 TimeCopilot 建構具基礎模型與自動異常偵測的預測管線文章展示如何使用 TimeCopilot 在真實航空旅客資料與合成季節性資料上建立端到端預測工作流程,並評估多種模型、生成機率預測及使用 LLM 代理選擇模型。
6月19日週五Tools
Salesforce CodeGen 教程:生成、验证和重排 Python 函数教程实现 Salesforce CodeGen 从 Hugging Face 加载的端到端工作流,包括函数提取、语法检查、安全检查和单元测试验证。