AI 週報 · 2026 第 27 週
6/29 – 7/5 · 104 條關鍵更新,按熱度排序。
7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Research
使用 DSPy 評估並改進 Datasette Agent 的 SQL 系統提示詞一項研究使用 DSPy 對 Datasette Agent 的 SQL 系統提示詞進行評估與改進。
7月1日週三Tools
ScarfBench:為企業 Java 框架遷移基準測試 AI 代理ScarfBench 是一個用於基準測試 AI 代理在企業 Java 框架遷移任務中表現的新工具。
7月1日週三Tools
Ahmad Osman 谈本地 AI 为何正在追赶Ahmad Osman 在 AIEWF 工作坊后指出,从笔记本电脑到企业级基础设施,本地 AI 正在快速追赶。
7月1日週三Tools
AI Compass 測驗:回答29道題找到你的AI原型bambamramfan 推出 AI Compass 政治光譜風格測驗,透過29道題將受測者歸類為30種AI原型之一。
6月29日週一Research
Zyphra、Cohere 和 Poolside 正在擴大開放生態系統的廣度Zyphra、Cohere 和 Poolside 正在擴大開放生態系統的廣度。
7月2日週四Tools
Google 2026年6月 AI 更新宣布Google 在 2026 年 6 月宣布了一系列最新的 AI 新聞。
7月1日週三Model/API
Claude Sonnet 5 发布:新 tokenizer 提效但涨价 30%Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但价格更低,然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Tools
shot-scraper video:讓編碼代理自動錄製網頁操作示範影片shot-scraper 1.10 推出新指令 shot-scraper video,可依 storyboard.yml 檔案自動錄製網頁操作示範影片。
7月2日週四Tools
Cursor 企業內部署 AI 代理策略:前線工程師建立軟體工廠Cursor 的前線部署工程師團隊幫助組織實現 AI 代理,本質上是建立軟體工廠。
7月2日週四Agent
自研究:自我改进Agent背后的反馈循环Introspection联合创始人Roland Gavrilescu解释自研究、Agent“配方”、自我改进循环以及人类在软件工厂中的核心地位。
7月1日週三Model/API
Anthropic:美國商務部解除 Claude Fable 5 和 Mythos 5 出口管制Anthropic 收到商務部通知,已解除對 Claude Fable 5 和 Mythos 5 的出口管制,明天開始恢復存取。
6月29日週一Agent
Jon Udell 呼籲將 AI 代理視為團隊成員而非主導者Jon Udell 反對「人在迴路中」的說法,認為應翻轉敘事,將代理視為被邀請加入團隊的成員。
6月30日週二Model/API
DiScoFormer:一个跨分布的密度与得分统一TransformerDiScoFormer 是一个统一的Transformer架构,能同时估计密度函数和得分函数,并适用于多种分布。
6月30日週二Tools
將 Amazon Nova 2 Lite 與 Claude 搭配,實現成本最佳化的文件處理AWS 展示如何將 Amazon Nova 2 Lite 與 Anthropic 的 Claude Sonnet 4.6 組成兩模型管線,在 Amazon Bedrock 上以低成本大規模數位化掃描文件。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0:自構架 LLM 實現代理式編碼DeepReinforce 發布首個開源模型 Ornith-1.0,基於 Gemma 4 與 Qwen 3.5,在編碼基準測試中達到同級最佳表現。
7月1日週三Tools
Meta 計劃將多餘 AI 算力變現,進軍雲端基礎設施市場Meta 正開發雲端基礎設施業務,計劃出售 AI 算力與模型,與 AWS、Google Cloud、Azure 競爭。
7月2日週四Model/API
消息称美团内部全面限用豆包大模型消息称美团内部全面限用豆包大模型。
7月1日週三Agent
在 Amazon Bedrock AgentCore 上使用 AG-UI 协议构建生成式 UI本文介绍如何使用 AG-UI 协议在 Amazon Bedrock AgentCore 上构建交互式代理前端。
7月1日週三Tools
使用托管授权简化多账户访问 Amazon Bedrock 模型AWS 推出 Amazon Bedrock 托管授权功能,允许从中央账户订阅一次并将模型访问权限分发给整个组织。
7月1日週三Model/API
特朗普解除Anthropic的Mythos和Fable模型限制特朗普解除了对Anthropic的Mythos和Fable模型的限制,Anthropic将于7月1日开始恢复Fable的访问。
7月1日週三Model/API
Nvidia 競爭對手 Etched 以 50 億美元估值達成 10 億美元 AI 晶片銷售Nvidia 競爭對手 Etched 表示,其由自家晶片驅動的推理系統已簽訂 10 億美元合約,公司估值達 50 億美元。
6月29日週一Tools
Suno 推出 Spark 孵化器計畫,吸引獨立藝術家加入其 AI 平台Suno 發起 Spark 新孵化器計畫,為獨立音樂人提供補助、指導與行銷支持,目的是讓其 AI 生成音樂平台不只是玩具,更成為串流平台與新星培育地。
7月1日週三Model/API
Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式Anthropic 推出 Claude Sonnet 5,具備更強代理能力、更低價格和改進的安全性,定位為 Opus、GPT-5.5 和 Gemini Pro 的更便宜替代方案。
7月2日週四Model/API
Anthropic 在美國出口管制解除後於 7 月 1 日重新部署 Claude Fable 5,並新增網路安全分類器Anthropic 在美國出口管制解除後,於 7 月 1 日重新部署 Claude Fable 5,並新增一個安全分類器。
7月2日週四Agent
在AWS上構建無伺服器A2A閘道實現代理發現、路由與存取控制AWS Machine Learning Blog 發表文章,示範如何在 AWS 上建立無伺服器 A2A 閘道,透過路徑式路由 /agents/{agentId} 在單一網域下託管多個代理,且標準 A2A 客戶端無需修改即可運作。
6月29日週一Tools
惠普與OpenAI擴大戰略合作,推動企業AI部署惠普與OpenAI擴大Frontier戰略合作,將AI應用於客戶體驗、軟體開發和企業運營。
7月1日週三Model/API
Anthropic 長期擱置的 Claude Fable 5 獲准回歸Anthropic 宣布在與特朗普政府協商數週後,Claude Fable 5 即將恢復上線。
6月30日週二Agent
OpenClaw 发布手机伴侣应用,连接自托管 AI 代理网关OpenClaw 推出 iOS 和 Android 原生应用,作为伴侣节点,通过 WebSocket 将手机硬件接入自托管的 AI 代理网关。
6月30日週二Tools
Libby 應用將過濾 AI 生成的內容電子書借閱平台 OverDrive 的新任 CEO 表示,其旗下的 Libby 應用將開始過濾 AI 生成的內容。
7月2日週四Research
馬斯克否認 SpaceX AI 手機原型報導伊隆·馬斯克稱《華爾街日報》關於 SpaceX AI 手機原型的報導「完全錯誤」。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型,AI初创公司寻求防禦力Wix旗下的vibe coding平台Base44开始推出自己的AI模型,希望最终能超越前沿模型。
7月1日週三Tools
Linq 推出 iMessage Apps,將支付、票務、航班和遊戲整合進 iMessage 對話中Linq 推出 iMessage Apps,通過互動式 imessage_app 卡片,在 iMessage 對話中為智能體提供支付、票務、航班和遊戲功能。
7月1日週三Tools
Anthropic 推出 Claude Science 旗艦產品Anthropic 宣布推出 Claude Science,這是一款支援科學研究的全新旗艦產品。
6月30日週二Model/API
Meta 秘密測試 ChatGPT、Gemini 和 Character.AI 的未成年人危機提示Meta 以數千個未成年人視角的危機提示秘密測試了 ChatGPT、Gemini 和 Character.AI。
6月30日週二Research
Meta AI 發布 Brain2Qwerty v2:非侵入性 MEG 腦到文字管線,單詞準確率達 61%Meta AI 發布 Brain2Qwerty v2,這是一個非侵入性 MEG 腦到文字管線,單詞準確率達 61%,並開源訓練程式碼。
6月30日週二Agent
美國議員提法案禁AI公司出售健康與位置數據美國議員計劃提出新法案,禁止AI公司向數據經紀人出售用戶的健康與位置資訊。
6月30日週二Tools
shot-scraper 1.10 推出影片腳本功能shot-scraper 1.10 新增影片腳本功能,讓 AI Agent 能透過 shot-scraper video storyboard.yml 錄製工作過程的影片示範。
7月1日週三Model/API
Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8:代理编码基准、API定价与性价比对比Anthropic 的 Claude Sonnet 5 在代理编码任务上缩小了与 Opus 4.8 的差距,同时保持更低的 Sonnet 级别定价。
7月1日週三Tools
Anthropic 推出專為研究人員設計的 AI 工作區 Claude ScienceAnthropic 發布了 Claude Science,這是一個專為研究人員打造的 AI 工作台。
7月1日週三Tools
Netflix 在威利旺卡實境秀中使用 AI 生成的 Gene Wilder 聲音Netflix 在《威利旺卡》實境秀預告中使用 AI 生成的 Gene Wilder 聲音。
7月1日週三Model/API
Google 推出更快、更便宜的图像生成器 Nano Banana 2 LiteGoogle 更新其图像生成器,使其更快、更便宜,对创作者更有用。
7月1日週三Agent
SkillOpt:將智能體技能視為可訓練參數微軟研究團隊推出 SkillOpt,將智能體指令編輯轉化為訓練過程,在不改變模型權重的前提下提升行為可靠性。
6月29日週一Open Source
EverOS:開源Markdown優先的AI代理記憶運行時,具混合BM25+向量檢索與自我進化技能EverMind 開源了 EverOS,一個本地優先的記憶運行時,將AI代理記憶儲存為純Markdown,並透過SQLite和LanceDB索引,結合混合BM25+向量檢索、多模態攝取和自我進化技能。
7月2日週四Tools
Ashton Kutcher 離開 Sound Ventures,與 Morgan Beller 創辦新創投公司,聚焦 AI 基礎設施與能源Ashton Kutcher 離開專注 AI 實驗室的 Sound Ventures,與 Morgan Beller 共同創立新創投公司,投資 AI 基礎設施與能源領域。
7月2日週四Tools
使用Lift將研究PDF轉換為結構化JSON:可控、架構引導的欄位級評估本教程圍繞Lift構建了一個完整的PDF到結構化資料的工作流程,專注於可控評估而非一次性展示。
6月30日週二Tools
三星新款寬螢幕折疊機 Galaxy Z Fold 8 諜照曝光三星預計下月發表新一代折疊機, Android Headlines 流出 Galaxy Z Fold 8 等機型的外殼設計圖。
6月29日週一Tools
Meta 限制工程師使用 Claude Code 和 Codex,防止競爭對手 AI 輸出納入訓練數據Meta 限制其工程師使用 Anthropic 的 Claude 和 OpenAI 的 Codex,以阻止這些 AI 工具的輸出被納入自身的訓練數據。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
7月1日週三Model/API
OpenAI 據報將訪客 ChatGPT 使用者回應成本削減逾半OpenAI 將其 AI 模型推論成本削減逾半,並應用於 ChatGPT,使所需的 Nvidia GPU 數量有時降至僅數百個。
7月1日週三Tools
Google 推出新智慧喇叭,但 Gemini 尚未準備好Google 推出新款智慧喇叭,但其 Gemini AI 尚未準備好支援該裝置。
6月30日週二Research
兩度打敗馬斯克的律師亮相律師Bill Savitt在馬斯克訴奧特曼案中兩度擊敗馬斯克,並在法庭上讓馬斯克情緒失控。
6月30日週二Tools
OpenAI 預告 Codex 新硬體,7月15日發布OpenAI 將於7月15日推出與 AI 編碼工具 Codex 相關的硬體裝置。
7月1日週三Tools
Google NotebookLM 新增 TikTok 风格 AI 视频短片功能Google NotebookLM 推出新功能,可基于用户上传的资料生成 60 秒垂直 AI 视频短片。
6月30日週二Tools
Anthropic 與加州州長達成協議,允許加州政府以半價使用 ClaudeAnthropic 與加州州長紐森達成協議,讓加州政府能以半價使用 Claude。
7月1日週三Tools
使用 Amazon Bedrock 和 LLM 閘道實踐韌性模式AWS 部落格介紹五種韌性模式,從原生 Amazon Bedrock 功能到基於 LLM 閘道的多模型編排,以解決配額耗盡、可用性最大化及多租戶干擾等問題。
7月2日週四Tools
住宅建築AI初創公司Higharc完成9000萬美元C輪融資住宅建築AI初創公司Higharc獲得9000萬美元C輪融資。
7月2日週四Research
HippoRAG:使用 Amazon Bedrock、Neptune 和個人化 PageRank 實現神經生物學啟發的 RAGAWS 展示了如何使用 Amazon Bedrock、Neptune 和個人化 PageRank 實現神經生物學啟發的 RAG 系統 HippoRAG。
7月1日週三Tools
Google 代理助手 Gemini Spark 現已支援 MacGoogle 的 24/7 代理助手 Gemini Spark 正式登陸 Mac。
7月3日週五Agent
阿里巴巴 Page Agent:透過自然語言操控網頁的 JavaScript GUI Agent阿里巴巴推出 Page Agent,以客戶端 JavaScript 直接讀取 DOM 並執行自然語言指令,無需截圖或多模態模型。
7月3日週五Agent
微軟斥資25億美元成立「Frontier Company」,於企業客戶駐場6,000名AI工程師微軟投入25億美元成立新部門「Frontier Company」,直接派駐6,000名工程師到企業客戶端,以將AI整合至核心流程,確保可量測的ROI。
6月29日週一Tools
Claude Code 未驗證即執行 GitHub 倉庫隱藏惡意軟體,攻擊者可完全控制開發者機器Mozilla 0DIN 平台安全研究人員展示,單一受損 GitHub 倉庫可在 Claude Code 等 AI 編碼工具執行設置時接管開發者機器。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地用編碼代理建構Cursor 發布 iOS 應用,允許用戶從任何地方使用編碼代理進行建構。
7月1日週三Tools
Anthropic 移除 Claude Code 中監控中國用戶的隱藏功能Anthropic 因社會媒體爭議,從其程式工具 Claude Code 中移除了隱藏的監控功能,該功能會標記中國用戶。
7月3日週五Model/API
Anthropic 將 Claude Code 的系統提示字數減少 80%Anthropic 由於 Fable 5 模型「想要更小的系統提示」,將 Claude Code 的系統提示字數削減了 80%。
6月30日週二Agent
用 Amazon Bedrock 與 AWS HealthLake 打造代理式 AI 醫療索賠處理管線AWS 部落格展示如何結合 Amazon Bedrock Data Automation 與 AgentCore 建置自動化醫療索賠處理管線,將表單資料萃取為 FHIR 資源存入 HealthLake。
7月1日週三Model/API
Claude Sonnet 5 隱藏漲價:每任務 token 消耗增 40%,實際成本翻倍Claude Sonnet 5 雖在部分任務上超越 Opus 4.8,但每任務 token 消耗增加約 40%,導致實際成本幾乎翻倍,延續 Anthropic 隱藏漲價的模式。
7月1日週三Model/API
Anthropic 新 Claude Sonnet 5 缩小与 Opus 系列差距Anthropic 发布 Claude Sonnet 5,在各项基准测试中超越前代 Sonnet 4.6,并在知识工作测试中略超 Opus 4.8。
6月30日週二Research
利用合成資料與微調提升視覺AI代理準確度的三種工作流程NVIDIA 介紹三種透過合成資料與微調提升視覺 AI 代理準確度的工作流程。
7月1日週三Model/API
NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
7月1日週三Model/API
Google AI 推出 TabFM:用於零樣本分類與回歸的混合注意力表格基礎模型Google Research 發布了 TabFM,一個適用於表格資料的基礎模型,可透過上下文學習進行零樣本分類與回歸。
7月3日週五Open Source
Interfaze 開源 diffusion-gemma-asr-small,基於擴散的多語言 ASR 模型Interfaze 開源 diffusion-gemma-asr-small,這是一個使用擴散而非自回歸方式進行轉錄的多語言 ASR 模型。
7月2日週四Tools
Claude Code v2.1.198 发布:Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复Claude Code v2.1.198 使 Chrome 版 Claude 正式可用,新增后台 Agent 通知、/dataviz 技能、AWS 上游支持,并修复多项问题。
7月3日週五Tools
Amazon Bedrock 如何捕捉 AI 生成的釣魚郵件Amazon Bedrock 提出利用生成式 AI 與 OSINT 偵測高擬真釣魚郵件的方法。
7月3日週五Tools
Amazon SageMaker AI 多輪強化學習最佳實踐發布AWS 分享在 SageMaker AI 中進行可靠多輪 RL 訓練的最佳實踐,涵蓋環境構建、外部評估、獎勵設計、Agent 多次運行時的變化管理及監控指標。
7月2日週四Tools
Safari 新 MCP 服务器让编码代理检查并调试网站Safari 推出了新的 MCP 服务器,使编码代理能够检查和调试网站。
7月3日週五Tools
Meta 低調推出 AI 遊戲生成應用 PocketMeta 低調推出實驗性 AI 應用 Pocket,讓用戶透過文字提示生成並分享互動小遊戲。
7月2日週四Tools
Scritty:每個 AI 編碼代理的共享可搜索記憶體Scritty 為每個 AI 編碼代理提供共享且可搜索的記憶體。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地使用編碼代理Cursor 發布 iOS 版本,讓用戶能透過手機隨時隨地使用編碼代理進行開發。
7月2日週四Research
Digitas CEO 表示 AI 不會拯救廣告業Digitas 北美 CEO Amy Lanzi 在康城廣告節上表示,AI 並非廣告業的救星。
6月30日週二Tools
NVIDIA 提出三種合成資料與微調工作流程提升視覺 AI 代理準確度NVIDIA 部落格介紹三種利用合成資料和微調來提升視覺 AI 代理準確度的工作流程。
7月3日週五Tools
Meta 推出 AI 应用 Pocket,让用户通过提示词创建并分享交互式小工具Meta 发布一款名为 Pocket 的新应用,与 Mozilla 此前关闭的书签应用无关,主打 AI 功能,用户可用提示词生成并分享交互式小工具。
7月3日週五Tools
Weber 國慶日促銷:燒烤爐與煎盤價格創歷史新低Weber 在國慶日前對多款燒烤爐、煙燻爐、煎盤及配件提供大規模折扣,價格達歷史新低。
6月30日週二Research
OpenAI 推出 GeneBench-Pro 基准测试,评估AI在基因组学等科学领域表现OpenAI 发布 GeneBench-Pro,这是一个使用复杂真实世界数据集测试AI在基因组学、生物学和科学研究中性能的新基准。
7月3日週五Research
Kayne Anderson CEO 談 Bridgepoint 交易:AI 基礎設施與醫療房地產創造十年超級週期Bridgepoint 以 14 億美元押注美國房地產,Kayne Anderson 聯合創始人兼 CEO Al Rabil 表示這是在為「十年超級週期」做準備。
7月2日週四Tools
Meta 考慮推出雲端運算業務,從 AI 支出中獲利Meta 正考慮推出雲端運算業務,以從其 AI 支出中產生收入。
7月2日週四Tools
Anthropic 與三星洽談客製化 AI 晶片製造合作Anthropic 正與三星電子洽談,由三星作為其客製化 AI 晶片的製造合作夥伴。
7月1日週三Research
BAIR 2026 博士畢業生風采:AI 前沿研究者群像BAIR 實驗室慶祝 2026 年博士畢業生,其研究涵蓋機器人、大語言模型、AI 安全等領域。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub CopilotKimi K2.5 代碼現已普遍可用於 GitHub Copilot。
6月30日週二Research
核心轉儲流行病學:修復一個18年的錯誤OpenAI 工程師透過大規模核心轉儲分析,除錯罕見基礎設施崩潰,發現硬體故障和長期存在的軟體錯誤。
7月2日週四Tools
PieterPost MCP:讓 AI 代理連接實體郵政郵件PieterPost MCP 推出新服務,允許 AI 代理連接並處理實體郵政郵件。
6月30日週二Research
Together AI 在 ICML 2026 展示全棧前沿研究Together AI 在 ICML 2026 發表八篇全棧論文,並在首爾 B714 展位展出。
7月1日週三Tools
AI 影片搜索新創公司獲亞馬遜等創投 1 億美元融資一家 AI 影片搜尋新創公司從亞馬遜及創投基金募得 1 億美元資金。
7月1日週三Model/API
Anthropic 推出更便宜的 Claude Sonnet 5 以運行代理Anthropic 發布 Claude Sonnet 5,作為運行代理的更便宜方式。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5,原生支持百万 Token 上下文窗口Claude Code 升级至 v2.1.197,引入 Claude Sonnet 5 作为默认模型,拥有原生 100 万 Token 上下文窗口,并推出截至 8 月 31 日的促销定价。
7月1日週三Tools
RAG 上下文工程:四類輸入決定答案品質介紹 RAG 系統中四種關鍵的上下文輸入類型,以及它們如何影響答案生成。
6月29日週一Tools
加州州長宣布與Anthropic首創合作,為州機構提供AI工具加州州長紐森宣布一項首創合作,為加州州機構提供Anthropic的工具以改進服務。
7月1日週三Agent
微軟 SkillOpt 將 AI 代理技能轉化為可訓練資產微軟推出 SkillOpt,將 AI 代理技能轉化為可訓練資產。
6月30日週二Tools
X 推出 MCP 伺服器,方便 AI 工具存取平台資料X 宣布提供 MCP 伺服器,讓 AI 工具更容易使用其平台數據。
7月1日週三Tools
Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測使 Gemma 4 令牌生成速度提升近 90%Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測技術顯著提升 Gemma 4 的推理速度。
7月1日週三Tools
Solaris:企業AI採用與技能提升平台Solaris 提供一個企業AI採用與技能提升平台,幫助組織轉型。
7月1日週三Tools
多家公司利用未完全掌控的資料微調 AI 模型,引發風險擔憂企業正在使用不完全控制的數據進行 AI 模型微調。
6月30日週二Tools
Bamboo:AI 辅助 Markdown 笔记工具,完全由用户控制Bamboo 是一款让用户完全控制 AI 的 Markdown 笔记工具。
6月30日週二Agent
Needle:在 Slack 和 Teams 中主動出擊的 GTM 智能代理Needle 是一個在 Slack 和 Teams 中主動運作的 GTM 智能代理。