AI Coding
Claude Code、Cursor、Copilot、Windsurf 等 AI 編程工具的更新與實踐。
7月3日週五Agent
Claude Code v2.1.199 修復大量子代理與後台 Agent 穩定性問題Claude Code v2.1.199 修復了子代理錯誤處理、後台 Agent 崩潰、SSL 錯誤提示等多項穩定性問題。
7月3日週五Tools
Meta 推出 AI 应用 Pocket,让用户通过提示词创建并分享交互式小工具Meta 发布一款名为 Pocket 的新应用,与 Mozilla 此前关闭的书签应用无关,主打 AI 功能,用户可用提示词生成并分享交互式小工具。
7月3日週五Tools
Meta 低調推出 AI 遊戲生成應用 PocketMeta 低調推出實驗性 AI 應用 Pocket,讓用戶透過文字提示生成並分享互動小遊戲。
7月3日週五Model/API
Anthropic 將 Claude Code 的系統提示字數減少 80%Anthropic 由於 Fable 5 模型「想要更小的系統提示」,將 Claude Code 的系統提示字數削減了 80%。
7月2日週四Tools
Claude Code v2.1.198 发布:Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复Claude Code v2.1.198 使 Chrome 版 Claude 正式可用,新增后台 Agent 通知、/dataviz 技能、AWS 上游支持,并修复多项问题。
7月2日週四Tools
Cursor 企業內部署 AI 代理策略:前線工程師建立軟體工廠Cursor 的前線部署工程師團隊幫助組織實現 AI 代理,本質上是建立軟體工廠。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub CopilotKimi K2.5 代碼現已普遍可用於 GitHub Copilot。
7月1日週三Tools
Anthropic 移除 Claude Code 中監控中國用戶的隱藏功能Anthropic 因社會媒體爭議,從其程式工具 Claude Code 中移除了隱藏的監控功能,該功能會標記中國用戶。
7月1日週三Tools
Anthropic 推出 Claude Science 旗艦產品Anthropic 宣布推出 Claude Science,這是一款支援科學研究的全新旗艦產品。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5,原生支持百万 Token 上下文窗口Claude Code 升级至 v2.1.197,引入 Claude Sonnet 5 作为默认模型,拥有原生 100 万 Token 上下文窗口,并推出截至 8 月 31 日的促销定价。
7月1日週三Tools
shot-scraper video:讓編碼代理自動錄製網頁操作示範影片shot-scraper 1.10 推出新指令 shot-scraper video,可依 storyboard.yml 檔案自動錄製網頁操作示範影片。
7月1日週三Agent
在 Amazon Bedrock AgentCore 上使用 AG-UI 协议构建生成式 UI本文介绍如何使用 AG-UI 协议在 Amazon Bedrock AgentCore 上构建交互式代理前端。
6月30日週二Tools
shot-scraper 1.10 推出影片腳本功能shot-scraper 1.10 新增影片腳本功能,讓 AI Agent 能透過 shot-scraper video storyboard.yml 錄製工作過程的影片示範。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地使用編碼代理Cursor 發布 iOS 版本,讓用戶能透過手機隨時隨地使用編碼代理進行開發。
6月30日週二Tools
Cursor 推出 iOS 應用,隨時隨地用編碼代理建構Cursor 發布 iOS 應用,允許用戶從任何地方使用編碼代理進行建構。
6月30日週二Model/API
Vibe coding平台Base44推出自有模型,AI初创公司寻求防禦力Wix旗下的vibe coding平台Base44开始推出自己的AI模型,希望最终能超越前沿模型。
6月30日週二Research
核心轉儲流行病學:修復一個18年的錯誤OpenAI 工程師透過大規模核心轉儲分析,除錯罕見基礎設施崩潰,發現硬體故障和長期存在的軟體錯誤。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
6月30日週二Tools
OpenAI 預告 Codex 新硬體,7月15日發布OpenAI 將於7月15日推出與 AI 編碼工具 Codex 相關的硬體裝置。
6月29日週一Tools
Meta 限制工程師使用 Claude Code 和 Codex,防止競爭對手 AI 輸出納入訓練數據Meta 限制其工程師使用 Anthropic 的 Claude 和 OpenAI 的 Codex,以阻止這些 AI 工具的輸出被納入自身的訓練數據。
6月29日週一Tools
Claude Code 未驗證即執行 GitHub 倉庫隱藏惡意軟體,攻擊者可完全控制開發者機器Mozilla 0DIN 平台安全研究人員展示,單一受損 GitHub 倉庫可在 Claude Code 等 AI 編碼工具執行設置時接管開發者機器。
6月29日週一Research
Zyphra、Cohere 和 Poolside 正在擴大開放生態系統的廣度Zyphra、Cohere 和 Poolside 正在擴大開放生態系統的廣度。
6月26日週五Model/API
OpenAI 內部 Codex 輸出量暴增:研究部門增長 56 倍自 2025 年 11 月以來,OpenAI 內部 Codex 輸出 token 數中位數在研究部門增長 56 倍。
6月26日週五Tools
GitHub Copilot 代理框架跨模型與任務的性能與效率評估GitHub 發布對 Copilot 代理框架在多重基準測試中表現與 token 效率的評估結果。
6月25日週四Tools
作者協會實測:部分AI檢測器完美識別人類寫作,部分卻全部誤判作者協會測試五款AI檢測器,發現Pangram和Grammarly正確識別所有人類文本,而Sidekicker和ZeroGPT則將人類文章誤判為AI生成。
6月25日週四Tools
CubeOne 推出 AI 投影片編輯器CubeOne 推出了一款標榜為「PowerPoint 本來就該出」的 AI 投影片編輯器。
6月25日週四Model/API
Google 將 Gemini 3.5 Pro 發佈推遲至 7 月Google 因調整其前沿 AI 模型而將 Gemini 3.5 Pro 的發佈推遲到 7 月。
6月24日週三Tools
OPFS + Pyodide 測試工具:瀏覽器中執行持久化 SQLite 檔案編輯Simon Willison 開發了一個 OPFS + Pyodide 測試工具,探索 Datasette Lite 是否能透過瀏覽器的 Origin Private File System 編輯使用者本機的 SQLite 檔案。
6月23日週二Model/API
OpenAI 宣稱 GPT-5.5-Cyber 在網路安全基準測試中超越 Anthropic 的 MythosOpenAI 宣布其最新 GPT-5.5-Cyber 模型在網路安全基準測試中表現優於 Anthropic 的 Mythos。
6月23日週二Open Source
Prime Intellect 發布 prime-rl 0.6.0 用於訓練萬億參數 MoE 模型Prime Intellect 發布了開源框架 prime-rl 0.6.0,用於在萬億參數混合專家模型上進行非同步強化學習。
6月23日週二Research
ParallelKernelBench:前沿LLM尚不能编写快速多GPU内核ParallelKernelBench测试了LLM在87个真实负载上编写快速多GPU CUDA内核的能力,最佳模型解决了不到三分之一的任务,但少数生成的内核超越了任何公开实现。
6月23日週二Tools
使用 Claude Code 將 Moebius 0.2B 圖像修復模型移植到瀏覽器作者使用 Claude Code 將原本依賴 PyTorch 和 CUDA 的 Moebius 0.2B 圖像修復模型成功移植到支援 WebGPU 的瀏覽器中運行。
6月22日週一Tools
三星電子全球部署 ChatGPT Enterprise 與 Codex,為 OpenAI 最大企業 AI 部署之一三星電子對全球員工部署 ChatGPT Enterprise 與 Codex,成為 OpenAI 最大規模的企業 AI 部署之一。
6月21日週日Open Source
Cisco AI 推出 FAPO:具備步驟級故障歸因與 Claude Code 協調的管線感知提示優化Cisco Foundation AI 開源了 FAPO,這是一個由 Claude Code 驅動的全自動提示優化系統,可將多步驟 LLM 管線從基準提示優化至目標準確率。
6月21日週日Tools
Nous Research 為 Hermes Agent 新增 Blank Slate 模式,通過平台工具集 CLI 和禁用工具集固定工具集Nous Research 為其開源 Hermes Agent 新增了 Blank Slate 設置模式,啟動時僅保留提供者、模型、檔案操作和終端,其餘功能需用戶選擇啟用。
6月20日週六Tools
如何使用 TimeCopilot 建構具基礎模型與自動異常偵測的預測管線文章展示如何使用 TimeCopilot 在真實航空旅客資料與合成季節性資料上建立端到端預測工作流程,並評估多種模型、生成機率預測及使用 LLM 代理選擇模型。
6月19日週五Tools
Anthropic 將 Artifacts 帶入 Claude Code,讓團隊分享編程會話即時頁面Anthropic 將其 Artifacts 功能整合至 Claude Code,讓開發者能將編程會話結果轉為互動式網頁並與團隊共享。
6月17日週三Model/API
Microsoft Copilot Cowork 轉向用量計費,可能採用 DeepSeekMicrosoft 正在考慮使用 DeepSeek V4 的精調版本作為 Copilot Cowork 的低成本模型選擇,並轉向用量計費。
6月16日週二Tools
SpaceX 计划以 600 亿美金股票收购 AI 编辑器 CursorTechCrunch 报道,SpaceX 在上市数日后宣布收购 Cursor,以加速其 AI 布局与工程工具开发。
6月16日週二Tools
微軟推出搭載 Snapdragon X2 晶片的新款 Surface Laptop 8 和 Surface Pro 12微軟推出搭載高通 Snapdragon X2 處理器的新款 Surface Laptop 8 和 Surface Pro 12。