模型發布
Claude、GPT、Gemini、Qwen、DeepSeek、Kimi 等大模型的發布與升級動態。
7月3日週五Research
使用 DSPy 評估並改進 Datasette Agent 的 SQL 系統提示詞一項研究使用 DSPy 對 Datasette Agent 的 SQL 系統提示詞進行評估與改進。
7月3日週五Model/API
Anthropic 將 Claude Code 的系統提示字數減少 80%Anthropic 由於 Fable 5 模型「想要更小的系統提示」,將 Claude Code 的系統提示字數削減了 80%。
7月2日週四Tools
Safari 新 MCP 服务器让编码代理检查并调试网站Safari 推出了新的 MCP 服务器,使编码代理能够检查和调试网站。
7月2日週四Tools
Claude Code v2.1.198 发布:Chrome 版正式可用、后台 Agent 通知、AWS 上游支持与多项修复Claude Code v2.1.198 使 Chrome 版 Claude 正式可用,新增后台 Agent 通知、/dataviz 技能、AWS 上游支持,并修复多项问题。
7月2日週四Model/API
Anthropic 在美國出口管制解除後於 7 月 1 日重新部署 Claude Fable 5,並新增網路安全分類器Anthropic 在美國出口管制解除後,於 7 月 1 日重新部署 Claude Fable 5,並新增一個安全分類器。
7月2日週四Tools
Google 2026年6月 AI 更新宣布Google 在 2026 年 6 月宣布了一系列最新的 AI 新聞。
7月1日週三Tools
Google 代理助手 Gemini Spark 現已支援 MacGoogle 的 24/7 代理助手 Gemini Spark 正式登陸 Mac。
7月1日週三Tools
Google 推出新智慧喇叭,但 Gemini 尚未準備好Google 推出新款智慧喇叭,但其 Gemini AI 尚未準備好支援該裝置。
7月1日週三Model/API
NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
7月1日週三Model/API
Google AI 推出 TabFM:用於零樣本分類與回歸的混合注意力表格基礎模型Google Research 發布了 TabFM,一個適用於表格資料的基礎模型,可透過上下文學習進行零樣本分類與回歸。
7月1日週三Tools
Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測使 Gemma 4 令牌生成速度提升近 90%Ollama v0.31.1 在 Apple Silicon 上利用多令牌預測技術顯著提升 Gemma 4 的推理速度。
7月1日週三Model/API
Anthropic 長期擱置的 Claude Fable 5 獲准回歸Anthropic 宣布在與特朗普政府協商數週後,Claude Fable 5 即將恢復上線。
7月1日週三Model/API
Anthropic:美國商務部解除 Claude Fable 5 和 Mythos 5 出口管制Anthropic 收到商務部通知,已解除對 Claude Fable 5 和 Mythos 5 的出口管制,明天開始恢復存取。
7月1日週三Tools
Anthropic 推出 Claude Science 旗艦產品Anthropic 宣布推出 Claude Science,這是一款支援科學研究的全新旗艦產品。
7月1日週三Model/API
Claude Sonnet 5 发布:新 tokenizer 提效但涨价 30%Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但价格更低,然而新 tokenizer 导致实际成本提升约 30%。
7月1日週三Tools
Claude Code 默认模型升级为 Claude Sonnet 5,原生支持百万 Token 上下文窗口Claude Code 升级至 v2.1.197,引入 Claude Sonnet 5 作为默认模型,拥有原生 100 万 Token 上下文窗口,并推出截至 8 月 31 日的促销定价。
6月30日週二Research
OpenAI 推出 GeneBench-Pro 基准测试,评估AI在基因组学等科学领域表现OpenAI 发布 GeneBench-Pro,这是一个使用复杂真实世界数据集测试AI在基因组学、生物学和科学研究中性能的新基准。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0:自構架 LLM 實現代理式編碼DeepReinforce 發布首個開源模型 Ornith-1.0,基於 Gemma 4 與 Qwen 3.5,在編碼基準測試中達到同級最佳表現。
6月27日週六Model/API
OpenAI 发布 GPT-5.6 Sol/Terra/Luna,仅限信任合作伙伴OpenAI 在同一日向 OAI 和 ANT 发布了分层的 GPT-5.6 Sol/Terra/Luna 模型。
6月27日週六Model/API
川普政府釋出 Anthropic Mythos,供超 100 家美國公司與機構使用川普政府授權超過 100 家美國公司與政府機構使用 Anthropic Mythos 5,包含非美國籍員工。
6月27日週六Model/API
Anthropic 向部分美國公司發布強大模型 MythosAnthropic 向部分美國公司獨家發布其強大模型 Mythos。
6月27日週六Research
前沿模型发布延迟侵蚀盈利窗口前沿模型发布延迟正侵蚀实验室在数月内收回巨额训练成本的短暂盈利窗口。
6月27日週六Model/API
OpenAI 預覽 GPT-5.6 系列:分層模型 Sol、Terra、Luna 與全新推理模式及有限存取OpenAI 推出 GPT-5.6 系列,包含 Sol、Terra、Luna 分層模型與 max/ultra 推理模式,目前僅限有限存取。
6月27日週六Model/API
OpenAI 發布 GPT-5.6 Sol 挑戰 Claude Mythos,但受政府限制引發不滿OpenAI 的新旗艦模型 GPT-5.6 Sol 在程式碼基準測試中擊敗 Anthropic 的 Claude Mythos 5,但美國政府強制限制其發布範圍,OpenAI 對此表示不滿。
6月27日週六Model/API
OpenAI 預覽下一代模型 GPT-5.6 SolOpenAI 預覽了下一代模型 GPT-5.6 Sol。
6月26日週五Model/API
AI新創Lindy全面改用Deepseek,CEO稱省下數百萬美元AI新創公司Lindy因AI成本超過人員成本,全面從Claude轉向Deepseek,並稱此舉爲業務生存關鍵。
6月26日週五Model/API
義大利 Domyn 一年內推出開源前沿 AI 模型義大利新創公司 Domyn 執行長宣布,將在一年內發布開源前沿 AI 模型。
6月26日週五Open Source
DeepReinforce 開源 Ornith-1.0 編碼模型,可自學強化學習支架DeepReinforce 發布 Ornith-1.0,一個基於 Gemma 4 和 Qwen 3.5 的開源編碼模型家族,能在強化學習中自學支架,397B 旗艦模型在 SWE-Bench Verified 上取得 82.4 分。
6月25日週四Tools
Gemini Spark:你的全天候个人AI助手Gemini Spark 作为一款 24/7 全天候个人 AI 代理发布并开放讨论。
6月25日週四Tools
Mistral 推出 OCR 4,將文件提取轉變為完整企業 AI 應用Mistral 發布 OCR 4,將文件提取轉型為完整的企業 AI 解決方案。
6月25日週四Model/API
OpenAI 更新 GPT-5.5 Instant,提升意圖識別與對話品質OpenAI 正在更新其最常用的 ChatGPT 模型 GPT-5.5 Instant,以提升對話品質。
6月25日週四Model/API
Google 將 Gemini 3.5 Pro 發佈推遲至 7 月Google 因調整其前沿 AI 模型而將 Gemini 3.5 Pro 的發佈推遲到 7 月。
6月25日週四Model/API
Gemini 3.5 Flash 引入计算机使用功能Google DeepMind 在 Gemini 3.5 Flash 中引入了计算机使用功能。
6月24日週三Model/API
Mistral OCR 4 發布:為 RAG、Agent 和企業搜尋提供可引用結構化輸出Mistral AI 於 2026 年 6 月 23 日發布 OCR 4,從純文字萃取轉變為結構化文件輸出,支援 170 種語言並可自託管容器運作。
6月24日週三Tools
Anthropic 推出 Claude Tag,將 AI 引入 Slack 掌握企業知識Anthropic 的新功能 Claude Tag 將 AI 助手直接整合到 Slack 中,學習組織對話與工作流程。
6月23日週二Tools
Mistral 发布 OCR 4:支持 170 种语言的企业文档 AIMistral OCR 4 是一款企业级文档 AI,支持 170 种语言、边界框和自托管部署。
6月23日週二Open Source
Prime Intellect 發布 prime-rl 0.6.0 用於訓練萬億參數 MoE 模型Prime Intellect 發布了開源框架 prime-rl 0.6.0,用於在萬億參數混合專家模型上進行非同步強化學習。
6月23日週二Tools
xAI 在 Grok Build 中推出 /goal 模式,支援長時間自主執行與內建驗證xAI 在 Grok Build 中推出 /goal 模式,可自主規劃、執行並驗證多步驟任務直至完成。
6月23日週二Model/API
Google 將 Interactions API 設為 Gemini 模型與代理的默認介面Google DeepMind 已將 Interactions API 設為 Gemini 模型和代理的默認介面,取代舊的 generateContent API。
6月22日週一Model/API
Sakana AI 推出 Fugu,協調多個 LLM 以匹配 Anthropic 的基準測試日本 AI 初創公司 Sakana AI 推出 Fugu,一個能夠即時協調多個 AI 模型的系統,以與 Anthropic 的 Fable 5 等領導者競爭。