中國模型
通義千問、DeepSeek、Kimi、智譜 GLM、MiniMax 等中國大模型動態。
7月2日週四Model/API
消息称美团内部全面限用豆包大模型消息称美团内部全面限用豆包大模型。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub CopilotKimi K2.5 代碼現已普遍可用於 GitHub Copilot。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0:自構架 LLM 實現代理式編碼DeepReinforce 發布首個開源模型 Ornith-1.0,基於 Gemma 4 與 Qwen 3.5,在編碼基準測試中達到同級最佳表現。
6月28日週日Model/API
Liquid AI 推出最小模型 LFM2.5-230M,支援多個推理框架與端側推理Liquid AI 發布了其最小模型 LFM2.5-230M,支援 llama.cpp、MLX、vLLM、SGLang 和 ONNX 等推理框架,可在 Galaxy S25 Ultra 上達到 213 tok/s 的推理速度。
6月27日週六Model/API
字節跳動擴散語言模型 iLLaDA 媲美 Qwen2.5字節跳動與人民大學合作推出 8B 參數擴散語言模型 iLLaDA,基礎表現可與 Qwen2.5 匹配。
6月26日週五Model/API
AI新創Lindy全面改用Deepseek,CEO稱省下數百萬美元AI新創公司Lindy因AI成本超過人員成本,全面從Claude轉向Deepseek,並稱此舉爲業務生存關鍵。
6月26日週五Open Source
DeepReinforce 開源 Ornith-1.0 編碼模型,可自學強化學習支架DeepReinforce 發布 Ornith-1.0,一個基於 Gemma 4 和 Qwen 3.5 的開源編碼模型家族,能在強化學習中自學支架,397B 旗艦模型在 SWE-Bench Verified 上取得 82.4 分。
6月25日週四Model/API
Snowflake CEO發現GLM-5.2成本僅Opus 4.7的五分之一,性能接近智譜AI的GLM-5.2在Snowflake基準測試中接近Claude Opus 4.7,但輸出成本僅五分之一。
6月24日週三Research
DFlash 推測解碼:並行生成整塊 Token,在 NVIDIA Blackwell 上實現最高 15 倍吞吐量提升UC San Diego 的 DFlash 用輕量級區塊擴散模型取代自回歸草稿生成,在單次前向傳播中並行生成整塊 token,實現推測解碼加速。
6月23日週二Open Source
Prime Intellect 發布 prime-rl 0.6.0 用於訓練萬億參數 MoE 模型Prime Intellect 發布了開源框架 prime-rl 0.6.0,用於在萬億參數混合專家模型上進行非同步強化學習。
6月20日週六Model/API
VibeThinker-3B:基於Qwen2.5-Coder-3B的3B密集推理模型,採用頻譜到信號後訓練流程VibeThinker-3B是一個3B參數的MIT許可推理模型,在可驗證基準上與DeepSeek V3.2和Kimi K2.5匹配。
6月19日週五Model/API
GLM-5.2 通過口碑測試,開源模型進入前沿GLM-5.2 通過眾人口碑測試,開源模型故事終於成為真正的邊疆故事。
6月18日週四Model/API
中國Z.ai實驗室發布GLM-5.2成為最強開源文本大型語言模型中國Z.ai實驗室於6月16日開源發布了具有7530億參數的文本輸入大型語言模型GLM-5.2。
6月17日週三Model/API
MiniMax推出基於混合專家模型的雙分支稀疏注意力機制MSAMiniMax發布了MSA,一種雙分支區塊稀疏注意力機制,能有效降低計算成本。
6月17日週三Model/API
Microsoft Copilot Cowork 轉向用量計費,可能採用 DeepSeekMicrosoft 正在考慮使用 DeepSeek V4 的精調版本作為 Copilot Cowork 的低成本模型選擇,並轉向用量計費。
6月17日週三Model/API
Qwen-RobotSuite:三款具體化AI模型實現視覺語言操作、視頻建模與導航Qwen團隊推出Qwen-RobotSuite,包括RobotManip、RobotWorld與RobotNav三款具體化AI模型,分別用於操作、視頻世界建模和導航。