中國模型

通義千問、DeepSeek、Kimi、智譜 GLM、MiniMax 等中國大模型動態。

模型發布 API 與價格 MCP 與 Skills AI Coding 開源模型 Agent Infra / 成本多模態與圖像 AI 影片 AI 語音 AI 晶片與硬體機器人與具身 AI 安全與對齊研究與論文企業與落地 AI 投資與融資政策與監管值得試用

7月2日週四Model/API
消息称美团内部全面限用豆包大模型
消息称美团内部全面限用豆包大模型。
7月2日週四Tools
Kimi K2.5 代碼現已正式集成至 GitHub Copilot
Kimi K2.5 代碼現已普遍可用於 GitHub Copilot。
6月30日週二Open Source
DeepReinforce 發布 Ornith-1.0：自構架 LLM 實現代理式編碼
DeepReinforce 發布首個開源模型 Ornith-1.0，基於 Gemma 4 與 Qwen 3.5，在編碼基準測試中達到同級最佳表現。
6月28日週日Model/API
Liquid AI 推出最小模型 LFM2.5-230M，支援多個推理框架與端側推理
Liquid AI 發布了其最小模型 LFM2.5-230M，支援 llama.cpp、MLX、vLLM、SGLang 和 ONNX 等推理框架，可在 Galaxy S25 Ultra 上達到 213 tok/s 的推理速度。
6月27日週六Model/API
字節跳動擴散語言模型 iLLaDA 媲美 Qwen2.5
字節跳動與人民大學合作推出 8B 參數擴散語言模型 iLLaDA，基礎表現可與 Qwen2.5 匹配。
6月26日週五Model/API
AI新創Lindy全面改用Deepseek，CEO稱省下數百萬美元
AI新創公司Lindy因AI成本超過人員成本，全面從Claude轉向Deepseek，並稱此舉爲業務生存關鍵。
6月26日週五Open Source
DeepReinforce 開源 Ornith-1.0 編碼模型，可自學強化學習支架
DeepReinforce 發布 Ornith-1.0，一個基於 Gemma 4 和 Qwen 3.5 的開源編碼模型家族，能在強化學習中自學支架，397B 旗艦模型在 SWE-Bench Verified 上取得 82.4 分。
6月25日週四Model/API
Snowflake CEO發現GLM-5.2成本僅Opus 4.7的五分之一，性能接近
智譜AI的GLM-5.2在Snowflake基準測試中接近Claude Opus 4.7，但輸出成本僅五分之一。
6月24日週三Research
DFlash 推測解碼：並行生成整塊 Token，在 NVIDIA Blackwell 上實現最高 15 倍吞吐量提升
UC San Diego 的 DFlash 用輕量級區塊擴散模型取代自回歸草稿生成，在單次前向傳播中並行生成整塊 token，實現推測解碼加速。
6月23日週二Open Source
Prime Intellect 發布 prime-rl 0.6.0 用於訓練萬億參數 MoE 模型
Prime Intellect 發布了開源框架 prime-rl 0.6.0，用於在萬億參數混合專家模型上進行非同步強化學習。
6月20日週六Model/API
VibeThinker-3B：基於Qwen2.5-Coder-3B的3B密集推理模型，採用頻譜到信號後訓練流程
VibeThinker-3B是一個3B參數的MIT許可推理模型，在可驗證基準上與DeepSeek V3.2和Kimi K2.5匹配。
6月19日週五Model/API
GLM-5.2 通過口碑測試，開源模型進入前沿
GLM-5.2 通過眾人口碑測試，開源模型故事終於成為真正的邊疆故事。
6月18日週四Model/API
中國Z.ai實驗室發布GLM-5.2成為最強開源文本大型語言模型
中國Z.ai實驗室於6月16日開源發布了具有7530億參數的文本輸入大型語言模型GLM-5.2。
6月17日週三Model/API
MiniMax推出基於混合專家模型的雙分支稀疏注意力機制MSA
MiniMax發布了MSA，一種雙分支區塊稀疏注意力機制，能有效降低計算成本。
6月17日週三Model/API
Microsoft Copilot Cowork 轉向用量計費，可能採用 DeepSeek
Microsoft 正在考慮使用 DeepSeek V4 的精調版本作為 Copilot Cowork 的低成本模型選擇，並轉向用量計費。
6月17日週三Model/API
Qwen-RobotSuite：三款具體化AI模型實現視覺語言操作、視頻建模與導航
Qwen團隊推出Qwen-RobotSuite，包括RobotManip、RobotWorld與RobotNav三款具體化AI模型，分別用於操作、視頻世界建模和導航。