字節跳動擴散語言模型 iLLaDA 媲美 Qwen2.5

Decision Brief

變化字節跳動與人民大學合作推出 8B 參數擴散語言模型 iLLaDA，基礎表現可與 Qwen2.5 匹配。

為什麼重要AI builder 需關注非自回歸生成路徑的模型能力與限制。

誰該關注依賴模型 API 的團隊

受影響技術棧OpenAIQwen

建議動作評估

來源可信度中 · 可靠媒體或一手報導

iLLaDA 是一個 8B 參數的擴散語言模型，生成方式不同於 ChatGPT 這類自回歸模型。在基礎層級上，iLLaDA 的表現可與 Qwen2.5 並駕齊驅，但經過微調後表現稍遜。此模型由人民大學與字節跳動研究人員共同發表。

摘要依據：官方/RSS 來源如果不是「已讀全文」，這條詳摘只基於公開可取得內容，不會假裝讀過受限原文。