NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型
NVIDIA 近期發布了 Nemotron-Labs-TwoTower,這是一個建構在預訓練自回歸主幹(Nemotron-3-Nano-30B-A3B)之上的擴散語言模型。此模型以開放權重形式發布,採用 NVIDIA Nemotron 開放模型許可證。該釋出主要針對文字生成中的吞吐量瓶頸,因為自回歸模型一次解碼一個 token,序列處理限制了生成速度,而離散擴散語言模型則可能提供更高效的替代方案。
Decision Brief
變化NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
為什麼重要AI 開發者可透過此模型了解擴散語言模型相較於自回歸模型在生成吞吐量上的潛在優勢。
誰該關注依賴模型 API 的團隊、推理 / 基建團隊
受影響技術棧NVIDIA
建議動作觀察
來源可信度中 · 可靠媒體或一手報導
摘要依據:官方/RSS 來源如果不是「已讀全文」,這條詳摘只基於公開可取得內容,不會假裝讀過受限原文。
來源
- MarkTechPost
Fast research-paper and ML tooling summaries, useful for infra and agent updates.
- MarkTechPost