Datalab 推出 9B 開放權重視覺模型 lift,可將 PDF 轉為結構化 JSON
Decision Brief
變化Datalab 發布了一個 9B 開放權重的視覺模型 lift,能將 PDF 和圖片轉換為符合 schema 的 JSON。
為什麼重要AI builder 需要關注這類專用開源模型,以簡化文件解析與結構化數據提取流程。
誰該關注依賴模型 API 的團隊
受影響技術棧未識別出特定技術棧
建議動作觀察
來源可信度中 · 可靠媒體或一手報導
Datalab 推出的 lift 模型擁有 9B 參數並開放權重,專注於從 PDF 與圖片中提取結構化 JSON。它採用 schema 約束解碼確保輸出格式正確,並透過訓練使其在欄位缺失時返回 null 而非幻覺內容。在包含 225 份文件的基準測試中,lift 的欄位準確率達到 90.2%。
摘要依據:官方/RSS 來源如果不是「已讀全文」,這條詳摘只基於公開可取得內容,不會假裝讀過受限原文。
來源
- MarkTechPost
Fast research-paper and ML tooling summaries, useful for infra and agent updates.
- MarkTechPost