AI 晶片與硬體
AI 晶片與加速器:NVIDIA、TPU、ASIC 與半導體供應鏈。
7月2日週四Tools
Anthropic 與三星洽談客製化 AI 晶片製造合作Anthropic 正與三星電子洽談,由三星作為其客製化 AI 晶片的製造合作夥伴。
7月1日週三Model/API
NVIDIA 發布 Nemotron-Labs-TwoTower 擴散語言模型NVIDIA 發布了基於凍結自回歸主幹的開放權重擴散語言模型 Nemotron-Labs-TwoTower。
7月1日週三Model/API
Nvidia 競爭對手 Etched 以 50 億美元估值達成 10 億美元 AI 晶片銷售Nvidia 競爭對手 Etched 表示,其由自家晶片驅動的推理系統已簽訂 10 億美元合約,公司估值達 50 億美元。
7月1日週三Model/API
OpenAI 據報將訪客 ChatGPT 使用者回應成本削減逾半OpenAI 將其 AI 模型推論成本削減逾半,並應用於 ChatGPT,使所需的 Nvidia GPU 數量有時降至僅數百個。
6月30日週二Tools
NVIDIA 提出三種合成資料與微調工作流程提升視覺 AI 代理準確度NVIDIA 部落格介紹三種利用合成資料和微調來提升視覺 AI 代理準確度的工作流程。
6月30日週二Research
利用合成資料與微調提升視覺AI代理準確度的三種工作流程NVIDIA 介紹三種透過合成資料與微調提升視覺 AI 代理準確度的工作流程。
6月30日週二Tools
NVIDIA BioNeMo Agent Toolkit 將生物分子模型轉為 AI 代理可調用的技能NVIDIA 開源 BioNeMo Agent Toolkit,將生物分子模型轉化為 AI 代理可調用的技能,在測試中將任務完成率從 57.1% 提升至 100%。
6月27日週六Tools
從 NVIDIA Open-SWE-Traces 構建監督式微調資料:軌跡解析、補丁分析、Token 預算與工具使用指標一篇教學文章介紹如何透過串流 Hugging Face 上的 NVIDIA Open-SWE-Traces 資料集,在 Google Colab 中高效處理代理式軟體工程軌跡,生成可用於微調的資料子集。
6月27日週六Research
OpenAI、SpaceX等公司自研晶片,挑戰Nvidia霸主地位OpenAI、Google、蘋果和SpaceX等公司正透過自訂晶片來降低對Nvidia的依賴,以分散單一供應商風險。
6月26日週五Model/API
在 Amazon SageMaker AI 上使用 NVIDIA Blackwell 优化模型训练本文介绍如何在 Amazon SageMaker AI 上配置训练任务,充分利用 Blackwell 架构的优势。
6月24日週三Model/API
OpenAI 首款自研晶片 Jalapeño 亮相,由 Broadcom 代工OpenAI 推出首款自研晶片 Jalapeño,專為推論系統設計。
6月24日週三Model/API
OpenAI 與 Broadcom 推出定制 LLM 推理晶片「Jalapeño」OpenAI 和 Broadcom 推出了專為大型語言模型推理設計的定制晶片「Jalapeño」,預計 2026 年底大規模運行。
6月24日週三Research
DFlash 推測解碼:並行生成整塊 Token,在 NVIDIA Blackwell 上實現最高 15 倍吞吐量提升UC San Diego 的 DFlash 用輕量級區塊擴散模型取代自回歸草稿生成,在單次前向傳播中並行生成整塊 token,實現推測解碼加速。
6月24日週三Model/API
OpenAI 與 Broadcom 推出專為 LLM 推論最佳化的晶片 JalapeñoOpenAI 和 Broadcom 推出名為 Jalapeño 的自訂 AI 晶片,專為大型語言模型推論設計,以提升效能、效率與規模。
6月24日週三Model/API
使用NVIDIA Canary-1B-v2進行ASR、翻譯及自動SRT字幕匯出的Python教學教學展示如何使用NVIDIA Canary-1B-v2模型在Python中建立多語言ASR與語音翻譯管線,並匯出SRT字幕。
6月23日週二Tools
Nvidia Rubin 液冷資料中心設計號稱大幅降低耗水與電耗Nvidia 宣稱其 Rubin 世代全液冷資料中心參考設計大幅減少用電且幾乎完全不用水。
6月23日週二Tools
SpaceX 與開源 AI 實驗室 Reflection AI 簽署計算合約SpaceX 與開源 AI 實驗室 Reflection AI 達成協議,提供 Nvidia GB300 AI 晶片與硬體存取權,月費 1.5 億美元。
6月20日週六Agent
NVIDIA AI 推出 SpatialClaw:將程式碼視為空間推理動作介面的免訓練代理NVIDIA AI 推出 SpatialClaw,一個免訓練代理,透過在持久內核中撰寫 Python 程式碼來組合感知工具,進行 3D 空間推理。
6月18日週四Tools
NVIDIA SkillSpector 教程:利用靜態分析及 SARIF 報告掃描 AI 技能安全風險本文介紹使用 NVIDIA SkillSpector 工具在部署前掃描 AI 技能的安全風險。
6月16日週二Tools
微軟推出搭載 Snapdragon X2 晶片的新款 Surface Laptop 8 和 Surface Pro 12微軟推出搭載高通 Snapdragon X2 處理器的新款 Surface Laptop 8 和 Surface Pro 12。