語音合成、辨識與即時語音 Agent。
7月3日週五Open Source
Interfaze 開源 diffusion-gemma-asr-small,這是一個使用擴散而非自回歸方式進行轉錄的多語言 ASR 模型。
6月30日週二Agent
OpenClaw 推出 iOS 和 Android 原生应用,作为伴侣节点,通过 WebSocket 将手机硬件接入自托管的 AI 代理网关。
6月26日週五Tools
Cewsco 是一款整合聊天、圖像、語音和市場數據的全能 AI 助手。
6月25日週四Tools
AWS 發布如何使用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 建構處理預約提醒的語音代理。
6月25日週四Agent
Loka 使用 Amazon Nova 2 Sonic 構建了自然、低延遲的語音代理,解決語音助手機械化與緩慢的問題。
6月24日週三Model/API
教學展示如何使用NVIDIA Canary-1B-v2模型在Python中建立多語言ASR與語音翻譯管線,並匯出SRT字幕。