Dia2-2B 模型規格
2B參數量
Transformer架構
Nari Labs開發者
Apache 2.0授權條款
11.2k+下載次數
英語支援語言
Dia2-2B 的核心優勢
🚀
20 億參數 — 更強大,更優質的語音
Dia2-2B 擁有 20 億參數,相比原版 Dia 模型的 16 億更為強大。更大的架構能捕捉更細膩的聲音差異、更流暢的韻律和更自然的英語語音語調。
🎭
情感感知語音合成
Dia2-2B 能理解上下文並自動調整情感表達 — 快樂、悲傷、興奮、平靜和驚訝都自然流露,無需手動調整。該模型專為富有表現力的對話生成而訓練。
⚡
為即時效能而生
Dia2-2B 支援 CUDA Graph 加速和最佳化的推論管線。搭配 bfloat16 精度和串流輸出,實現低延遲音訊生成,非常適合生產工作流程。
🎙️
串流對話 — 即時生成
Dia2-2B 無需等待完整文字輸入即可開始生成音訊,只需最前面幾個詞就能啟動。非常適合即時對話 AI、語音助理和互動式應用程式。
🔓
完全開源 — 隨處執行
Dia2-2B 在 Hugging Face 上以開源形式發布。可以本機執行、部署在自己的伺服器上,或透過 Dia TTS 使用 — 選擇權在您。無廠商鎖定,完全透明。
🎯
久經考驗 — 11,000+ 次下載
在 Hugging Face 上擁有超過 11,000 次下載和 157 個按讚,Dia2-2B 已被全球數千名開發者、研究人員和創作者信賴使用。