Dia2-2B — Nari Labs 新一代開源文字轉語音模型

Dia2-2B 是 Nari Labs 推出的 20 億參數開源 TTS 模型 — Dia 1.6B 的繼任者,語音品質更優、情感更豐富、支援串流對話。Hugging Face 已有 11,000+ 次下載。對 AI 語音感興趣?免費試用我們的 AI 語音產生器AI 聲音複製

Dia2-2B 模型規格

2B參數量
Transformer架構
Nari Labs開發者
Apache 2.0授權條款
11.2k+下載次數
英語支援語言

Dia2-2B 的核心優勢

🚀

20 億參數 — 更強大,更優質的語音

Dia2-2B 擁有 20 億參數,相比原版 Dia 模型的 16 億更為強大。更大的架構能捕捉更細膩的聲音差異、更流暢的韻律和更自然的英語語音語調。

🎭

情感感知語音合成

Dia2-2B 能理解上下文並自動調整情感表達 — 快樂、悲傷、興奮、平靜和驚訝都自然流露,無需手動調整。該模型專為富有表現力的對話生成而訓練。

為即時效能而生

Dia2-2B 支援 CUDA Graph 加速和最佳化的推論管線。搭配 bfloat16 精度和串流輸出,實現低延遲音訊生成,非常適合生產工作流程。

🎙️

串流對話 — 即時生成

Dia2-2B 無需等待完整文字輸入即可開始生成音訊,只需最前面幾個詞就能啟動。非常適合即時對話 AI、語音助理和互動式應用程式。

🔓

完全開源 — 隨處執行

Dia2-2B 在 Hugging Face 上以開源形式發布。可以本機執行、部署在自己的伺服器上,或透過 Dia TTS 使用 — 選擇權在您。無廠商鎖定,完全透明。

🎯

久經考驗 — 11,000+ 次下載

在 Hugging Face 上擁有超過 11,000 次下載和 157 個按讚,Dia2-2B 已被全球數千名開發者、研究人員和創作者信賴使用。

Dia2-2B 常見問題

想要更多 AI 語音?

喜歡 Dia2-2B?我們的 AI 語音生成器更進一步 — 多個頂級 TTS 模型、35+ 種語音、15 種語言,一個平台全搞定。

Dia TTS AI 語音生成器

35+ 種自然語音,15 種語言。選擇聲音、輸入文字,幾秒內下載錄音棚級 MP3。