Dia2-2B — Nari Labs 新一代开源文字转语音模型

Dia2-2B 是 Nari Labs 推出的 20 亿参数开源 TTS 模型 — Dia 1.6B 的继任者,语音质量更优、情感更丰富、支持流式对话。Hugging Face 已有 11,000+ 次下载。对 AI 语音感兴趣?免费试用我们的 AI 语音生成器AI 声音克隆

Dia2-2B 模型规格

2B参数量
Transformer架构
Nari Labs开发者
Apache 2.0许可证
11.2k+下载量
英语语言

Dia2-2B 的核心优势

🚀

20 亿参数 — 更强大,更优质的语音

Dia2-2B 拥有 20 亿参数,相比原版 Dia 模型的 16 亿更为强大。更大的架构能捕捉更细腻的声音差异、更流畅的韵律和更自然的英语语音语调。

🎭

情感感知语音合成

Dia2-2B 能理解上下文并自动调整情感表达 — 快乐、悲伤、兴奋、平静和惊讶都自然流露,无需手动调整。该模型专为富有表现力的对话生成而训练。

为实时性能而生

Dia2-2B 支持 CUDA Graph 加速和优化的推理管线。配合 bfloat16 精度和流式输出,实现低延迟音频生成,非常适合生产工作流。

🎙️

流式对话 — 实时生成

Dia2-2B 无需等待完整文本输入即可开始生成音频,只需最前面几个词就能启动。非常适合实时对话 AI、语音助手和交互式应用。

🔓

完全开源 — 随处运行

Dia2-2B 在 Hugging Face 上以开源形式发布。可以本地运行、部署在自己的服务器上,或通过 Dia TTS 使用 — 选择权在你。无厂商锁定,完全透明。

🎯

久经考验 — 11,000+ 次下载

在 Hugging Face 上拥有超过 11,000 次下载和 157 个点赞,Dia2-2B 已被全球数千名开发者、研究人员和创作者信赖使用。

Dia2-2B 常见问题

想要更多 AI 语音?

喜欢 Dia2-2B?我们的 AI 语音生成器更进一步 — 多个顶级 TTS 模型、35+ 种语音、15 种语言,一个平台全搞定。

Dia TTS AI 语音生成器

35+ 种自然语音,15 种语言。选择声音、输入文字,几秒内下载录音棚级 MP3。