Dia2-2B — Nari Labs 新一代开源文字转语音模型

Dia2-2B 是 Nari Labs 推出的 20 亿参数开源 TTS 模型 — Dia 1.6B 的继任者，语音质量更优、情感更丰富、支持流式对话。Hugging Face 已有 11,000+ 次下载。对 AI 语音感兴趣？免费试用我们的 AI 语音生成器和 AI 声音克隆。

Dia2-2B 模型规格

2B参数量

Transformer架构

Nari Labs开发者

Apache 2.0许可证

11.2k+下载量

英语语言

Dia2-2B 的核心优势

🚀

20 亿参数 — 更强大，更优质的语音

Dia2-2B 拥有 20 亿参数，相比原版 Dia 模型的 16 亿更为强大。更大的架构能捕捉更细腻的声音差异、更流畅的韵律和更自然的英语语音语调。

🎭

情感感知语音合成

Dia2-2B 能理解上下文并自动调整情感表达 — 快乐、悲伤、兴奋、平静和惊讶都自然流露，无需手动调整。该模型专为富有表现力的对话生成而训练。

⚡

为实时性能而生

Dia2-2B 支持 CUDA Graph 加速和优化的推理管线。配合 bfloat16 精度和流式输出，实现低延迟音频生成，非常适合生产工作流。

🎙️

流式对话 — 实时生成

Dia2-2B 无需等待完整文本输入即可开始生成音频，只需最前面几个词就能启动。非常适合实时对话 AI、语音助手和交互式应用。

🔓

完全开源 — 随处运行

Dia2-2B 在 Hugging Face 上以开源形式发布。可以本地运行、部署在自己的服务器上，或通过 Dia TTS 使用 — 选择权在你。无厂商锁定，完全透明。

🎯

久经考验 — 11,000+ 次下载

在 Hugging Face 上拥有超过 11,000 次下载和 157 个点赞，Dia2-2B 已被全球数千名开发者、研究人员和创作者信赖使用。

Dia2-2B 常见问题

想要更多 AI 语音？

喜欢 Dia2-2B？我们的 AI 语音生成器更进一步 — 多个顶级 TTS 模型、35+ 种语音、15 种语言，一个平台全搞定。

Dia TTS AI 语音生成器

35+ 种自然语音，15 种语言。选择声音、输入文字，几秒内下载录音棚级 MP3。

Dia2-2B — Nari Labs 新一代开源文字转语音模型

Dia2-2B 模型规格

Dia2-2B 的核心优势

20 亿参数 — 更强大，更优质的语音

情感感知语音合成

为实时性能而生

流式对话 — 实时生成

完全开源 — 随处运行

久经考验 — 11,000+ 次下载

Dia2-2B 常见问题

什么是 Dia2-2B？

Dia2-2B 和 Dia 1.6B 有什么区别？

Dia2-2B 可以免费使用吗？

本地运行 Dia2-2B 需要什么硬件？

Dia2-2B 支持哪些语言？

Dia2-2B 可以用于商业项目吗？

还有更小的 Dia2 模型吗？

Dia2-2B 和 ElevenLabs 或 OpenAI TTS 相比如何？

想要更多 AI 语音？

Dia TTS AI 语音生成器