Dia2-2B 模型规格
2B参数量
Transformer架构
Nari Labs开发者
Apache 2.0许可证
11.2k+下载量
英语语言
Dia2-2B 的核心优势
🚀
20 亿参数 — 更强大,更优质的语音
Dia2-2B 拥有 20 亿参数,相比原版 Dia 模型的 16 亿更为强大。更大的架构能捕捉更细腻的声音差异、更流畅的韵律和更自然的英语语音语调。
🎭
情感感知语音合成
Dia2-2B 能理解上下文并自动调整情感表达 — 快乐、悲伤、兴奋、平静和惊讶都自然流露,无需手动调整。该模型专为富有表现力的对话生成而训练。
⚡
为实时性能而生
Dia2-2B 支持 CUDA Graph 加速和优化的推理管线。配合 bfloat16 精度和流式输出,实现低延迟音频生成,非常适合生产工作流。
🎙️
流式对话 — 实时生成
Dia2-2B 无需等待完整文本输入即可开始生成音频,只需最前面几个词就能启动。非常适合实时对话 AI、语音助手和交互式应用。
🔓
完全开源 — 随处运行
Dia2-2B 在 Hugging Face 上以开源形式发布。可以本地运行、部署在自己的服务器上,或通过 Dia TTS 使用 — 选择权在你。无厂商锁定,完全透明。
🎯
久经考验 — 11,000+ 次下载
在 Hugging Face 上拥有超过 11,000 次下载和 157 个点赞,Dia2-2B 已被全球数千名开发者、研究人员和创作者信赖使用。