Dia 1.6B TTS
Model Dialog Ucapan AI Ultra-Realistis
Model text-to-speech open-source 1,6B parameter dari Nari Labs yang menghasilkan ucapan mirip manusia dengan intonasi, ritme, dan emosi alami. Kenali Dia 1.6B TTS.

Apa itu Dia 1.6B TTS?
Dia 1.6B TTS adalah model AI text-to-speech canggih yang dirancang untuk sintesis dialog ultra-realistis. Dikembangkan oleh Nari Labs dan dirilis di bawah lisensi Apache 2.0, Dia 1.6B TTS menawarkan output ucapan alami dan ekspresif yang menyaingi solusi komersial.
- Sintesis ucapan dengan intonasi alami, ritme, dan ekspresi emosional menggunakan Dia 1.6B TTS
- Generasi dialog multi-speaker yang dioptimalkan dengan Dia 1.6B TTS
- Model 1,6B parameter yang berjalan pada 10GB VRAM
- Kemampuan kloning suara melalui audio prompting
Fitur Inti Dia 1.6B TTS
Dia 1.6B TTS Kualitas Ucapan Luar Biasa
Dia 1.6B TTS menghasilkan suara yang sangat alami dengan intonasi, ritme, dan emosi mirip manusia. Model AI canggih menciptakan ucapan yang hampir tidak dapat dibedakan dari suara manusia.
Dia 1.6B TTS: Dukungan Multi-Speaker
Buat percakapan multi-speaker dengan mudah menggunakan tag sederhana seperti [S1] dan [S2] untuk menentukan suara yang berbeda dalam teks Anda, mempertahankan dialog yang konsisten dan alami dengan Dia 1.6B TTS.
Kloning Suara dengan Dia 1.6B TTS
Kloning karakteristik vokal tertentu menggunakan fitur audio prompting, memungkinkan identitas suara yang konsisten di berbagai generasi untuk output ucapan yang dipersonalisasi dengan Dia 1.6B TTS.
Dia 1.6B TTS: Model Open Source
Dirilis di bawah lisensi Apache 2.0, memungkinkan penggunaan gratis untuk tujuan pribadi dan komersial. Bobot model lengkap dan kode untuk Dia 1.6B TTS tersedia di GitHub.
Demo Audio Dia 1.6B TTS
Dia 1.6B TTS: Penggunaan Standar (Contoh 1)
Contoh generasi dialog dasar dari Dia 1.6B TTS.
Dia 1.6B TTS: Percakapan Alami (Contoh 2)
Mendemonstrasikan interaksi kasual menggunakan Dia 1.6B TTS.
Dia 1.6B TTS: Dialog Emosional (Contoh 3)
Contoh ucapan ekspresif dengan emosi tinggi menggunakan Dia 1.6B TTS.
Dia 1.6B TTS: Suara Non-Verbal (Contoh 4)
Termasuk batuk, mengendus, tertawa yang dihasilkan oleh Dia 1.6B TTS.
Dia 1.6B TTS: Contoh Rap (Contoh 5)
Menampilkan ritme dan sajak menggunakan Dia 1.6B TTS.
Dia 1.6B TTS: Fitur Audio Prompting (Contoh 6)
Contoh kloning suara menggunakan audio prompts Dia 1.6B TTS.
Catatan: Untuk menggunakan audio prompts untuk output berkualitas tinggi di Dia 1.6B TTS, tambahkan skrip yang sesuai ke teks input Anda. Transkripsi otomatis sedang dipertimbangkan untuk kemudahan penggunaan.
Contoh Video Dia 1.6B TTS
Dia 1.6B TTS: Kualitas Podcast
Mendemonstrasikan potensi untuk generasi podcast menggunakan Dia 1.6B TTS.
Dia 1.6B TTS: Pengenalan Model
Menyoroti model 1,6B parameter dari Dia 1.6B TTS.
Dia 1.6B TTS: Dialog Ultra-Realistis
Menampilkan generasi satu kali menggunakan Dia 1.6B TTS.
Cara Kerja Dia 1.6B TTS: Dari Teks ke Dialog Realistis
1. Persiapkan Skrip Anda untuk Dia 1.6B TTS
Tulis atau tempel teks yang ingin Anda konversi oleh Dia 1.6B TTS. Gunakan tag sederhana seperti [S1] dan [S2] sebelum kalimat untuk menetapkan suara pembicara yang berbeda. Anda juga dapat menyertakan isyarat non-verbal seperti (tertawa) atau (batuk) untuk menambah realisme.
2. (Opsional) Berikan Audio Prompts ke Dia 1.6B TTS
Untuk mengkloning suara tertentu atau memandu nada emosional dengan Dia 1.6B TTS, unggah sampel audio pendek (5-15 detik) dan transkripsi akuratnya (dengan tag pembicara) yang ditambahkan ke skrip utama dalam input Anda.
3. Hasilkan Audio dengan Dia 1.6B TTS
Jalankan model Dia 1.6B TTS (secara lokal melalui aplikasi atau menggunakan demo online). Model memproses seluruh skrip dalam satu kali, menghasilkan dialog yang mulus.
4. Dengarkan dan Unduh Output Dia 1.6B TTS
Putar audio yang dihasilkan langsung dari Dia 1.6B TTS. Output menangkap intonasi alami, ritme, dan bahkan isyarat non-verbal, menciptakan pengalaman mendengarkan ultra-realistis. Unduh file audio untuk proyek Anda.
Panduan Instalasi Dia 1.6B TTS
### Windows Installation
1. Clone the repository
git clone https://github.com/nari-labs/dia.git
cd dia
2. Create a Python virtual environment (Python 3.10 recommended)
python -m venv venv
venv\Scripts\activate.bat
3. Install dependencies
python -m pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
4. Download model weights
# These will download automatically or can be manually downloaded from Hugging Face
5. Launch the application
python app.pyInformasi Teknis Dia 1.6B TTS

Dia 1.6B TTS - Model Sintesis Dialog Ultra-Realistis
Dia 1.6B TTS adalah model text-to-speech canggih dengan 1,6B parameter yang menghasilkan suara mirip manusia dengan intonasi, ritme, dan emosi alami. Pada GPU tingkat enterprise, Dia 1.6B TTS dapat menghasilkan audio secara real-time, dengan GPU A4000 menghasilkan sekitar 40 token/detik (86 token sama dengan 1 detik audio).
Versi lengkap memerlukan sekitar 10GB VRAM untuk berjalan. Versi terkuantisasi Dia 1.6B TTS direncanakan untuk pembaruan di masa mendatang guna meningkatkan aksesibilitas pada perangkat keras tingkat rendah.
Harga Dia TTS
Beli kredit generasi suara Dia TTS untuk mengalami layanan text-to-speech AI profesional.
Basic
Paket Basic tahunan dengan harga lebih baik.
- 12000 kredit per tahun (1000/bulan)
- Ditagih tahunan ($94.80/tahun)
- Output audio berkualitas tinggi
- Dukungan pelanggan standar
Hemat tahunan! Diskon 20% vs bulanan!
Pro
Paket Pro tahunan, pilihan terbaik untuk profesional.
- 26400 kredit per tahun (2200/bulan)
- Ditagih tahunan ($190.80/tahun)
- Output audio berkualitas tinggi
- Dukungan pelanggan prioritas
Hemat tahunan! Diskon 20% vs bulanan!
Ultra
Paket Ultra tahunan, sempurna untuk tim dan perusahaan.
- 54000 kredit per tahun (4500/bulan)
- Ditagih tahunan ($358.80/tahun)
- Output audio berkualitas tinggi
- Dukungan pelanggan VIP
Hemat tahunan! Diskon 19% vs bulanan!