Dia 1.6B TTS

Model Dialog Ucapan AI Ultra-Realistis

Model text-to-speech open-source 1,6B parameter dari Nari Labs yang menghasilkan ucapan mirip manusia dengan intonasi, ritme, dan emosi alami. Kenali Dia 1.6B TTS.

Dia TTS Hero Animation

Apa itu Dia 1.6B TTS?

Dia 1.6B TTS adalah model AI text-to-speech canggih yang dirancang untuk sintesis dialog ultra-realistis. Dikembangkan oleh Nari Labs dan dirilis di bawah lisensi Apache 2.0, Dia 1.6B TTS menawarkan output ucapan alami dan ekspresif yang menyaingi solusi komersial.

  • Sintesis ucapan dengan intonasi alami, ritme, dan ekspresi emosional menggunakan Dia 1.6B TTS
  • Generasi dialog multi-speaker yang dioptimalkan dengan Dia 1.6B TTS
  • Model 1,6B parameter yang berjalan pada 10GB VRAM
  • Kemampuan kloning suara melalui audio prompting

Fitur Inti Dia 1.6B TTS

Dia 1.6B TTS Kualitas Ucapan Luar Biasa

Dia 1.6B TTS menghasilkan suara yang sangat alami dengan intonasi, ritme, dan emosi mirip manusia. Model AI canggih menciptakan ucapan yang hampir tidak dapat dibedakan dari suara manusia.

Dia 1.6B TTS: Dukungan Multi-Speaker

Buat percakapan multi-speaker dengan mudah menggunakan tag sederhana seperti [S1] dan [S2] untuk menentukan suara yang berbeda dalam teks Anda, mempertahankan dialog yang konsisten dan alami dengan Dia 1.6B TTS.

Kloning Suara dengan Dia 1.6B TTS

Kloning karakteristik vokal tertentu menggunakan fitur audio prompting, memungkinkan identitas suara yang konsisten di berbagai generasi untuk output ucapan yang dipersonalisasi dengan Dia 1.6B TTS.

Dia 1.6B TTS: Model Open Source

Dirilis di bawah lisensi Apache 2.0, memungkinkan penggunaan gratis untuk tujuan pribadi dan komersial. Bobot model lengkap dan kode untuk Dia 1.6B TTS tersedia di GitHub.

Demo Audio Dia 1.6B TTS

Dia 1.6B TTS: Penggunaan Standar (Contoh 1)

Contoh generasi dialog dasar dari Dia 1.6B TTS.

Dia 1.6B TTS: Percakapan Alami (Contoh 2)

Mendemonstrasikan interaksi kasual menggunakan Dia 1.6B TTS.

Dia 1.6B TTS: Dialog Emosional (Contoh 3)

Contoh ucapan ekspresif dengan emosi tinggi menggunakan Dia 1.6B TTS.

Dia 1.6B TTS: Suara Non-Verbal (Contoh 4)

Termasuk batuk, mengendus, tertawa yang dihasilkan oleh Dia 1.6B TTS.

Dia 1.6B TTS: Contoh Rap (Contoh 5)

Menampilkan ritme dan sajak menggunakan Dia 1.6B TTS.

Dia 1.6B TTS: Fitur Audio Prompting (Contoh 6)

Contoh kloning suara menggunakan audio prompts Dia 1.6B TTS.

Catatan: Untuk menggunakan audio prompts untuk output berkualitas tinggi di Dia 1.6B TTS, tambahkan skrip yang sesuai ke teks input Anda. Transkripsi otomatis sedang dipertimbangkan untuk kemudahan penggunaan.

Contoh Video Dia 1.6B TTS

Dia 1.6B TTS: Kualitas Podcast

Mendemonstrasikan potensi untuk generasi podcast menggunakan Dia 1.6B TTS.

Dia 1.6B TTS: Pengenalan Model

Menyoroti model 1,6B parameter dari Dia 1.6B TTS.

Dia 1.6B TTS: Dialog Ultra-Realistis

Menampilkan generasi satu kali menggunakan Dia 1.6B TTS.

Cara Kerja Dia 1.6B TTS: Dari Teks ke Dialog Realistis

  1. 1. Persiapkan Skrip Anda untuk Dia 1.6B TTS

    Tulis atau tempel teks yang ingin Anda konversi oleh Dia 1.6B TTS. Gunakan tag sederhana seperti [S1] dan [S2] sebelum kalimat untuk menetapkan suara pembicara yang berbeda. Anda juga dapat menyertakan isyarat non-verbal seperti (tertawa) atau (batuk) untuk menambah realisme.

  2. 2. (Opsional) Berikan Audio Prompts ke Dia 1.6B TTS

    Untuk mengkloning suara tertentu atau memandu nada emosional dengan Dia 1.6B TTS, unggah sampel audio pendek (5-15 detik) dan transkripsi akuratnya (dengan tag pembicara) yang ditambahkan ke skrip utama dalam input Anda.

  3. 3. Hasilkan Audio dengan Dia 1.6B TTS

    Jalankan model Dia 1.6B TTS (secara lokal melalui aplikasi atau menggunakan demo online). Model memproses seluruh skrip dalam satu kali, menghasilkan dialog yang mulus.

  4. 4. Dengarkan dan Unduh Output Dia 1.6B TTS

    Putar audio yang dihasilkan langsung dari Dia 1.6B TTS. Output menangkap intonasi alami, ritme, dan bahkan isyarat non-verbal, menciptakan pengalaman mendengarkan ultra-realistis. Unduh file audio untuk proyek Anda.

Panduan Instalasi Dia 1.6B TTS

### Windows Installation

1. Clone the repository
   git clone https://github.com/nari-labs/dia.git
   cd dia

2. Create a Python virtual environment (Python 3.10 recommended)
   python -m venv venv
   venv\Scripts\activate.bat

3. Install dependencies
   python -m pip install --upgrade pip
   pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
   pip install -r requirements.txt

4. Download model weights
   # These will download automatically or can be manually downloaded from Hugging Face

5. Launch the application
   python app.py

Informasi Teknis Dia 1.6B TTS

Dia 1.6B TTS Architecture Diagram

Dia 1.6B TTS - Model Sintesis Dialog Ultra-Realistis

Dia 1.6B TTS adalah model text-to-speech canggih dengan 1,6B parameter yang menghasilkan suara mirip manusia dengan intonasi, ritme, dan emosi alami. Pada GPU tingkat enterprise, Dia 1.6B TTS dapat menghasilkan audio secara real-time, dengan GPU A4000 menghasilkan sekitar 40 token/detik (86 token sama dengan 1 detik audio).

Versi lengkap memerlukan sekitar 10GB VRAM untuk berjalan. Versi terkuantisasi Dia 1.6B TTS direncanakan untuk pembaruan di masa mendatang guna meningkatkan aksesibilitas pada perangkat keras tingkat rendah.

Harga Dia TTS

Beli kredit generasi suara Dia TTS untuk mengalami layanan text-to-speech AI profesional.

Basic

Paket Basic tahunan dengan harga lebih baik.

$9.9$7.9/bulan
  • 12000 kredit per tahun (1000/bulan)
  • Ditagih tahunan ($94.80/tahun)
  • Output audio berkualitas tinggi
  • Dukungan pelanggan standar

Hemat tahunan! Diskon 20% vs bulanan!

Paling Populer

Pro

Paket Pro tahunan, pilihan terbaik untuk profesional.

$19.9$15.9/bulan
  • 26400 kredit per tahun (2200/bulan)
  • Ditagih tahunan ($190.80/tahun)
  • Output audio berkualitas tinggi
  • Dukungan pelanggan prioritas

Hemat tahunan! Diskon 20% vs bulanan!

Ultra

Paket Ultra tahunan, sempurna untuk tim dan perusahaan.

$36.9$29.9/bulan
  • 54000 kredit per tahun (4500/bulan)
  • Ditagih tahunan ($358.80/tahun)
  • Output audio berkualitas tinggi
  • Dukungan pelanggan VIP

Hemat tahunan! Diskon 19% vs bulanan!