Dia 1.6B TTS
Model de Dialog Vocal AI Ultra-Realist
Un model text-to-speech open-source cu 1,6B parametri de la Nari Labs care generează vorbire asemănătoare omului cu intonație, ritm și emoție naturale. Cunoașteți Dia 1.6B TTS.

Ce este Dia 1.6B TTS?
Dia 1.6B TTS este un model AI text-to-speech de ultimă generație conceput pentru sinteză ultra-realistă de dialoguri. Dezvoltat de Nari Labs și lansat sub licența Apache 2.0, Dia 1.6B TTS oferă ieșire vocală naturală și expresivă care rivalizează cu soluțiile comerciale.
- Sinteză vocală cu intonație naturală, ritm și expresie emoțională folosind Dia 1.6B TTS
- Generare optimizată de dialoguri cu mai mulți vorbitori cu Dia 1.6B TTS
- Model de 1,6B parametri care rulează pe 10GB VRAM
- Capabilități de clonare a vocii prin audio prompting
Funcții Principale Dia 1.6B TTS
Dia 1.6B TTS Calitate Excepțională a Vorbirii
Dia 1.6B TTS produce voci incredibil de naturale cu intonație, ritm și emoție asemănătoare omului. Modelul AI avansat creează vorbire care este aproape de nedistins de vocile umane.
Dia 1.6B TTS: Suport Multi-Vorbitor
Creați ușor conversații multi-vorbitor folosind taguri simple precum [S1] și [S2] pentru a specifica voci diferite în textul dvs., menținând dialogul consistent și natural cu Dia 1.6B TTS.
Clonare de Voce cu Dia 1.6B TTS
Clonați caracteristici vocale specifice folosind funcția de audio prompting, permițând identitate vocală consistentă în multiple generări pentru ieșire vocală personalizată cu Dia 1.6B TTS.
Dia 1.6B TTS: Model Open Source
Lansat sub licența Apache 2.0, permițând utilizare gratuită pentru scopuri personale și comerciale. Ponderile complete ale modelului și codul pentru Dia 1.6B TTS sunt disponibile pe GitHub.
Demo-uri Audio Dia 1.6B TTS
Dia 1.6B TTS: Utilizare Standard (Exemplu 1)
Exemplu de bază de generare dialog din Dia 1.6B TTS.
Dia 1.6B TTS: Conversație Naturală (Exemplu 2)
Demonstrează interacțiuni casual folosind Dia 1.6B TTS.
Dia 1.6B TTS: Dialog Emoțional (Exemplu 3)
Exemplu de vorbire expresivă cu emoție ridicată folosind Dia 1.6B TTS.
Dia 1.6B TTS: Sunete Non-Verbale (Exemplu 4)
Include tuse, sorbit din nas, râs generate de Dia 1.6B TTS.
Dia 1.6B TTS: Exemplu Rap (Exemplu 5)
Prezintă ritm și rimă folosind Dia 1.6B TTS.
Dia 1.6B TTS: Funcție Audio Prompting (Exemplu 6)
Exemplu de clonare de voce folosind audio prompts Dia 1.6B TTS.
Notă: Pentru a folosi audio prompts pentru ieșire de înaltă calitate în Dia 1.6B TTS, adăugați scriptul corespunzător înaintea textului de intrare. Transcripția automată este luată în considerare pentru ușurință în utilizare.
Exemple Video Dia 1.6B TTS
Dia 1.6B TTS: Calitate Podcast
Demonstrează potențialul pentru generarea de podcasturi folosind Dia 1.6B TTS.
Dia 1.6B TTS: Introducere Model
Evidențiază modelul de 1,6B parametri al Dia 1.6B TTS.
Dia 1.6B TTS: Dialog Ultra-Realist
Prezintă generarea într-o singură trecere folosind Dia 1.6B TTS.
Cum Funcționează Dia 1.6B TTS: De la Text la Dialog Realist
1. Pregătiți Scriptul pentru Dia 1.6B TTS
Scrieți sau lipiți textul pe care doriți să-l convertească Dia 1.6B TTS. Folosiți taguri simple precum [S1] și [S2] înainte de propoziții pentru a atribui voci diferite vorbitorilor. Puteți include și indicii non-verbale precum (râde) sau (tușește) pentru a adăuga realism.
2. (Opțional) Furnizați Audio Prompts la Dia 1.6B TTS
Pentru a clona o voce specifică sau a ghida tonul emoțional cu Dia 1.6B TTS, încărcați o mostră audio scurtă (5-15 secunde) și transcripția sa precisă (cu taguri de vorbitori) adăugată înaintea scriptului principal în intrarea dvs.
3. Generați Audio cu Dia 1.6B TTS
Rulați modelul Dia 1.6B TTS (local prin aplicație sau folosind demo-ul online). Modelul procesează întregul script într-o singură trecere, generând dialog fluid.
4. Ascultați și Descărcați Ieșirea Dia 1.6B TTS
Redați audio-ul generat direct din Dia 1.6B TTS. Ieșirea captează intonația naturală, ritmul și chiar indiciile non-verbale, creând o experiență de ascultare ultra-realistă. Descărcați fișierul audio pentru proiectele dvs.
Ghid de Instalare Dia 1.6B TTS
### Windows Installation
1. Clone the repository
git clone https://github.com/nari-labs/dia.git
cd dia
2. Create a Python virtual environment (Python 3.10 recommended)
python -m venv venv
venv\Scripts\activate.bat
3. Install dependencies
python -m pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
4. Download model weights
# These will download automatically or can be manually downloaded from Hugging Face
5. Launch the application
python app.pyInformații Tehnice Dia 1.6B TTS

Dia 1.6B TTS - Model de Sinteză Dialog Ultra-Realist
Dia 1.6B TTS este un model text-to-speech de ultimă generație cu 1,6B parametri care generează voci asemănătoare omului cu intonație, ritm și emoție naturale. Pe GPU-uri de nivel enterprise, Dia 1.6B TTS poate genera audio în timp real, cu un GPU A4000 producând aproximativ 40 de token-uri/secundă (86 de token-uri echivalează cu 1 secundă de audio).
Versiunea completă necesită aproximativ 10GB de VRAM pentru a funcționa. Versiuni cuantizate ale Dia 1.6B TTS sunt planificate pentru actualizări viitoare pentru a îmbunătăți accesibilitatea pe hardware de nivel inferior.
Prețuri Dia TTS
Cumpărați credite de generare voce Dia TTS pentru a experimenta servicii profesionale AI text-to-speech.
Basic
Plan Basic anual cu prețuri mai bune.
- 12000 credite pe an (1000/lună)
- Facturat anual ($94.80/an)
- Ieșiri audio de înaltă calitate
- Suport standard pentru clienți
Economii anuale! Reducere 20% față de lunar!
Pro
Plan Pro anual, cea mai bună alegere pentru profesioniști.
- 26400 credite pe an (2200/lună)
- Facturat anual ($190.80/an)
- Ieșiri audio de înaltă calitate
- Suport prioritar pentru clienți
Economii anuale! Reducere 20% față de lunar!
Ultra
Plan Ultra anual, perfect pentru echipe și întreprinderi.
- 54000 credite pe an (4500/lună)
- Facturat anual ($358.80/an)
- Ieșiri audio de înaltă calitate
- Suport VIP pentru clienți
Economii anuale! Reducere 19% față de lunar!