Dia 1.6B TTS
Ultra-Realistinen AI-Puhevuoropuhelumalli
Avoimen lähdekoodin 1,6B parametrin text-to-speech-malli Nari Labsilta, joka generoi ihmisen kaltaista puhetta luonnollisella intonaatiolla, rytmillä ja tunteella. Tapaa Dia 1.6B TTS.

Mikä on Dia 1.6B TTS?
Dia 1.6B TTS on huipputeknologinen AI text-to-speech-malli, joka on suunniteltu ultra-realistiseen vuoropuhelun synteesiin. Nari Labsin kehittämä ja Apache 2.0 -lisenssillä julkaistu Dia 1.6B TTS tarjoaa luonnollisen ja ilmeikkään puheen tuotoksen, joka kilpailee kaupallisten ratkaisujen kanssa.
- Puhesynteesi luonnollisella intonaatiolla, rytmillä ja emotionaalisella ilmaisulla käyttäen Dia 1.6B TTS:ää
- Optimoitu usean puhujan vuoropuhelun generointi Dia 1.6B TTS:llä
- 1,6B parametrin malli, joka toimii 10GB VRAM:lla
- Äänen kloonausominaisuudet audio promptingin kautta
Dia 1.6B TTS Pääominaisuudet
Dia 1.6B TTS Poikkeuksellinen Puheen Laatu
Dia 1.6B TTS tuottaa uskomattoman luonnollisen kuuloisia ääniä ihmismäisellä intonaatiolla, rytmillä ja tunteella. Edistynyt AI-malli luo puhetta, joka on lähes erottamaton ihmisäänistä.
Dia 1.6B TTS: Usean Puhujan Tuki
Luo helposti usean puhujan keskusteluja käyttämällä yksinkertaisia tunnisteita kuten [S1] ja [S2] määrittääksesi eri ääniä tekstissäsi, ylläpitäen johdonmukaista ja luonnollista vuoropuhelua Dia 1.6B TTS:n kanssa.
Äänen Kloonaus Dia 1.6B TTS:llä
Kloonaa tiettyjä lauluääniominaisuuksia käyttämällä audio prompting -ominaisuutta, mahdollistaen johdonmukaisen ääni-identiteetin useissa generoinneissa mukautettuun puheen tuotokseen Dia 1.6B TTS:llä.
Dia 1.6B TTS: Avoimen Lähdekoodin Malli
Julkaistu Apache 2.0 -lisenssillä, sallien ilmaisen käytön henkilökohtaisiin ja kaupallisiin tarkoituksiin. Täydelliset mallipainot ja koodi Dia 1.6B TTS:lle ovat saatavilla GitHubissa.
Dia 1.6B TTS Audio Demot
Dia 1.6B TTS: Vakiokäyttö (Esimerkki 1)
Perusvuoropuhelun generointiesimerkki Dia 1.6B TTS:stä.
Dia 1.6B TTS: Luonnollinen Keskustelu (Esimerkki 2)
Esittelee vapaamuotoisia vuorovaikutuksia käyttäen Dia 1.6B TTS:ää.
Dia 1.6B TTS: Emotionaalinen Vuoropuhelu (Esimerkki 3)
Ilmeikäs, korkean tunteen puheen esimerkki käyttäen Dia 1.6B TTS:ää.
Dia 1.6B TTS: Ei-Verbaaliset Äänet (Esimerkki 4)
Sisältää yskimistä, nuuskimista, naurua, jotka Dia 1.6B TTS on generoinut.
Dia 1.6B TTS: Rap-Esimerkki (Esimerkki 5)
Esittelee rytmiä ja riimejä käyttäen Dia 1.6B TTS:ää.
Dia 1.6B TTS: Audio Prompting -ominaisuus (Esimerkki 6)
Esimerkki äänen kloonauksesta käyttäen Dia 1.6B TTS audio prompteja.
Huomautus: Käyttääksesi audio prompteja korkealaatuiseen tuotokseen Dia 1.6B TTS:ssä, lisää vastaava skripti syötetekstisi eteen. Automaattista transkriptiota harkitaan käytön helpottamiseksi.
Dia 1.6B TTS Video Esimerkit
Dia 1.6B TTS: Podcast-Laatu
Esittelee potentiaalin podcast-generointiin käyttäen Dia 1.6B TTS:ää.
Dia 1.6B TTS: Mallin Esittely
Korostaa Dia 1.6B TTS:n 1,6B parametrin mallia.
Dia 1.6B TTS: Ultra-Realistinen Vuoropuhelu
Esittelee yhden läpikäynnin generoinnin käyttäen Dia 1.6B TTS:ää.
Kuinka Dia 1.6B TTS Toimii: Tekstistä Realistiseen Vuoropuheluun
1. Valmistele Skriptisi Dia 1.6B TTS:lle
Kirjoita tai liitä teksti, jonka haluat Dia 1.6B TTS:n muuntavan. Käytä yksinkertaisia tunnisteita kuten [S1] ja [S2] lauseiden edessä määrittääksesi eri puhujien ääniä. Voit myös sisällyttää ei-verbaalisia vihjeitä kuten (nauraa) tai (yskii) lisätäksesi realismia.
2. (Valinnainen) Tarjoa Audio Prompteja Dia 1.6B TTS:lle
Kloonataksesi tietyn äänen tai ohjataksesi emotionaalista sävyä Dia 1.6B TTS:llä, lataa lyhyt audionäyte (5-15 sekuntia) ja sen tarkka transkriptio (puhuja-tunnisteilla) lisättynä pääskriptin eteen syötteessäsi.
3. Generoi Audiota Dia 1.6B TTS:llä
Suorita Dia 1.6B TTS -malli (paikallisesti sovelluksen kautta tai käyttäen verkko-demoa). Malli käsittelee koko skriptin yhdessä läpikäynnissä, generoi den saumatonta vuoropuhelua.
4. Kuuntele ja Lataa Dia 1.6B TTS Tuotos
Toista generoitu audio suoraan Dia 1.6B TTS:stä. Tuotos kaappaa luonnollisen intonaation, rytmin ja jopa ei-verbaaliset vihjeet, luoden ultra-realistisen kuuntelukokemuksen. Lataa audiotiedosto projekteihisi.
Dia 1.6B TTS Asennusopas
### Windows Installation
1. Clone the repository
git clone https://github.com/nari-labs/dia.git
cd dia
2. Create a Python virtual environment (Python 3.10 recommended)
python -m venv venv
venv\Scripts\activate.bat
3. Install dependencies
python -m pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
4. Download model weights
# These will download automatically or can be manually downloaded from Hugging Face
5. Launch the application
python app.pyDia 1.6B TTS Tekniset Tiedot

Dia 1.6B TTS - Ultra-Realistinen Vuoropuhelun Synteesimalli
Dia 1.6B TTS on huipputeknologinen text-to-speech-malli 1,6B parametrilla, joka generoi ihmisen kaltaisia ääniä luonnollisella intonaatiolla, rytmillä ja tunteella. Yritystason GPU:illa Dia 1.6B TTS voi generoida audiota reaaliajassa, A4000 GPU:n tuottaessa noin 40 tokenia/sekunti (86 tokenia vastaa 1 sekuntia audiota).
Täysi versio vaatii noin 10GB VRAM:ia toimiakseen. Kvantisoituja versioita Dia 1.6B TTS:stä suunnitellaan tuleviin päivityksiin parantamaan saavutettavuutta alemman tason laitteistossa.
Dia TTS Hinnoittelu
Osta Dia TTS äänen luonnin krediittejä kokeaksesi ammattimaisia AI text-to-speech-palveluita.
Basic
Vuotuinen Basic-suunnitelma paremmalla hinnalla.
- 12000 krediittiä vuodessa (1000/kuukausi)
- Laskutetaan vuosittain ($94.80/vuosi)
- Korkealaatuiset äänituotokset
- Standardi asiakastuki
Vuotuiset säästöt! 20% alennus vs kuukausittain!
Pro
Vuotuinen Pro-suunnitelma, paras valinta ammattilaisille.
- 26400 krediittiä vuodessa (2200/kuukausi)
- Laskutetaan vuosittain ($190.80/vuosi)
- Korkealaatuiset äänituotokset
- Ensisijainen asiakastuki
Vuotuiset säästöt! 20% alennus vs kuukausittain!
Ultra
Vuotuinen Ultra-suunnitelma, täydellinen tiimeille ja yrityksille.
- 54000 krediittiä vuodessa (4500/kuukausi)
- Laskutetaan vuosittain ($358.80/vuosi)
- Korkealaatuiset äänituotokset
- VIP-asiakastuki
Vuotuiset säästöt! 19% alennus vs kuukausittain!