Dia 1.6B TTS

Ultra-Realistinen AI-Puhevuoropuhelumalli

Avoimen lähdekoodin 1,6B parametrin text-to-speech-malli Nari Labsilta, joka generoi ihmisen kaltaista puhetta luonnollisella intonaatiolla, rytmillä ja tunteella. Tapaa Dia 1.6B TTS.

Dia TTS Hero Animation

Mikä on Dia 1.6B TTS?

Dia 1.6B TTS on huipputeknologinen AI text-to-speech-malli, joka on suunniteltu ultra-realistiseen vuoropuhelun synteesiin. Nari Labsin kehittämä ja Apache 2.0 -lisenssillä julkaistu Dia 1.6B TTS tarjoaa luonnollisen ja ilmeikkään puheen tuotoksen, joka kilpailee kaupallisten ratkaisujen kanssa.

  • Puhesynteesi luonnollisella intonaatiolla, rytmillä ja emotionaalisella ilmaisulla käyttäen Dia 1.6B TTS:ää
  • Optimoitu usean puhujan vuoropuhelun generointi Dia 1.6B TTS:llä
  • 1,6B parametrin malli, joka toimii 10GB VRAM:lla
  • Äänen kloonausominaisuudet audio promptingin kautta

Dia 1.6B TTS Pääominaisuudet

Dia 1.6B TTS Poikkeuksellinen Puheen Laatu

Dia 1.6B TTS tuottaa uskomattoman luonnollisen kuuloisia ääniä ihmismäisellä intonaatiolla, rytmillä ja tunteella. Edistynyt AI-malli luo puhetta, joka on lähes erottamaton ihmisäänistä.

Dia 1.6B TTS: Usean Puhujan Tuki

Luo helposti usean puhujan keskusteluja käyttämällä yksinkertaisia ​​tunnisteita kuten [S1] ja [S2] määrittääksesi eri ääniä tekstissäsi, ylläpitäen johdonmukaista ja luonnollista vuoropuhelua Dia 1.6B TTS:n kanssa.

Äänen Kloonaus Dia 1.6B TTS:llä

Kloonaa tiettyjä lauluääniominaisuuksia käyttämällä audio prompting -ominaisuutta, mahdollistaen johdonmukaisen ääni-identiteetin useissa generoinneissa mukautettuun puheen tuotokseen Dia 1.6B TTS:llä.

Dia 1.6B TTS: Avoimen Lähdekoodin Malli

Julkaistu Apache 2.0 -lisenssillä, sallien ilmaisen käytön henkilökohtaisiin ja kaupallisiin tarkoituksiin. Täydelliset mallipainot ja koodi Dia 1.6B TTS:lle ovat saatavilla GitHubissa.

Dia 1.6B TTS Audio Demot

Dia 1.6B TTS: Vakiokäyttö (Esimerkki 1)

Perusvuoropuhelun generointiesimerkki Dia 1.6B TTS:stä.

Dia 1.6B TTS: Luonnollinen Keskustelu (Esimerkki 2)

Esittelee vapaamuotoisia vuorovaikutuksia käyttäen Dia 1.6B TTS:ää.

Dia 1.6B TTS: Emotionaalinen Vuoropuhelu (Esimerkki 3)

Ilmeikäs, korkean tunteen puheen esimerkki käyttäen Dia 1.6B TTS:ää.

Dia 1.6B TTS: Ei-Verbaaliset Äänet (Esimerkki 4)

Sisältää yskimistä, nuuskimista, naurua, jotka Dia 1.6B TTS on generoinut.

Dia 1.6B TTS: Rap-Esimerkki (Esimerkki 5)

Esittelee rytmiä ja riimejä käyttäen Dia 1.6B TTS:ää.

Dia 1.6B TTS: Audio Prompting -ominaisuus (Esimerkki 6)

Esimerkki äänen kloonauksesta käyttäen Dia 1.6B TTS audio prompteja.

Huomautus: Käyttääksesi audio prompteja korkealaatuiseen tuotokseen Dia 1.6B TTS:ssä, lisää vastaava skripti syötetekstisi eteen. Automaattista transkriptiota harkitaan käytön helpottamiseksi.

Dia 1.6B TTS Video Esimerkit

Dia 1.6B TTS: Podcast-Laatu

Esittelee potentiaalin podcast-generointiin käyttäen Dia 1.6B TTS:ää.

Dia 1.6B TTS: Mallin Esittely

Korostaa Dia 1.6B TTS:n 1,6B parametrin mallia.

Dia 1.6B TTS: Ultra-Realistinen Vuoropuhelu

Esittelee yhden läpikäynnin generoinnin käyttäen Dia 1.6B TTS:ää.

Kuinka Dia 1.6B TTS Toimii: Tekstistä Realistiseen Vuoropuheluun

  1. 1. Valmistele Skriptisi Dia 1.6B TTS:lle

    Kirjoita tai liitä teksti, jonka haluat Dia 1.6B TTS:n muuntavan. Käytä yksinkertaisia ​​tunnisteita kuten [S1] ja [S2] lauseiden edessä määrittääksesi eri puhujien ääniä. Voit myös sisällyttää ei-verbaalisia vihjeitä kuten (nauraa) tai (yskii) lisätäksesi realismia.

  2. 2. (Valinnainen) Tarjoa Audio Prompteja Dia 1.6B TTS:lle

    Kloonataksesi tietyn äänen tai ohjataksesi emotionaalista sävyä Dia 1.6B TTS:llä, lataa lyhyt audionäyte (5-15 sekuntia) ja sen tarkka transkriptio (puhuja-tunnisteilla) lisättynä pääskriptin eteen syötteessäsi.

  3. 3. Generoi Audiota Dia 1.6B TTS:llä

    Suorita Dia 1.6B TTS -malli (paikallisesti sovelluksen kautta tai käyttäen verkko-demoa). Malli käsittelee koko skriptin yhdessä läpikäynnissä, generoi den saumatonta vuoropuhelua.

  4. 4. Kuuntele ja Lataa Dia 1.6B TTS Tuotos

    Toista generoitu audio suoraan Dia 1.6B TTS:stä. Tuotos kaappaa luonnollisen intonaation, rytmin ja jopa ei-verbaaliset vihjeet, luoden ultra-realistisen kuuntelukokemuksen. Lataa audiotiedosto projekteihisi.

Dia 1.6B TTS Asennusopas

### Windows Installation

1. Clone the repository
   git clone https://github.com/nari-labs/dia.git
   cd dia

2. Create a Python virtual environment (Python 3.10 recommended)
   python -m venv venv
   venv\Scripts\activate.bat

3. Install dependencies
   python -m pip install --upgrade pip
   pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
   pip install -r requirements.txt

4. Download model weights
   # These will download automatically or can be manually downloaded from Hugging Face

5. Launch the application
   python app.py

Dia 1.6B TTS Tekniset Tiedot

Dia 1.6B TTS Architecture Diagram

Dia 1.6B TTS - Ultra-Realistinen Vuoropuhelun Synteesimalli

Dia 1.6B TTS on huipputeknologinen text-to-speech-malli 1,6B parametrilla, joka generoi ihmisen kaltaisia ​​ääniä luonnollisella intonaatiolla, rytmillä ja tunteella. Yritystason GPU:illa Dia 1.6B TTS voi generoida audiota reaaliajassa, A4000 GPU:n tuottaessa noin 40 tokenia/sekunti (86 tokenia vastaa 1 sekuntia audiota).

Täysi versio vaatii noin 10GB VRAM:ia toimiakseen. Kvantisoituja versioita Dia 1.6B TTS:stä suunnitellaan tuleviin päivityksiin parantamaan saavutettavuutta alemman tason laitteistossa.

Dia TTS Hinnoittelu

Osta Dia TTS äänen luonnin krediittejä kokeaksesi ammattimaisia AI text-to-speech-palveluita.

Basic

Vuotuinen Basic-suunnitelma paremmalla hinnalla.

$9.9$7.9/kuukausi
  • 12000 krediittiä vuodessa (1000/kuukausi)
  • Laskutetaan vuosittain ($94.80/vuosi)
  • Korkealaatuiset äänituotokset
  • Standardi asiakastuki

Vuotuiset säästöt! 20% alennus vs kuukausittain!

Suosituin

Pro

Vuotuinen Pro-suunnitelma, paras valinta ammattilaisille.

$19.9$15.9/kuukausi
  • 26400 krediittiä vuodessa (2200/kuukausi)
  • Laskutetaan vuosittain ($190.80/vuosi)
  • Korkealaatuiset äänituotokset
  • Ensisijainen asiakastuki

Vuotuiset säästöt! 20% alennus vs kuukausittain!

Ultra

Vuotuinen Ultra-suunnitelma, täydellinen tiimeille ja yrityksille.

$36.9$29.9/kuukausi
  • 54000 krediittiä vuodessa (4500/kuukausi)
  • Laskutetaan vuosittain ($358.80/vuosi)
  • Korkealaatuiset äänituotokset
  • VIP-asiakastuki

Vuotuiset säästöt! 19% alennus vs kuukausittain!