Dia2-2B — Nari Labsin seuraavan sukupolven avoimen lähdekoodin tekstistä puheeksi -malli
Dia2-2B on Nari Labsin kehittämä 2 miljardin parametrin avoimen lähdekoodin TTS-malli — Dia 1.6B:n seuraaja, jossa on parempi äänenlaatu, rikkaammat tunteet ja suoratoistomuotoinen dialogi. Jo yli 11 000 latausta Hugging Facessa. Kiinnostaako AI-puhesynteesi? Kokeile ilmaiseksi AI-äänigeneraattoriamme ja AI-ääniklonausta.
Dia2-2B mallin tekniset tiedot
Mikä tekee Dia2-2B:stä erityisen
2 miljardia parametria — Enemmän tehoa, parempi äänenlaatu
Dia2-2B sisältää 2 miljardia parametria verrattuna alkuperäisen Dia-mallin 1,6 miljardiin. Suurempi arkkitehtuuri tallentaa hienompia äänellisiä vivahteita, sujuvampaa prosodiaa ja luonnollisempaa intonaatiota englannin kielelle.
Tunnetietoinen puhesynteesi
Dia2-2B ymmärtää kontekstin ja säätää automaattisesti tunneilmaisua — ilo, suru, innostus, rauhallisuus ja yllätys virtaavat luonnollisesti ilman manuaalista säätöä. Malli on erityisesti koulutettu ilmeikkääseen dialogin tuottamiseen.
Rakennettu reaaliaikaiseen suorituskykyyn
Dia2-2B tarjoaa CUDA-graafituen ja optimoidut päättelyputket. bfloat16-tarkkuudella ja suoratoistoulostulolla se tuottaa matalan viiveen ääntä, joka sopii ihanteellisesti tuotantotyönkulkuihin.
Suoratoistodialogi — Reaaliaikainen generointi
Dia2-2B ei tarvitse koko tekstiä etukäteen — se aloittaa äänen generoinnin jo ensimmäisistä sanoista. Täydellinen reaaliaikaiselle keskustelu-AI:lle, live-avustajille ja interaktiivisille sovelluksille.
Täysin avoin lähdekoodi — Suorita missä tahansa
Dia2-2B on julkaistu avoimena lähdekoodina Hugging Facessa. Suorita se paikallisesti, ota se käyttöön omilla palvelimillasi tai käytä sitä Dia TTS:n kautta — valinta on sinun. Ei toimittajalukkoa, täysi läpinäkyvyys.
Taistelutestettu — Yli 11 000 latausta
Yli 11 000 latauksella ja 157 tykkäyksellä Hugging Facessa Dia2-2B on jo tuhansien kehittäjien, tutkijoiden ja sisällöntuottajien luottama ympäri maailmaa.