Dia2-2B — מודל טקסט לדיבור בקוד פתוח מהדור הבא מ-Nari Labs
Dia2-2B הוא מודל TTS בקוד פתוח עם 2 מיליארד פרמטרים מ-Nari Labs — היורש של Dia 1.6B עם איכות קול מעולה, רגשות עשירים יותר ודיאלוג בסטרימינג. כבר מעל 11,000 הורדות ב-Hugging Face. מתעניינים בטכנולוגיית קול AI? נסו בחינם את מחולל הקול AI ושיבוט קול AI שלנו.
מפרט מודל Dia2-2B
מה מייחד את Dia2-2B
2 מיליארד פרמטרים — יותר עוצמה, איכות קול טובה יותר
Dia2-2B מכיל 2 מיליארד פרמטרים לעומת 1.6 מיליארד במודל Dia המקורי. הארכיטקטורה הגדולה יותר לוכדת ניואנסים קוליים עדינים יותר, פרוזודיה חלקה יותר ואינטונציה טבעית יותר לדיבור באנגלית.
סינתזה קולית מודעת רגשות
Dia2-2B מבין הקשר ומתאים אוטומטית את הביטוי הרגשי — שמחה, עצב, התרגשות, רוגע והפתעה זורמים באופן טבעי ללא כוונון ידני. המודל אומן במיוחד ליצירת דיאלוג אקספרסיבי.
בנוי לביצועים בזמן אמת
Dia2-2B מציע תמיכה בגרפי CUDA וצינורות הסקה אופטימליים. עם דיוק bfloat16 ופלט בסטרימינג, הוא מספק יצירת אודיו בהשהיה נמוכה, אידיאלי לזרימות עבודה בייצור.
דיאלוג בסטרימינג — יצירה בזמן אמת
Dia2-2B לא צריך את כל הטקסט מראש — הוא מתחיל ליצור אודיו כבר מהמילים הראשונות. מושלם לבינה מלאכותית שיחתית בזמן אמת, עוזרים חיים ואפליקציות אינטראקטיביות.
קוד פתוח לחלוטין — הרץ בכל מקום
Dia2-2B שוחרר כקוד פתוח ב-Hugging Face. הריצו אותו מקומית, פרסו אותו על השרתים שלכם או השתמשו בו דרך Dia TTS — הבחירה שלכם. ללא נעילת ספק, שקיפות מלאה.
מוכח בשטח — מעל 11,000 הורדות
עם מעל 11,000 הורדות ו-157 לייקים ב-Hugging Face, Dia2-2B כבר זוכה לאמון של אלפי מפתחים, חוקרים ויוצרים ברחבי העולם.