Dia 1.6B TTS
מודל דיאלוג דיבור AI מציאותי במיוחד
מודל המרת טקסט לדיבור בקוד פתוח עם 1.6B פרמטרים מבית Nari Labs שמייצר דיבור דמוי אנושי עם אינטונציה, קצב ורגש טבעיים. הכירו את Dia 1.6B TTS.

מה זה Dia 1.6B TTS?
Dia 1.6B TTS הוא מודל המרת טקסט לדיבור AI מתקדם המיועד לסינתזת דיאלוגים מציאותית במיוחד. פותח על ידי Nari Labs ושוחרר תחת רישיון Apache 2.0, Dia 1.6B TTS מציע פלט דיבור טבעי ואקספרסיבי המתחרה בפתרונות מסחריים.
- סינתזת דיבור עם אינטונציה טבעית, קצב וביטוי רגשי באמצעות Dia 1.6B TTS
- יצירת דיאלוג רב-דוברים מותאמת עם Dia 1.6B TTS
- מודל 1.6B פרמטרים שרץ על 10GB VRAM
- יכולות שכפול קול באמצעות audio prompting
תכונות ליבה של Dia 1.6B TTS
Dia 1.6B TTS איכות דיבור יוצאת דופן
Dia 1.6B TTS מייצר קולות טבעיים להפליא עם אינטונציה, קצב ורגש דמויי אנוש. מודל ה-AI המתקדם יוצר דיבור שכמעט בלתי ניתן להבדלה מקולות אנושיים.
Dia 1.6B TTS: תמיכה רב-דוברים
צור בקלות שיחות רב-דוברים באמצעות תגים פשוטים כמו [S1] ו-[S2] לציון קולות שונים בטקסט שלך, תוך שמירה על דיאלוג עקבי וטבעי עם Dia 1.6B TTS.
שכפול קול עם Dia 1.6B TTS
שכפל מאפיינים ווקאליים ספציפיים באמצעות תכונת audio prompting, המאפשרת זהות קולית עקבית על פני יצירות מרובות לפלט דיבור מותאם אישית עם Dia 1.6B TTS.
Dia 1.6B TTS: מודל קוד פתוח
שוחרר תחת רישיון Apache 2.0, המאפשר שימוש חופשי למטרות אישיות ומסחריות. משקלי מודל קוד מלאים עבור Dia 1.6B TTS זמינים ב-GitHub.
הדגמות אודיו Dia 1.6B TTS
Dia 1.6B TTS: שימוש סטנדרטי (דוגמה 1)
דוגמה בסיסית ליצירת דיאלוג מ-Dia 1.6B TTS.
Dia 1.6B TTS: שיחה טבעית (דוגמה 2)
מדגים אינטראקציות מזדמנות באמצעות Dia 1.6B TTS.
Dia 1.6B TTS: דיאלוג רגשי (דוגמה 3)
דוגמה לדיבור אקספרסיבי עם רגש גבוה באמצעות Dia 1.6B TTS.
Dia 1.6B TTS: צלילים לא מילוליים (דוגמה 4)
כולל שיעול, נחירות, צחוק שנוצרו על ידי Dia 1.6B TTS.
Dia 1.6B TTS: דוגמת ראפ (דוגמה 5)
מציג קצב וחריזה באמצעות Dia 1.6B TTS.
Dia 1.6B TTS: תכונת Audio Prompting (דוגמה 6)
דוגמה לשכפול קול באמצעות audio prompts של Dia 1.6B TTS.
הערה: כדי להשתמש ב-audio prompts לפלט באיכות גבוהה ב-Dia 1.6B TTS, הוסף את הסקריפט המתאים לפני טקסט הקלט שלך. תמלול אוטומטי נשקל כדי להקל על השימוש.
דוגמאות וידאו Dia 1.6B TTS
Dia 1.6B TTS: איכות פודקאסט
מדגים את הפוטנציאל ליצירת פודקאסטים באמצעות Dia 1.6B TTS.
Dia 1.6B TTS: הכרת המודל
מדגיש את מודל 1.6B הפרמטרים של Dia 1.6B TTS.
Dia 1.6B TTS: דיאלוג מציאותי במיוחד
מציג יצירה במעבר אחד באמצעות Dia 1.6B TTS.
איך Dia 1.6B TTS עובד: מטקסט לדיאלוג מציאותי
1. הכן את הסקריפט שלך עבור Dia 1.6B TTS
כתוב או הדבק את הטקסט שאתה רוצה ש-Dia 1.6B TTS יהמיר. השתמש בתגים פשוטים כמו [S1] ו-[S2] לפני משפטים כדי להקצות קולות דוברים שונים. אתה יכול גם לכלול רמזים לא מילוליים כמו (צוחק) או (משתעל) כדי להוסיף ריאליזם.
2. (אופציונלי) ספק Audio Prompts ל-Dia 1.6B TTS
כדי לשכפל קול ספציפי או להנחות טון רגשי עם Dia 1.6B TTS, העלה דגימת אודיו קצרה (5-15 שניות) ותמלול מדויק שלה (עם תגי דוברים) שמתווסף לסקריפט הראשי בקלט שלך.
3. צור אודיו עם Dia 1.6B TTS
הפעל את מודל Dia 1.6B TTS (מקומית דרך האפליקציה או באמצעות ההדגמה המקוונת). המודל מעבד את כל הסקריפט במעבר אחד, ויוצר דיאלוג חלק.
4. האזן והורד את פלט Dia 1.6B TTS
נגן את האודיו שנוצר ישירות מ-Dia 1.6B TTS. הפלט לוכד אינטונציה טבעית, קצב ואפילו רמזים לא מילוליים, ויוצר חוויית האזנה מציאותית במיוחד. הורד את קובץ האודיו עבור הפרויקטים שלך.
מדריך התקנה Dia 1.6B TTS
### Windows Installation
1. Clone the repository
git clone https://github.com/nari-labs/dia.git
cd dia
2. Create a Python virtual environment (Python 3.10 recommended)
python -m venv venv
venv\Scripts\activate.bat
3. Install dependencies
python -m pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
4. Download model weights
# These will download automatically or can be manually downloaded from Hugging Face
5. Launch the application
python app.pyמידע טכני Dia 1.6B TTS

Dia 1.6B TTS - מודל סינתזת דיאלוגים מציאותי במיוחד
Dia 1.6B TTS הוא מודל המרת טקסט לדיבור מתקדם עם 1.6B פרמטרים שמייצר קולות דמויי אנוש עם אינטונציה, קצב ורגש טבעיים. על GPUs ברמה ארגונית, Dia 1.6B TTS יכול לייצר אודיו בזמן אמת, עם GPU A4000 שמייצר כ-40 טוקנים/שנייה (86 טוקנים שווים לשנייה אחת של אודיו).
הגרסה המלאה דורשת בערך 10GB של VRAM כדי לרוץ. גרסאות מקוונטזות של Dia 1.6B TTS מתוכננות לעדכונים עתידיים כדי לשפר נגישות על חומרה בעלת ביצועים נמוכים יותר.
תמחור Dia TTS
רכוש קרדיטים ליצירת קול Dia TTS כדי לחוות שירותי text-to-speech AI מקצועיים.
Basic
תוכנית Basic שנתית עם תמחור טוב יותר.
- 12000 קרדיטים לשנה (1000/חודש)
- מחויב שנתית ($94.80/שנה)
- פלטי אודיו באיכות גבוהה
- תמיכת לקוחות סטנדרטית
חיסכון שנתי! 20% הנחה לעומת חודשי!
Pro
תוכנית Pro שנתית, הבחירה הטובה ביותר לאנשי מקצוע.
- 26400 קרדיטים לשנה (2200/חודש)
- מחויב שנתית ($190.80/שנה)
- פלטי אודיו באיכות גבוהה
- תמיכת לקוחות עדיפות
חיסכון שנתי! 20% הנחה לעומת חודשי!
Ultra
תוכנית Ultra שנתית, מושלמת לצוותים וארגונים.
- 54000 קרדיטים לשנה (4500/חודש)
- מחויב שנתית ($358.80/שנה)
- פלטי אודיו באיכות גבוהה
- תמיכת לקוחות VIP
חיסכון שנתי! 19% הנחה לעומת חודשי!