Dia 1.6B TTS

מודל דיאלוג דיבור AI מציאותי במיוחד

מודל המרת טקסט לדיבור בקוד פתוח עם 1.6B פרמטרים מבית Nari Labs שמייצר דיבור דמוי אנושי עם אינטונציה, קצב ורגש טבעיים. הכירו את Dia 1.6B TTS.

Dia TTS Hero Animation

מה זה Dia 1.6B TTS?

Dia 1.6B TTS הוא מודל המרת טקסט לדיבור AI מתקדם המיועד לסינתזת דיאלוגים מציאותית במיוחד. פותח על ידי Nari Labs ושוחרר תחת רישיון Apache 2.0, Dia 1.6B TTS מציע פלט דיבור טבעי ואקספרסיבי המתחרה בפתרונות מסחריים.

  • סינתזת דיבור עם אינטונציה טבעית, קצב וביטוי רגשי באמצעות Dia 1.6B TTS
  • יצירת דיאלוג רב-דוברים מותאמת עם Dia 1.6B TTS
  • מודל 1.6B פרמטרים שרץ על 10GB VRAM
  • יכולות שכפול קול באמצעות audio prompting

תכונות ליבה של Dia 1.6B TTS

Dia 1.6B TTS איכות דיבור יוצאת דופן

Dia 1.6B TTS מייצר קולות טבעיים להפליא עם אינטונציה, קצב ורגש דמויי אנוש. מודל ה-AI המתקדם יוצר דיבור שכמעט בלתי ניתן להבדלה מקולות אנושיים.

Dia 1.6B TTS: תמיכה רב-דוברים

צור בקלות שיחות רב-דוברים באמצעות תגים פשוטים כמו [S1] ו-[S2] לציון קולות שונים בטקסט שלך, תוך שמירה על דיאלוג עקבי וטבעי עם Dia 1.6B TTS.

שכפול קול עם Dia 1.6B TTS

שכפל מאפיינים ווקאליים ספציפיים באמצעות תכונת audio prompting, המאפשרת זהות קולית עקבית על פני יצירות מרובות לפלט דיבור מותאם אישית עם Dia 1.6B TTS.

Dia 1.6B TTS: מודל קוד פתוח

שוחרר תחת רישיון Apache 2.0, המאפשר שימוש חופשי למטרות אישיות ומסחריות. משקלי מודל קוד מלאים עבור Dia 1.6B TTS זמינים ב-GitHub.

הדגמות אודיו Dia 1.6B TTS

Dia 1.6B TTS: שימוש סטנדרטי (דוגמה 1)

דוגמה בסיסית ליצירת דיאלוג מ-Dia 1.6B TTS.

Dia 1.6B TTS: שיחה טבעית (דוגמה 2)

מדגים אינטראקציות מזדמנות באמצעות Dia 1.6B TTS.

Dia 1.6B TTS: דיאלוג רגשי (דוגמה 3)

דוגמה לדיבור אקספרסיבי עם רגש גבוה באמצעות Dia 1.6B TTS.

Dia 1.6B TTS: צלילים לא מילוליים (דוגמה 4)

כולל שיעול, נחירות, צחוק שנוצרו על ידי Dia 1.6B TTS.

Dia 1.6B TTS: דוגמת ראפ (דוגמה 5)

מציג קצב וחריזה באמצעות Dia 1.6B TTS.

Dia 1.6B TTS: תכונת Audio Prompting (דוגמה 6)

דוגמה לשכפול קול באמצעות audio prompts של Dia 1.6B TTS.

הערה: כדי להשתמש ב-audio prompts לפלט באיכות גבוהה ב-Dia 1.6B TTS, הוסף את הסקריפט המתאים לפני טקסט הקלט שלך. תמלול אוטומטי נשקל כדי להקל על השימוש.

דוגמאות וידאו Dia 1.6B TTS

Dia 1.6B TTS: איכות פודקאסט

מדגים את הפוטנציאל ליצירת פודקאסטים באמצעות Dia 1.6B TTS.

Dia 1.6B TTS: הכרת המודל

מדגיש את מודל 1.6B הפרמטרים של Dia 1.6B TTS.

Dia 1.6B TTS: דיאלוג מציאותי במיוחד

מציג יצירה במעבר אחד באמצעות Dia 1.6B TTS.

איך Dia 1.6B TTS עובד: מטקסט לדיאלוג מציאותי

  1. 1. הכן את הסקריפט שלך עבור Dia 1.6B TTS

    כתוב או הדבק את הטקסט שאתה רוצה ש-Dia 1.6B TTS יהמיר. השתמש בתגים פשוטים כמו [S1] ו-[S2] לפני משפטים כדי להקצות קולות דוברים שונים. אתה יכול גם לכלול רמזים לא מילוליים כמו (צוחק) או (משתעל) כדי להוסיף ריאליזם.

  2. 2. (אופציונלי) ספק Audio Prompts ל-Dia 1.6B TTS

    כדי לשכפל קול ספציפי או להנחות טון רגשי עם Dia 1.6B TTS, העלה דגימת אודיו קצרה (5-15 שניות) ותמלול מדויק שלה (עם תגי דוברים) שמתווסף לסקריפט הראשי בקלט שלך.

  3. 3. צור אודיו עם Dia 1.6B TTS

    הפעל את מודל Dia 1.6B TTS (מקומית דרך האפליקציה או באמצעות ההדגמה המקוונת). המודל מעבד את כל הסקריפט במעבר אחד, ויוצר דיאלוג חלק.

  4. 4. האזן והורד את פלט Dia 1.6B TTS

    נגן את האודיו שנוצר ישירות מ-Dia 1.6B TTS. הפלט לוכד אינטונציה טבעית, קצב ואפילו רמזים לא מילוליים, ויוצר חוויית האזנה מציאותית במיוחד. הורד את קובץ האודיו עבור הפרויקטים שלך.

מדריך התקנה Dia 1.6B TTS

### Windows Installation

1. Clone the repository
   git clone https://github.com/nari-labs/dia.git
   cd dia

2. Create a Python virtual environment (Python 3.10 recommended)
   python -m venv venv
   venv\Scripts\activate.bat

3. Install dependencies
   python -m pip install --upgrade pip
   pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
   pip install -r requirements.txt

4. Download model weights
   # These will download automatically or can be manually downloaded from Hugging Face

5. Launch the application
   python app.py

מידע טכני Dia 1.6B TTS

Dia 1.6B TTS Architecture Diagram

Dia 1.6B TTS - מודל סינתזת דיאלוגים מציאותי במיוחד

Dia 1.6B TTS הוא מודל המרת טקסט לדיבור מתקדם עם 1.6B פרמטרים שמייצר קולות דמויי אנוש עם אינטונציה, קצב ורגש טבעיים. על GPUs ברמה ארגונית, Dia 1.6B TTS יכול לייצר אודיו בזמן אמת, עם GPU A4000 שמייצר כ-40 טוקנים/שנייה (86 טוקנים שווים לשנייה אחת של אודיו).

הגרסה המלאה דורשת בערך 10GB של VRAM כדי לרוץ. גרסאות מקוונטזות של Dia 1.6B TTS מתוכננות לעדכונים עתידיים כדי לשפר נגישות על חומרה בעלת ביצועים נמוכים יותר.

תמחור Dia TTS

רכוש קרדיטים ליצירת קול Dia TTS כדי לחוות שירותי text-to-speech AI מקצועיים.

Basic

תוכנית Basic שנתית עם תמחור טוב יותר.

$9.9$7.9/חודש
  • 12000 קרדיטים לשנה (1000/חודש)
  • מחויב שנתית ($94.80/שנה)
  • פלטי אודיו באיכות גבוהה
  • תמיכת לקוחות סטנדרטית

חיסכון שנתי! 20% הנחה לעומת חודשי!

הפופולרי ביותר

Pro

תוכנית Pro שנתית, הבחירה הטובה ביותר לאנשי מקצוע.

$19.9$15.9/חודש
  • 26400 קרדיטים לשנה (2200/חודש)
  • מחויב שנתית ($190.80/שנה)
  • פלטי אודיו באיכות גבוהה
  • תמיכת לקוחות עדיפות

חיסכון שנתי! 20% הנחה לעומת חודשי!

Ultra

תוכנית Ultra שנתית, מושלמת לצוותים וארגונים.

$36.9$29.9/חודש
  • 54000 קרדיטים לשנה (4500/חודש)
  • מחויב שנתית ($358.80/שנה)
  • פלטי אודיו באיכות גבוהה
  • תמיכת לקוחות VIP

חיסכון שנתי! 19% הנחה לעומת חודשי!