24 בספט׳ 2020, 22:24

ההגדרות מתחלקות לשני חלקים

חלק ראשון STT - קבלת הקלטה מהמאזין והמרת ההקלטה לטקסט על ידי מנוע זיהוי דיבור. ההמרה כרוכה בעלות יחידות לפרטים נוספים לחצו כאן
חלק שני TTS - קבלת הטקסט שהתקבל והמרת הטקסט לדיבור על ידי מנוע הקראת טקסט. ההמרה הזאת היא בחינם.

מדובר בשני חלקים שונים ונפרדים, (מנוע זיהוי דיבור ומנוע הקראת טקסט) עם זאת בהרבה מקומות הדבר משולב ביחד.

ההגדרות עבור החלק הראשון
בברירת מחדל המערכת מתייחסת אל ההקלטה כעברית וממירה לטקסט בעברית
ניתן להגדיר:

lang=en-US

ואז המערכת תתייחס אל ההקלטה כאנגלית ארה"ב. לרשימת השפות המלאות לחצו כאן.

ההגדרות עבור החלק השני
בברירת מחדל המערכת משמיע בקול "אליק" (קול גברי) כאילו מוגדר כך

voice=Elik_2100
tts_voice=Elik_2100

קול גברי נוסף "יעקב"

voice=Jacob
tts_voice=Jacob

למערכות של נשים וכד' ניתן לשנות לקול של אשה
לקול של "סיוון"

voice=Sivan
tts_voice=Sivan

לקול של "אסנת"

voice=Osnat
tts_voice=Osnat

אם רוצים לשנות מהירות
ברירת מחדל היא 0
ניתן להגדיר יותר מהר:

tts_rate=10

מאפס ומעלה עד 10, 10 זה המהירות הכי גבוהה
ומאפס ומטה זה יותר לאט, עד מינוס 10

tts_rate=-10

מינוס 10 זה המהירות הנמוכה ביותר
ניתן לבחור כל מספר מעשר ועד מינוס עשר

הודעות מערכת קשורות
M1611 דיבור לא ברור
M1613 לא זוהה דיבור