בוט לתמלול טקסט למשתמשי מסלול אינטרנט מצומצם
-
חשבתי שכדאי ליצור מייל שיקבל הודעות כתובות ויחזיר אותן כקובץ שמע, לתועלת מי שכל האתרים הסטנדרטים של הקראת טקסטים חסומים להם.
מה שצריך לעשות זה ככה(ע"פ גמיני):
א. להקדיש לעניין כתובת מייל (ולכן אני לא עושה את זה בעצמי).
ב. להיכנס לאתר Make.com ולהירשם (המסלול החינמי מאפשר עד 1,000 פעולות בחודש).
בלוח הבקרה (Dashboard), ללחוץ על הכפתור הסגול "+ Create a new scenario" בפינה העליונה.
ללחוץ על העיגול הגדול עם הפלוס במרכז המסך.
לחפש את האפליקציה "Gmail" ולבחור בה.
לבחור בפעולה "Watch Emails".
ג. ללחוץ על "Add" ולחבר את חשבון הג'ימייל שהוקדש לעניין. לבחור ב-"Inbox".
ללחוץ על OK. הוא ישאל מאיפה להתחיל – יש לבחור ב-"From now on".
ד. כעת צריך כלי שיקרא את הטקסט. נשתמש ב-Google Cloud Text-to-Speech (הוא הכי איכותי ותומך בעברית מצוין, לפי גמיני, ליידיש מומלץ להשתמש בOPENAI, כמו שיפורט בספוילר הקרוב):- לחץ על הפלוס הקטן שיוצא מהעיגול של Gmail כדי להוסיף מודול חדש.
- חפש את "Google Cloud Text-to-Speech".
- בחר בפעולה "Synthesize Audio".
- חיבור: תצטרך להזין "API Key" מחשבון ה-Google Cloud שלך (זה דורש פתיחת פרויקט בחינם ב-Google Cloud Console, פרטים בספוילר):
||היכנס ל-https://console.cloud.google.com/
בראש המסך, ליד הלוגו של Google Cloud, לחץ על בחירת פרויקט (או "Select a project") ואז על "New Project".
תן לפרויקט שם ולחץ על Create.
בשורת החיפוש העליונה ב-Console, הקלד "Cloud Text-to-Speech API".
לחץ על התוצאה הראשונה ואז על כפתור הכחול "Enable". (זה מאפשר לפרויקט שלך להשתמש בשירות ההקראה). - יצירת מפתח גישה (API Key)
בתפריט הצדדי (השלושה קווים), בחר ב-APIs & Services ואז ב-Credentials.
לחץ על הכפתור העליון "+ Create Credentials" ובחר ב-"API key".
יקפוץ חלון עם קוד ארוך – זהו המפתח שלך. העתק ושמור אותו בצד. - חזור לטאב של Make, למודול של Google Cloud Text-to-Speech.
בחלון הגדרת המודול, איפה שכתוב "Connection", לחץ על Add.
בשדה API Key, הדבק את הקוד שהעתקת מגוגל.
לחץ על Save (או OK).
וזהו.
הערה חשובה על עלויות (בחינם):
גוגל נותנת מכסה חינמית נדיבה מאוד בכל חודש (כמיליון תווים לקולות סטנדרטיים). עם זאת, הם דורשים הזנת אמצעי תשלום בחשבון ה-Cloud כדי לוודא שאתה לא בוט. כל עוד לא תעבור את המכסה העצומה הזו, לא תחויב בשקל.
אם אתה מעדיף להימנע מ-Google Cloud, תוכל להשתמש במודול של OpenAI בתוך Make (אם יש לך שם חשבון בתשלום של כמה דולרים לחודש) שם הקוד ליידיש (כמו שהבטחתי למעלה) הוא
tts-1-hdאו לחפש שירות בשם VoiceRSS שמציע API פשוט בחינם עד רמה מסוימת ללא צורך בהגדרות מורכבות.||
5. הגדרות:- Text: לחץ על השדה ובחר במשתנה "Text Content" (זה התוכן של המייל שהגיע מהשלב הקודם).
שם יש להזין את השפה כך:
he-ILבפורמט הקובץ יש לבחור MP3.
ד. כעת יש לדאוג לשליחת הקובץ במייל חוזר:- לחץ שוב על הפלוס להוספת מודול אחרון.
- בחר שוב ב-"Gmail", אך הפעם בחר בפעולה "Send an Email".
- To: לחץ על השדה ובחר במשתנה "Sender: Email Address" מהשלב הראשון.
- Subject: כתוב משהו כמו: "קובץ השמע שלך מוכן".
- Content: כתוב משהו כמו "מצורף קובץ השמע לבקשתך".
- Attachments: לחץ על "Add attachment".
ב-Source file, בחר ב-"Google Cloud Text-to-Speech".
המערכת תזהה אוטומטית את הקובץ שנוצר בשלב הקודם.
לחץ על OK.
לחץ על כפתור השמירה (אייקון של דיסקט בתחתית).
ה. לחץ על "Run once" כדי לבדוק שהכל עובד.
שלח מייל לחשבון עם טקסט קצר.
אם הכל עבד, העבר את המתג בתחתית ל-ON כדי שהמערכת תעבוד אוטומטית.
בשלב הבא אפשר לשדרג להקראת קבצי PDF.
בהצלחה!
והנה ספוילר עם הוראות לבחירת קול
||לחץ על המודול של Google Cloud Text-to-Speech כדי לפתוח את חלון ההגדרות שלו.
גלול למטה עד שתראה את האזור שנקרא Voice Selection Parameters.
מה להגדיר שם (צעד אחר צעד):
Language Code: ודא שכתוב he-IL (עברית). ברגע שתבחר את הקוד הזה, רשימת הקולות תתעדכן לקולות הזמינים בשפה העברית.
Name: כאן קורה הקסם. פתח את הרשימה ותראה מספר אפשרויות. גוגל מציעה שני סוגי קולות עיקריים:
Standard: קולות בסיסיים, מעט מתכתיים.
Wavenet: קולות מבוססי בינה מלאכותית שנשמעים כמעט כמו אדם אמיתי. מומלץ לבחור באלו שמתחילים במילה he-IL-Wavenet.
ממש מתחת לבחירת הקול, תמצא את ה-Audio Config. כדאי לשים לב לפרמטרים הבאים:
Speaking Rate: קצב הדיבור. 1.0 הוא הקצב הרגיל. אם זה מהיר מדי, אפשר לשנות ל-0.9.
Pitch: טון הדיבור. אם הקול נשמע לך דק מדי או עמוק מדי, תוכל לשנות מעט את הערך (למשל 2.0 לטון גבוה יותר או -2.0 לנמוך יותר).||
-
מה הקשר לפה?
-
@MGM-IVR זה בקשה לפיתוח
לתועלת מי שכל האתרים הסטנדרטים של הקראת טקסטים חסומים להם
וכאן זה המקום שבו הם אמורים לחפש פתרונות.
-
@יעקב-יצחק כתב בבוט לתמלול טקסט למשתמשי מסלול אינטרנט מצומצם:
@MGM-IVR זה בקשה לפיתוח
זה בקשות לפיתוח במערכות של ימות המשיח.
הם אמורים לחפש בפורום טכנולוגי למשל מתמחים טופ