תפריט זיהוי דיבור - חינמי

איל משולש

תפריט זיהוי דיבור חינמי - הסבר

המודל עובד בצורה הבאה
א. שולח את ההקלטה לתמלול בGemini
ב. שולח את האפשרויות של שמות השלוחות
ג. מחזיר את מספר השלוחה למעבר
נוסף
ד.אפשרות שבמקום שלוחה למעבר יחזיר תשובה אחרת

~~עדיין חסרים כמה אפשריות שיהיו יותר נוחות ומי שיש לו רעיון איך לסדר את זה תבוא עליו הברכה (פרטים להלן)~~

בהקלטה ניתן להקליט גם טקסט וגם אותיות לדוג' מי שיקליט מם נון הא למד התמלול יזהה את המילה מנהל

חלק א - הוצאת מפתח API

יש להיכנס לפה להוציא מפתח API (חינם)
הדרכה עם תמונות בספוילר

חלק ב - ההגדרות בשלוחת התפריט

יש לפתוח שלוחה בתוך שלוחת התפריט בשם api (או כל שם אחר ולשנות בהגדרות לעיל)

א.את ההודעה אותה המאזינים ישמעו לפני ההקלטה יש להעלות לשלוחה בשם 000 (לדוג' "אנא אימרו את השלוחה ברצונכם לעבור אליה")

ב. ההגדרות בשלוחה api
בהגדרות אלו יש לכתוב כל טקסט לאיזה שלוחה יעביר
(רק לשלוחת בתוך שלוחת התפריט הזאת בלבד, למעבר לשלוחות בשלוחה אחרת ניתן להשתמש באפשרות המובאת באפשרויות נוספות)
בצורה הבאה:

api_add_2=1=מנהל
api_add_3=2=מזכירות
api_add_4=3=הנהלת חשבונות

בדוגמא הזאת מי שיקליט "מנהל" יועבר לשלוחה 1
מי שיקליט "מזכירות" יועבר לשלוחה 2
מי שיקליט "הנהלת חשבונות, יועבר לשלוחה 3
ניתן להוסיף עוד שמות עם ההגדרה הבאה ושלנות את המספר בסדר עוקב

api_add_5=

חדש: ניתן להגדיר מספר טקסטים בצורה הבאה (ניתן להוסיף כל אות באנגלית)

api_add_2=1A=מנהל כללי

בדוגמה הזאת גם מי שיאמר מנהל וגם מי שיאמר מנהל כללי יעבור לשלוחה 1
שאר ההגדרות בשלוחה
שימו לב עליכם להכניס 1. מפתח של גמיני 2. טוקן 3. נתיב שלוחת התפריט שלכם
נ.ב. כאשר פקודה DownloadFile תעבוד עם המפתחות החדשים יהיה אפשר לשים את המפתח במקום מספר מערכת וסיסמא

type=api
title=
api_link=https://dibur.onrender.com//run_transcription
api_add_0=key=פה יש להדביק את המפתח שקיבלתם 
api_add_1=token=פה יש לכתוב מספר מערכת נקודתיים סיסמה (0773137770:123456)
api_add_2=פה יש לכתוב מספר שלוחה = לשם אותו יש להקליט למעבר אליה
api_add_3=
api_add_4=

api_000=rapi,,record,נתיב שלוחת התפריט/api,,no

api_call_id_send=no
api_phone_send=no
api_did_send=no
api_enter_id_send=no
api_enter_id_name_send=no
api_time_send=no

ניתן להוסיף מוזיקה בהמתנה לתשובה מהשרת ע"י ההגדרה הזאת פה ניתן לראות שמות מוזיקה

api_wait_answer_music_on_hold=yes
api_wait_answer_music_on_hold_different=שם המוזיקה בהמתנה שלכם

נ.ב. כל ההקלטות נשמרות בתקייה בשם api בתוך שלוחת התפריט

אפשרויות שימוש נוספות

ניתן לקבל את תשובת השרת בצורה שרק המספר של ההקלטה חוזר ללא הגדרת המעבר
כך שמי שיגדיר כך, ויקליט "מנהל" התשובה תהיה 1

api_add_3=1=מנהל

ההגדרה היא (שימו לב לשמור על סדר עוקב)

api_add_2=text=yes

לאחמ"כ ניתן להגדיר את פעולות המערכת כמו פה
לדוגמא אם יוגדר כך

api_add_3=1=מנהל
api_add_3=2=מזכירות
api_answer_1=id_list_message=t-ההנהלה סגורה
api_answer_1=id_list_message=t-המזכירות סגורה

מי שיקליט "מנהל" ישמע ההנהלה סגורה" ומי שיקליט "מזכירות" ישמע "המזכירו סגורה"
ניתן גם להגדיר מעבר לשלוחות שונות, סליקת אשראי, מעבר לקובץ בהשמעת קבצים ועוד עיינו פה לכל ההגדרות

בעיה שאולי יהיה למשהו פתרון - נפתר

הבעיה נפתרה בזכות הרעיון של @פלמנמוני לשלוח את ההקלטה דרך המודל בעצמו

שמואל1

פוסט זה נמחק!

קו המוסיקה

@איל-משולש
לא ניסיתי,
אבל אם זה עובד זה מדהיים!!!!!!
אז תודה!!!!!!!!!!

איל משולש

@קו-המוסיקה אצלי זה עבד

קו המוסיקה

@איל-משולש פיצוץ!

פלמנמוני

@איל-משולש הכיוון יפה מאוד!
כמה נקודות לשיפור:

מומלץ מאוד שההקלטות יישלחו לשרת דרך מודל API הרגיל ולא בצורה כזו, ואז נרויח את ההודעה הבעייתית, לא יצטרכו טוקן, וזה ימנע התנגשות בין שתי משתמשים בו זמנית.
אולי כדאי להוסיף אפשרות להגדרת שתי זיהויים לאותה שלוחה, שבן מי שיאמר 'פלוני' ובין מי שיאמר 'אלמוני' יועברו לשלוחה פלונית.
שיעברו לשלוחה גם אם יגידו חלק מהטקסט המוגדר, כגון אם מוגדר 'מנהל כללי' אז גם מי שאמר 'מנהל' בלבד יועבר לשם, כל עוד אין התנגשות בין שתי שלוחות.

איל משולש

@פלמנמוני כתב בתפריט זיהוי דיבור - חינמי:

@איל-משולש הכיוון יפה מאוד!
כמה נקודות לשיפור:

מומלץ מאוד שההקלטות יישלחו לשרת דרך מודל API הרגיל ולא בצורה כזו, ואז נרויח את ההודעה הבעייתית, לא יצטרכו טוקן, וזה ימנע התנגשות בין שתי משתמשים בו זמנית.

א.זה לא יעזור לטוקן כי ההקלטה לא נשלחת לשרת אלא נשמרת במערכת, וממילא נצטרך להשתמש באותה פקודה כדי להוציא אותה, כמו"כ זה לא יעזור ל -2 שמתשמשים בו זמנית
ב. אפשר פשוט להוסיף לבד במודל API שיקליט וישמור בדיוק במקום שהיום נשמרת הקלטה, רק שצריך משהו שיגרום תמיד לקובץ 000 להימחק בסיום (אולי אני יוסיף בקוד שלאחר שלוקח את הקובץ מוחק אותו מייד)

אולי כדאי להוסיף אפשרות להגדרת שתי זיהויים לאותה שלוחה, שבן מי שיאמר 'פלוני' ובין מי שיאמר 'אלמוני' יועברו לשלוחה פלונית.

זה בלגן (כיון שזה מודר לפי שם פרמטר) אבל תמיד ניתן לפתוח עוד שלוחה שמעבירה לשלוחה ההיא (נניח שלוחה 1 למי שאמר מנהל ושלוה 2 שמעביאה לשלוחה 1 למי שאמר מנהל כללי)

שיעברו לשלוחה גם אם יגידו חלק מהטקסט המוגדר, כגון אם מוגדר 'מנהל כללי' אז גם מי שאמר 'מנהל' בלבד יועבר לשם, כל עוד אין התנגשות בין שתי שלוחות.

עריכה: בדקתי כשהקלטתי שם משפחה ופרטי של משהו והוא זיהה אפי' שהיה מוגדר רק שם משפחה

פלמנמוני

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

עריכה: בדקתי כשהקלטתי שם משפחה ופרטי של משהו והוא זיהה אפי' שהיה מוגדר רק שם משפחה

כוונתי למקרה הפוך, שמוגדר גם שם פרטי אבל הוא אמר רק שם משפחה

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

זה בלגן (כיון שזה מודר לפי שם פרמטר) אבל תמיד ניתן לפתוח עוד שלוחה שמעבירה לשלוחה ההיא (נניח שלוחה 1 למי שאמר מנהל ושלוה 2 שמעביאה לשלוחה 1 למי שאמר מנהל כללי)

אבל אפשר להגדיר בקוד שאם יש נניח סלש/ באמצע הפרמטר אז הוא יזהה כל חלק בנפרד כשייך לפרמטר ההוא

אגב, אשמח לקבל את הקוד ששולח לג'מיני את ההקלטה, שאוכל להשתמש איתה לעוד דברים

איל משולש

@פלמנמוני כתב בתפריט זיהוי דיבור - חינמי:

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

עריכה: בדקתי כשהקלטתי שם משפחה ופרטי של משהו והוא זיהה אפי' שהיה מוגדר רק שם משפחה

כוונתי למקרה הפוך, שמוגדר גם שם פרטי אבל הוא אמר רק שם משפחה

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

זה בלגן (כיון שזה מודר לפי שם פרמטר) אבל תמיד ניתן לפתוח עוד שלוחה שמעבירה לשלוחה ההיא (נניח שלוחה 1 למי שאמר מנהל ושלוה 2 שמעביאה לשלוחה 1 למי שאמר מנהל כללי)

אבל אפשר להגדיר בקוד שאם יש נניח סלש/ באמצע הפרמטר אז הוא יזהה כל חלק בנפרד כשייך לפרמטר ההוא

אפשר אבל מסובך (כל דבר כזה אח"כ צריך לבדוק שעובד וכו', ואני צריך לבקש מהבינה עוד פעם לכתוב את הקוד )

אגב - מה הפרמטר שמתקבל כשמקליטים?

פלמנמוני

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

אפשר אבל מסובך

נשמח אם תעשה את זה

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

אגב - מה הפרמטר שמתקבל כשמקליטים?

הסתפקתי בזה, לכן חשבתי אולי ההקלטה נשלחת איכשהו

CUBASE

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

כמו"כ זה לא יעזור ל -2 שמתשמשים בו זמנית
ב. אפשר פשוט להוסיף לבד במודל API שיקליט וישמור בדיוק במקום שהיום נשמרת הקלטה, רק שצריך משהו שיגרום תמיד לקובץ 000 להימחק בסיום (אולי אני יוסיף בקוד שלאחר שלוקח את הקובץ מוחק אותו מייד)
פשוט תעשה הקלטה לתיקייה /ApiTempFiles ואך תגדיר את שם ההקלטה ואז זה ממספר אוט', ותוסיף בקוד שלאחר הזיהוי - מוחק את ההקלטה

פלמנמוני

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

אגב - מה הפרמטר שמתקבל כשמקליטים?

עכשיו בדקתי, נשלח הנתיב בצורה כזו:

0000000000=8/2/001.wav

וכמובן שהאפסים משתנים לפי שם הפרמטר שהוגדר,
ולכן אפשר לעשות את זה בצורה כזו ונפתור את הבעיה הזו:

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

כרגע לאחר ההקלטה שומעים הודעה "לשמיעת הודעה הקש 1 לאישור הקש 2" וכו' מכיוון שזה שלוחת הקלטת הודעות מערכת ואין אפשרות לבטל את זה, הבעיה בשימוש בשלוחת הקלטות רגילה שכל פעם הוא מקליט את הקובץ הכי גבוה בשלוחה, והוא לוקח את מספר הקובץ שמופיע פה api_add_2=path=000, אם יש דרך לשנות את כל פעם שזה ישתנה לפי הקובץ שהוקלט יהיה אפשר לעשות שמועבר לבדיקה ללא ההודעה הנ"ל

איל משולש

@פלמנמוני סידרתי את מה שרצית לגבי האפשרות של כמה מילים לאותה שלוחה, עיין למעלה.
בהצלחה

אA

פוסט זה נמחק!

פלמנמוני

@איל-משולש ייש"כ,
אבל עדיין הייתי שמח לזה:

@פלמנמוני כתב בתפריט זיהוי דיבור - חינמי:

כוונתי למקרה הפוך, שמוגדר גם שם פרטי אבל הוא אמר רק שם משפחה

איל משולש

@פלמנמוני ניתן להגדיר עם ההגדרה החדשה, אבל בכל אופן אני בדקתי את מה שכבת לי וזה עבד, אבל מסתבר שזה תלוי כמה אפשרויות דומות אחרות יש

אA

@איל-משולש כתב בתפריט זיהוי דיבור - חינמי:

api_add_2=פה יש לכתוב מספר שלוחה = לשם אותו יש להקליט למעבר אליה

מה כוונת השורה הזו? מה אמורים להכניס שם?

12345

@איל-משולש
מטורף יפה מאוד
אולי אפשר לעשות על פי אותו רעיון גם זיהוי דיבור רגיל בחינם?

אA

@12345
ברעיון אפשר באותה הדרך, רק שיש הגבלה על הזיהוי דיבור וגם השרת עולה כסף (לשרת חינמי גם יש מגבלות).
אם יש מי שרוצה זיהוי דיבור בתשלום אני מכיר מישהו שמוכר כזה מודל.

12345

@אA
יש לו מגבלה כ”כ דרמטית שלא יכול לעזור בכלל?
בדרך כלל צריך את זה בגדול לצרכים די מינימלים