המרת טקסט לדיבור מטורפת!!!! ב ח י נ ם!!!!!
-
@שמעון-123 כתב בהמרת טקסט לדיבור מטורפת!!!! ב ח י נ ם!!!!!:
למה אין AI שממיר טקסט לדיבור על יידיש.
גוגל עדיין לא הגדירו לו אם לדבר ב'ווֹס' או ב'ווּס'...

-
Y y6714453 התייחס לנושא זה
-
פ פלוס התייחס לנושא זה
-
@אביי-ורבא כתב בהמרת טקסט לדיבור מטורפת!!!! ב ח י נ ם!!!!!:
הוספתי למודול הטקסט לדיבור של קוסמוס תמיכה בקולות החדשים הללו של גוגל ג'מיני
לעת עתה זה זמין לכלל המשתמשים, כמובן שצריך להכניס מפתח API של ג'מיני משלכם,
https://cosmos-beta.abaye.co/app/text-to-speechכרגע יש בממשק בס"ד,
- כל הקולות הזמינים בג'מיני, עם תיאור הקול בעברית
- תמיכה גם במודל הtts פרו של ג'מיני
- אפשרות להוספת פרומפט להגדרת תכונות הקול
- בוררי מהירות וטמפרטורה
- היסטוריה של הקבצים שיצרתם בהפעלה האחרונה, מאפשר ליצור כמה ויראציות ואז להחליט מביניהם
- ניהול מפתחות API בצורה מאובטחת בדפדפן
- וכמובן, התממשקות להעלאה מהירה למערכת
שימו לב שההוראות בדיאלוג העזרה הם עבור הקולות הרגילים של גוגל ולא עבור ג'מיני, כדי לקבל מפתח לג'מיני בלבד ללא תשלום יש להיכנס לכאן
%D7%94%D7%95%D7%A8%D7%93%D7%94.wavאשמח לשמוע ולקבל פידבקים והערות

אשמח לקבל ממך עזרה בשימוש בAPI שלהם, משום מה זה לא עובד, התיעצתי עם ג'ימני וgpt ורק סיבכו את העסק
תראה לאיזה קוד מוזר הם הגיעו אחרי אין ספור נסיונות ושינויי מודלים// קבוע שניתן לשנות בקלות const DRIVE_FOLDER_NAME = 'My Gemini Audio'; /** * משיכת נתונים מהגיליון והפעלת תהליך המרת טקסט לדיבור עבור כל שורה. */ function pullFromTable() { const apiKey = PropertiesService.getScriptProperties().getProperty('GEMINI_API_KEY'); if (!apiKey) { Logger.log('❌ שגיאה: המפתח GEMINI_API_KEY אינו מוגדר בנכסי הסקריפט (Project Settings > Script Properties).'); return; } const sheet = SpreadsheetApp.getActiveSpreadpreheet().getActiveSheet(); const range = sheet.getRange(1, 1, sheet.getLastRow(), 1); const values = range.getValues(); values.forEach((row, index) => { const textToSpeak = row[0]; if (textToSpeak && String(textToSpeak).trim() !== '') { Logger.log(`מעבד שורה ${index + 1}: "${textToSpeak}"`); // שימוש בפונקציה המעודכנת googleCloudTextToSpeech(apiKey, textToSpeak, index); Utilities.sleep(1000); // אפשר להקטין את ההמתנה, ה-API הזה פחות רגיש } }); } /** * קריאה ל-API של Google Cloud Text-to-Speech ושמירת התוצאה ב-Drive. * @param {string} apiKey מפתח ה-API של הפרויקט. * @param {string} textToSpeak הטקסט להמרה. * @param {number} rowIndex אינדקס השורה (לצורך שם הקובץ). */ function googleCloudTextToSpeech(apiKey, textToSpeak, rowIndex) { // 1. הכתובת של ה-API הייעודי ל-Text-to-Speech const url = `https://texttospeech.googleapis.com/v1/text:synthesize?key=${apiKey}`; // 2. מבנה הנתונים (payload) הנדרש על ידי ה-API הזה const payload = { 'input': { 'text': textToSpeak }, 'voice': { 'languageCode': 'he-IL', 'name': 'he-IL-Standard-A' // קול נשי }, 'audioConfig': { 'audioEncoding': 'MP3' } }; const options = { 'method': 'post', 'contentType': 'application/json', 'payload': JSON.stringify(payload), 'muteHttpExceptions': true }; try { const response = UrlFetchApp.fetch(url, options); const responseCode = response.getResponseCode(); const responseBody = response.getContentText(); if (responseCode === 200) { const responseJson = JSON.parse(responseBody); // 3. הנתונים נמצאים ישירות תחת השדה 'audioContent' const audioData = responseJson.audioContent; if (audioData) { const safeFileName = `audio-${rowIndex + 1}-${textToSpeak.substring(0, 20).replace(/[^a-zA-Z0-9א-ת]/g, '_')}.mp3`; const file = saveToDrive(safeFileName, 'audio/mp3', audioData); Logger.log(`✅ קובץ נשמר בהצלחה: ${file.getUrl()}`); } else { Logger.log(`⚠️ התקבלה תגובה תקינה (200) אך ללא תוכן שמע. גוף התגובה: ${responseBody}`); } } else { Logger.log(`❌ שגיאה בבקשת ה-API. קוד תגובה: ${responseCode}`); Logger.log(` גוף התגובה: ${responseBody}`); } } catch (e) { Logger.log(`❌ אירעה שגיאה קריטית בתהליך: ${e.toString()}`); } } // ---- אין צורך לשנות את הפונקציות הבאות ---- function saveToDrive(fileName, mimeType, base64Data) { const bytes = Utilities.base64Decode(base64Data, Utilities.Charset.UTF_8); const blob = Utilities.newBlob(bytes, mimeType, fileName); const folder = getOrCreateFolder(DRIVE_FOLDER_NAME); return folder.createFile(blob); } function getOrCreateFolder(folderName) { const folders = DriveApp.getFoldersByName(folderName); return folders.hasNext() ? folders.next() : DriveApp.createFolder(folderName); } -
הוא נשמע צרוד!!!!!!!
%D7%94%D7%95%D7%A8%D7%93%D7%94.wav -
@HTML חחח
-
מישהו יודע מה קרה לגוגל סטודיו? כבר לא נותן ליצור אודיו מטקסט. כל הזמן אומר 'לא נוצר אודיו' או 'הגעת למגבלה'
-
@יעקב-1 תנסה להיכנס מחדש לא דרך הקישור ששמרת לפעמים הם מחילפים מודלים או משהו והקישור ששמור לך לא רלונטי
-
@BEN-ZION
ניסיתי, לא עזר
-
-
@CUBASE כתב בהמרת טקסט לדיבור מטורפת!!!! ב ח י נ ם!!!!!:
במהלך שימוש ב-AI Studio של גוגל נתקלתי במודל חדש של המרת טקסט לדיבור כמו שלא שמעתם מעולם!!! ובחינם!!
https://aistudio.google.com/generate-speech
שימו לב שיש שם אפשרות למודל Flash ויש אפשרות למודל Pro שנראה לי יותר טוב
אני השתמשתי בקול "Charon" שהיה נשמע לי הכי קרייני, וכמובן שכדאי להשתמש בנקדן על מנת להוציא תוצאות מושלמות
charon.wavקרא בקול פרסומת ובקול מתלהב:
נָעִים לְהַכִּיר, אֲנִי שָׁרוֹן וַאֲנִי כָּאן כְּדֵי לָתֵת לָכֶם אֶת הַקַּרְיָנוּת הֲכִי טוֹבָה שֶׁיֵּשׁ,
רוֹצִים לְהִשְׁתַּמֵּשׁ בִּי?
פָּשׁוּט מְאוֹד!, הִכָּנְסוּ לְ-AI Studio וְאָז עַל Generate Media וְאָז עַל
Generate speech, אַחַר כָּךְ יִהְיֶה לָכֶם אֶפְשָׁרוּת לִבְחֹר בְּהַקְרָאָה בְּקוֹל בּוֹדֵד וְשָׁם בָּחֲרוּ בִּי - שָׁרוֹן,
אַתֶּם יְכוֹלִים לְהוֹרוֹת לִי מָה שֶׁאַתֶּם רוֹצִים עַל צוּרַת הַהַקְרָאָה שֶׁלִּי וַאֲנִי אֶשְׁתַּדֵּל לְהָבִיא לָכֶם תּוֹצָאוֹת בְּהֶתְאֵם,
נַסּוּ וְתֵהָנוּ!
-
@נועם-אלימלך ואיך אני אמור לעזור בזה??
-
@CUBASE למה זה חסום זה לא כשר
-
@יעקב-1
עם ניקוד, או פחות מ-3 מילים הוא לא יוצר