בתשובה לעומר, 21/01/20 8:01
בינג' 726984
לא מבין למה כוונתך במילים "סינטוז קול אנושי" סינטוז של מילים בודדות היום הוא במצב מצויין, אני מתכוון לתוכנות text to speech .
כל מילה כשלעצמה נישמעת מצויין מה שחסר בסינטוז הוא האינטונציה בהקראת משפטים שלמים, שהרי קשה לתוכנה לזהות היכן האינטונציה במשפט אמורה להופיע (ואיך להופיע).

להערכתי כיוון הפעולה החדש המיוצג היום בתוכנת gpt3 עשוי לתרום לשיפורים באינטונציה סינטטית.

לכאורה, פרוייקט gpt פועל רק בתחום מחוללי טקסט אבל ניסויים שנעשו בתחום מראים שיש סיכוי לא מבוטל ששימוש בעקרונות gpt יאפשרו בניית מחוללי תמונות. (הניסויים שפורסמו הם לקיחת צילום חתוך — נאמר *חצי* צילום חתוך — ושיחזור הצילום בטרם נחתך. התוצאות מאוד מרשימות.).

הכיוון שיכול להיות אפקטיבי הוא היכולת לקרוא טקסט כתוב ומתוך ההקשר לטקסט הסמוך — לזהות היכן צריך ליצור אינטונציה שתשרת את ההקשר אליו התכוונו.

אני מקווה שתבין את כוונתי למרות שאין לי יכולת להסביר את כוונתי (כניסה להסברים פרטניים לא תשפר את ההסברים).

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים