בתשובה להפונז, 06/01/23 8:35
געגועיי לאלייזה 2 755239
סליחה, אבל הוא עשה בדיוק מה שביקשת ממנו. ביקשת ממנו להוכיח, והוא הוכיח. חרא הוכחה, אבל קיבלת מה שביקשת :)

זה מתחיל להזכיר לי בדיחות על משאלות. קיבלת זית כזה גדול (בגרסה האנגלית- פסנתרן בגודל 12 אינץ').
געגועיי לאלייזה 2 755245
לא כל צירוף אקראי של משפטים הוא הוכחה.
הוא אפילו לא הוכיח משהו אחר.
חוץ מרצף תחבירי תקין אין בפסקה הזו כלום.

(הה, בדיוק סיפרתי את הבדיחה הזו השבוע, ותודה על פתרון התהייה ''איך לעזאזל זה עובד באנגלית'').
געגועיי לאלייזה 2 755249
לצפות ממודל שפה (ללא שום אינטרגרציה למערכת שהיא כן רלבנטית) לספק הוכחות במתמטיקה זה כמו לצפות ממטוס לשחות שחיית פרפר.

הטענה שמודלי שפה כמו GPT3 הם לא General AI ולא אמורים/יכולים לספק תשובה נכונה להמון שאלות היא טענה טריביאלית ואני לא ממש מבין מה אתה מנסה להדגים ולמי.
געגועיי לאלייזה 2 755255
אחרי פתיל שלם שהתחיל מטיעונים שאוטוטו הג'פטו יעשה את כל התרגילים של סטודנטים לתואר ראשון ושלחוקרים אקדמיים עוד צעט לא תהיה עבודה, לא אלי אתה צריך לבוא בטענות, אלא לאלה שטענו שתיכף זה יהיה מטוס סילון.
געגועיי לאלייזה 2 755256
צריך להבדיל בין טענות שמדברות על מה אפשר יהיה לעשות עם בינה מלאכותית באופן כללי לבין טענות על מה אפשר יהיה לעשות עם מודל שפה שאומנם אומן על כמויות גדולות של טקסטים, אבל שאין לו שום אינטגרציה עם שום דבר אחר מעבר למודל השפה.

הפתיל למעלה מערבב בין סוגים שונים של טענות ולכן הדיון קצת מתפזר. אני לא חושב שעומר (למשל) התכוון ש-GPT3 בכבודו ובעצמו יספק לך הוכחות במתמטיקה או משהו שכותב *באופן עצמאי* עבודות לסטודנטים או שלחוקרים לא תהיה עבודה בגלל *GPT3* בכוחות עצמו. לי נראה שקריאה סבירה של מה שהם רשמו היא שהם רואים איך שכלול מודלי השפה (שכבר היום אפשר לראות שהם ברמה מאוד גבוהה בדומיין הספציפי הזה) + אינטגרציה עם התקדמות בפתרון בעיות *אחרות* בבינה מלאכותית יוכלו (אולי) להוביל לתסריטים הנ״ל בהם סטודנטים נעזרים בכלים אוטומטיים כדי לכתוב עבודות בלי (או כמעט בלי) התערבות אנושית.

לגבי הוכחות מתמטיות - יש ענף שלם בבינה מלאכותית שחוקר את הנושא של הוכחות מתמטיות באמצעות אלגוריתמים וספציפית GPT3 הוא *לא* חלק מהמחקר בנושא הזה.

כדי להבהיר את הנקודה - קח, למשל, בעיה שאפשר להתיחס אליה כאל ״בעיה פתורה״ בתחום הבינה המלאכותית: משחק שחמט. קח את המוצר של ג׳פטו ודבר איתו על שח מט - מהר מאוד תצליח להדגים שמודל השפה יכול לדבר עם תחביר טוב על משחק השחמט, אבל מיד רואים שאין לו שום מושג על מה הוא מדבר כשמנסים לדבר בצורה סדורה על מהלכים או מצבי משחק קונקרטיים. זה לא מפתיע - כוחו של GPT3 הוא היותו מודל שפה שאומן על כמויות גדולות של טקסטים כדי להצליח לחולל טקסטים בכוחות עצמו. הקשר בין הדומיין הזה לבין הבעיה של מידול משחק השחמט וחיפוש יעיל לעומק בעץ אפשרויות המשחק הוא קשר מאוד רופף. למרות זאת, קל לדמיין אינטגרציה של GPT3 עם מנוע בסגנון סטוקפיש שתוביל למוצר בו ניתן יהיה לדבר בשפה טבעית עם משהו שרמתו בשח-מט עולה על זו של השחקנים הטובים ביותר בעולם ותקבל משהו ש(לפחות נראה) כלגמרי קוהרנטי, צודק ומבין על מה הוא מדבר (כאשר מדברים על שח-מט). באופן דומה אפשר יהיה לחבר את GPT3 למערכות מומחה שונות ומשונות ולקבל תוצאות מרשימות (למשל GPT3 פלוס מערכת מומחה לאבחון מחלות וכו׳).
געגועיי לאלייזה 2 755260
I approve this message.

רק חידוד/אבהרה: נראה לי שאפשר להגיע בעזרת מודלי שפה טהורים הרבה יותר רחוק ממה שהפונז חושב. אני מניח שנגלה בקרוב.
געגועיי לאלייזה 2 755261
''אפשר להגיע'' זו תחזית כל כך רחבת טווח, שברור שאי אפשר להתנגד לה בצורה סבירה.
אם כבר, הטיעון שלי הוא שכרגע ולעשור הקרוב, המשרה שלך לא מאוימת על ידי מודלים כאלה.
געגועיי לאלייזה 2 755262
כרגיל בעניינים האלה, אני מדבר על הזמן הקרוב. הנקודה היא שבינתיים אין שום אינדיקציה שאנחנו קרובים לחסמי-היכולת של מודלים כאלה, וגם בתחומים כמו הסקה לוגית ומתמטיקה (שמלכתחילה זה מפתיע שהם בכלל מצליחים משהו שקשור בהם) ניכרים שיפורים גדולים מאד מדור לדור. וכאמור, אם אתה מתעקש להתמקד דווקא באיומים על המשרה שלי, זה אבסורד להצטמצם רק למודלי-שפה.

לזכותך יאמר, נדרש הרבה אומץ לכתוב הודעה כזו זמן כל כך קצר טרם שחרור GPT-4.
געגועיי לאלייזה 2 755264
יאפ. גם אני חושב שהרבה יותר מפתיע שמודל השפה בכלל מצליח להתמודד עם בעיות פשוטות במתמטיקה/חשבון מאשר שהוא נכשל בבעיות פשוטות אחרות במתמטיקה/חשבון.

משהו משעשע/מוזר שקרה לי אתמול: כתבתי קטע קוד בפייתון שכתוב בצורה קצת עקומה בכוונה, אבל בסופו של דבר הוא שקול לחלוטין לסתם לולאה שסופרת עד 99 ומכפילה משתנה בכל איטרציה ב-‏2. שאלתי את ג׳פטו מה הוא חושב שהקוד עושה. הוא נתן הסבר מדויק למה שהקוד מבצע, אבל אמר שהתשובה הסופית תהיה 128. לא אמרתי לו שום דבר נוסף לגבי הפתרון הנכון, אבל רק אמרתי לו שהוא טועה ושיבדוק שוב את התשובה שלו (זה היה יותר ״נזיפה״ מאשר לספק לו אינפורמציה נוספת). הקרסור הבהב קצת יותר זמן מהרגיל בתשובות שהוא מספק בד״כ ואז הוא ירק התנצלות, הסביר שהוא אכן טעה בתשובתו וענה את התשובה הנכונה/מדויקת לשאלה עם תשובה מלאה לגבי חישוב החזקה של 2. תהרוג אותי אם אני מבין מה בדיוק קרה שם מאחורי הקלעים.
געגועיי לאלייזה 2 755358
געגועיי לאלייזה 2 755360
וואו, זה באמת יכול להיות כביר. זה גם ממחיש עבורי את מה שאתה אומר לאחרונה.

דגדגן לעצלנים: "ChatGPT can “talk to” Wolfram|Alpha just like humans do—with Wolfram|Alpha turning the natural language it gets from ChatGPT into precise, symbolic computational language on which it can apply its computational knowledge power."
געגועיי לאלייזה 2 755361
יאפ. זו הדגמה טובה לטענת ה״חכו לאינטגרציות. עוד לא ראיתם כלום״.
געגועיי לאלייזה 2 755589
סרטון: https://www.youtube.com/watch?v=wYGbY811oMo
געגועיי לאלייזה 2 756034
וולפראם עונה על שאלות בקשר לג'פטו.
געגועיי לאלייזה 2 756040
הה, לרגע קראתי את זה בתור ''ג'פטו עונה על שאלות בקשר לוולפרם''.
נדרש הרבה אומץ 755362
מזכיר לי מחמאה אחרת (:
געגועיי לאלייזה 2 755267
אני הייתי מצפה לפחות לכך שהוא יהיה מודע למגבלותיו ולא יזרוק זבל כתשובה. כרגע זה נראה לי אחד ההבדלים הבולטים בינו לבין אדם.
געגועיי לאלייזה 2 755269
הבדל?
הוא ממש כמו בן אדם!
געגועיי לאלייזה 2 755272
האמת היא שהם כן הכניסו במלא סיטואציות תשובות מעצבנות בסגנון של ״אני לא יכול לענות על השאלה בגלל מגבלות מודל השפה ידה ידה ידה בלה בלה״ וזה די מציק והורס את כל הכייף. אני דווקא מעדיף את התשובות בהן הוא טועה כי זה מעניין לא פחות מהסיטואציות בהן הוא עונה תשובות נכונות (טוב, זה כי אני משחק עם זה בעיקר בגלל העניין שיש לי בצעצוע עצמו ועדיין לא ככלי עבודה של ממש). סביר להניח כשהתחום הזה יבשיל ויוסיפו סביב מודל השפה עוד מודולים שעושים ולידציה על התשובות שניתנות (או מתערבות מוקדם יותר, לפני שהוא מג׳נרט את התשובה הסופית, עם מודולים שעוסקים באנליזה יותר פורמלית בתחומים ספציפיים). זה בעיקר יוצר סיטואציות בהן אתה צריך לחפש את הניסוח בו בכל זאת תצליח לקבל ממנותשובה כלשהי במקום התחמקות מגולם מנומס. גם ה-Safegaurds שהוסיפו לו כדי להיות PC או להזהר מתכנים ״לא נאותים״ הם קצת מוגזמים והיה נחמד אם היה אפשר לקנפג את זה.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים