בתשובה לירון, 12/05/06 10:00
גילוי חיים תבוניים בכוכב אחר 384758
כפי שאמרו כאן, רובוטים ראשונים כבר יש, והם לא ממש אסימוביים. סביר שבכל דור חדש הם יהיו טובים יותר - אם תרצה, אסימוביים יותר. השאלה היא אם תוך מאה צעדים ייסגר הפער, או שאלו צעדים של מילימטר כשהפער הוא של קילומטרים.

אתה משער (כך נראה לי) שצירוף כל המחקרים הנקודתיים באקדמיה סוגר את הפער; לפי מיטב הבנתי וניחושי, ממש לא. יותר בפירוט - בתחום שאפשר לקרוא לו "הבנת שפה טבעית", האם יש כבר משהו יותר חזק מהותית משרדלו?
גילוי חיים תבוניים בכוכב אחר 384779
טוב, התחלתי לכתוב מה אני חושב בעניין זה, אבל יצא טקסט פלספני שהעדפתי למחוק אותו.

אני מאמין שעד שלא תהיה מוטיבציה כלכלית שיכולה להגיע מהתפתחות תעשיית משחקי המחשב או מטכנולוגיות של למידה באמצעות מחשב, כל תחום הבינה המלאכותית ימשיך לדשדש, אם כי יהיו הישגים מקומיים. פרויקטים ממשלתיים גדולים בנוסך המרוץ לחלל בזמן המלחמה הקרה, עשויים לגרום גם הם לפריצת דרך.

יש נסיונות באקדמיה ליצור ארכיטקטורות של בינה כוללת
אבל פרוייקט כזה הוא מעל ומעבר ליכולת של כמה חוקרים עם הסטודנטים שלהם.

צריך להבין שהבנת התרבות האנושית והתנהלות בתוכה מחייבים ניהול ידע סימולטני בכמה modalities וכמה רמות הפשטה. צלילים, תמונות, תאורים תלת מימדיים, הגדרות סימבוליות של עצמים ויחסים, המשמעויות החברתיות שלהם בהקשרים שונים... צריך לדעת מה ללמוד ומה לשכוח, מה חשוב ומה טפל, מה נכון ומה שקר, ומה אולי נכון...

לכל אחת מבעיות אלה יש פתרונות חלקיים לפחות בהקשרים מצומצמים, אבל ליצור סלט קוהרנטי של כל הפתרונות - מסובך ויקר מאוד.
גילוי חיים תבוניים בכוכב אחר 385347
אגב, אני חושב שחייבים להפריד בין מבחן טיורינג והבנת שפה טבעית. מבחן טיורינג אומר, בקירוב, ששכפלנו אדם. זה כולל שפה טבעית, אבל זה כולל גם הרבה מאוד דברים אחרים. אני אישית מאמין שהבנת שפה טבעית היא לא רחוקה מאוד מהיכולת הטכנולוגית שלנו כרגע.

אבל מה זה "הבנה"? יכולת של תוכנה להשתמש בקונבנציות שיחה אנושיות מחייבת איזשהו מודל לוגי פנימי. למשל: "היה דיון מעניין באייל והצטרפתי אליו". לא אמרתי מפורשות שהסיבה שהצטרפתי לדיון היתה שהוא היה מעניין, אבל זה מובן מאליו לכל אדם, כי כל אדם יודע או יכול להסיק שסיבה להצטרפות לדיון היא העניין שלו, ושזה שזו הסיבה שהצטרפתי זו פרשנות כל-כך סבירה למשפט שאפשר להניח שזו הסיבה שצרפתי את שתי האמירות ביחד למשפט אחד מלכתחילה, בלי בכלל לשקול פרשנויות אחרות. כדי לדעת או להסיק שסביר שהצטרפתי בגלל העניין דורש איזשהו מודל לוגי שאפשר לעדכן בהתאם לשיחות שהתוכנה מנהלת ולשפוט סבירות של פרשנויות של אמירות שונות על פיו. אי-אפשר באמת להבין שפה טבעית בלי להיות מסוגלים להבין משפטים כאלה, ולכן בלי מודל לוגי פנימי.

עד כאן, זה נראה כאילו אני אומר שהבנת שפה טבעית זה באמת שכפול של מוח אנושי. אבל אני אמרתי שיש מודל פנימי לוגי, ולא אמרתי מהו. אנשים יכולים להסיק דברים בעוד דרכים, למשל מראה עיניים, או רגשות. יש להם יכולת להסיק דברים לא-טריביאליים מתוך מה שכבר ידוע להם, למשל מהפרט אל הכלל ולא רק מהכלל אל הפרט. כל אלה הם ממשקים נוספים בין המודל הפנימי לעולם החיצוני או מהמודל לעצמו. אם שכפלנו את כולם, שכפלנו אדם. אבל אני אומר שאין צורך לשכפל את כולם: הבנת שפה טבעית לא דורשת ראיה, הסקה מהפרט אל הכלל, אינטרסים או רגשות. אנחנו דורשים שהתוכנה תהיה מסוגלת להבין קונבנציות שיחתיות אנושיות, אבל לא לעשות משהו ספציפי עם המידע הזה, חוץ מליצר עוד טקסט על-פיו. אני מאמין ש"הבנת שפה טבעית" היא לא רחוקה מהיכולת הטכנולוגית שלנו כרגע, אבל אין לי ספק שרוב הדברים שאנחנו מדמיינים שמחשב מדבר יוכל לעשות – דברים שהם הכרחיים למבחן טיורינג – הם כן מחוץ ליכולת שלנו.

בסופו של דבר, יכול להיות שנבנה מחשב שיכול להבין שפה טבעית ולעדכן מודל פנימי, אבל לא יוכל לעשות שום דבר חוץ מלקשקש חזרה את מה שאמרנו לו כבר בניסוחים שונים. מי שידבר איתו ידע מעבר לכל ספק שזו מכונה, כי אולי יהיה לו ידע נרחב, אבל אפס חוכמה טבעית. זה לא יהיה בינה מלאכותית, אבל זה יכול להיות דווקא שימושי מאוד: תרגום טקסטים, סיכום טקסטים לפי מקורות רבים ("למה כן ולמה לא לעשות ניסויים בבעלי חיים, לפי אתר האייל הקורא?"), חיפוש מידע וכיוצא באלה. וכמובן, זו יכולה להיות פלטפורמה טובה כדי כן לנסות ולהוסיף הסקה לוגית מתקדמת יותר, ראיה ממוחשבת וכיו"ב.
גילוי חיים תבוניים בכוכב אחר 385509
אני חושב שיותר מהבנת השפה הטבעית, מערכת שמבינה את ה*שימוש* ב"אמצעי תקשורת" יוביל למערכת שעוברת את מחסום טיורינג. שפה היא רק חלק, אמנם עיקרי, משלל האמצעים בהם בני אדם מתקשרים. אנחנו רגישים מאד למגוון שלם של סימנים שנותנים משמעות להתקשרות ביננו, ולא כל הסימנים אם לשוניים פרופר. תחשוב למשל על מרווחי זמן בין מלים שונות והמשמעות השונה שנוצרת מהשהיות שונות.

דוגמה:
1. לקוח במכולת שם את המצרכים על הדלפק.
לפעולה הזו עצמה ישנה משמעות תיקשורתית חשובה. היא משדרת כוונה, והזבן אמור להבין שאתה מתכוון לשלם, והוא צריך לשדר לך בהחזרה שהוא הבין שזו כוונתך, וכו'.

2. הזבן היה עסוק באותו רגע בסידור המדף מאחורי הדלפק. הוא אומר לך "רק רגע," (או אם הוא זבן טוב, "רק רגע בבקשה" :)

3. אתה עונה "אין בעיה."
כמובן שמטון התשובה שלך הזבן יכול להסיק דבר והיפוכו (עיין במאמר של ירדן על גרייס), או הסכמה או שאתה מביע מורת רוח.

4. לחזור לדוגמא. אם ענית תוך שניה (נניח), המשמעות שעולה מתשובתך היא שאתה מקבל את מה שהזבן אמר בחיוב. אבל אם תשתהה שלש שניות להשיב לו "אין בעיה," המשמעות יכולה להיות שלילית, הבעת מורת רוח מהתנהגותו של הזבן.

הדוגמה הזו היא טריביאלית לכאורה, כי אתה רואה מהניתוח הקצרצר שלי עד כמה החלפת דברים (=סימני תיקשורת שונים) קצרה בין שני אנשים יכולה להיות מורכבת מאד. אני חושב שאם תתקשר עם מערכת שלא יכולה לחקות ברמה מסוימת מורכבות תקשרותית כזו, בסופו שלח דבר תוכל לזהות שהיא מערכת אוטומטית ולא בן אדם.

(ראה גם תגובה 384761).
גילוי חיים תבוניים בכוכב אחר 385515
אתה מדבר, כמובן, גם על אינטונציות, שפת גוף, הרגלים של היכרות/חוסר היכרות ועוד מיליון דברים קטנים שבני אדם קולטים אותם ומגיבים אליהם אפילו בלי להרגיש את עיבוד החומר הזה.
גילוי חיים תבוניים בכוכב אחר 385519
לא בדיוק. אמנם הדברים האלה, כמו שפת גוף, חיוניים בתקשורת פנים אל פנים, אבל בתקשורת דרך מדיום מתווך, כמו טלפון או צ'אט, צריך להתרכז באלמנטים של השפה. הנה, את יכולה להעלות על פניך עווית גיחוך כשאת קוראת את התגובה שלי, אבל זה לא כ''כ ישנה את עצם ומובן ההתקשות שלנו, אלא אם זה ישפיע על מה שתכתבי בתגובה הבאה שלך בלי שתרגישי.
גילוי חיים תבוניים בכוכב אחר 385529
טוב, אני חשבתי על הסיטואציה במכולת... (עוד לא הזדמן לי לשוחח עם הזבן בטלפון. לגבי המחשב אינני יכולה להישבע). בכל אופן, בצ'ט אתה גם תתקשה להבחין באיטיות התגובה שלי, לא?
ונכון, כמובן, ששיחות בכתב נותנות הכי פחות אינפורמציה.
בעצם, כשאני חושבת על זה, ייתכן שחלק ממכותביי הם מכונות. מי יודע?
גילוי חיים תבוניים בכוכב אחר 385535
המטרה שלי היא לא לעבור את מבחן טיורינג. זה קשה מאוד, ואני גם לא חושב שזה עד כדי כך שימושי. מה שרציתי להגיד זה שהבנת שפה טבעית לא בהכרח גוררת לעבור את מבחן טיורינג כמו שמשתמע מהמשפט האחרון שלך.

דווקא הדקויות שאתה מתאר כאן נראות לי קלות יחסית לטיפול. למשל, השתהות של שלוש שניות היא לא סבירה, ולכן מצביעה על מסר חבוי, שמחזק טון דיבור מלאכותי, שהפרשנות הסבירה ביותר שלו היא סרקאזם.

דקויות קשות יותר הן אלה שממילא מניחות הרבה מאוד על השומע (נגיד, אירוניה איילית). אבל אתה לא רוצה להסתחבק עם המחשב שלך, אתה רוצה לדבר איתו. בוא נגדיר ''הבנת שפה טבעית'' כיכולת להעביר ולקבל כל מידע שאתה רוצה ללא מאמץ גדול יותר מזה שהיית צריך להשקיע בלדבר עם אדם שאתה לא יודע עליו כלום (מעבר להיותו דובר השפה שלך) ושאיתו אין לך כימיה מיוחדת. נציג שירות טלפוני שנותן שרות בינוני עד סביר יכולה דוגמה טובה למבחן כזה.
גילוי חיים תבוניים בכוכב אחר 385537
דווקא אירוניה איילית היא לא בעיה: ממילא גם באייל היא לא תמיד מובנת. לעומת זאת, השתהות של שלוש שניות יכולה להצביע על פיזור דעת, התבדחות רגילה, דיבור של בן אדם עם עצמו (לחישדה תחת השפם שאיננו) ועוד.
גילוי חיים תבוניים בכוכב אחר 385548
אם השתהות של שלוש שניות יכולה להצביע על כמה משמעויות שונות בסבירות דומה, אז גם אדם לא יוכל לפרש אותה בעקביות‏1, ולכן מן הסתם גם הדובר לא יסמוך על כך שהיא בהכרח תובן‏2. בהבנת שפה טבעית עסקינן, ולא בקריאת מחשבות.

1 ממש כמו אירוניה איילית.
2 שלא כמו אירוניה איילית, הפעם.
גילוי חיים תבוניים בכוכב אחר 385552
הדובר, סביר להניח, יסמוך על האינטונציה.
גילוי חיים תבוניים בכוכב אחר 385616
לא. אם יש כמה אפשרויות עם סבירות דומה, הוא באמת לא ידע. אם יש אפשרות אחת סבירה הרבה יותר, הוא ידע שזו היא. מה היא "אינטואיציה" אם לא חישוב לא מודע? תוכנה פחות מתוחכמת מהבחינה הזו שקולה בדיוק לאדם פחות מתוחכם, או פחות רגיש. זכור את דיון 2477 מחד, ואת דיון 2220 מאידך.
גילוי חיים תבוניים בכוכב אחר 385629
דיברתי על אינטונציה.
גילוי חיים תבוניים בכוכב אחר 385635
גם זיהוי ופירוש של אינטונציה היא במידה רבה ניחוש. הייתי מרחיק אף ואומר בעיקר ניחוש.
גילוי חיים תבוניים בכוכב אחר 385637
אבל רוב האנשים דוברי השפה יפיקו את אותו ניחוש.
גילוי חיים תבוניים בכוכב אחר 385643
אם רוב דוברי השפה יפיקו את אותו ניחוש, סימן שיש דרך להסיק אותו.
גילוי חיים תבוניים בכוכב אחר 385656
אז מה? גם אם יש דרך להסיק אותו, אין זה אומר שיש דרך לפרק את צורת ההיסק לאלגוריתמים מחשביים.
גילוי חיים תבוניים בכוכב אחר 385663
אני לא מבין איך אפשר לטעון כזו טענה בלי להעזר במיסטיקה. במקרה הכי גרוע, פרקי מוח של אדם לגורמים ובני משהו דומה.
גילוי חיים תבוניים בכוכב אחר 385668
פרק אתה (רק לא את המח שלי, אני עדיין זקוקה לו במידה מסוימת).
גילוי חיים תבוניים בכוכב אחר 385669
סתם מחשבה: אולי כדאי שתלמד אלגוריתם מהו לפני שתפריח קביעות על טבעו.
גילוי חיים תבוניים בכוכב אחר 385670
אכן מחשבהה סתמית. למדתי.
גילוי חיים תבוניים בכוכב אחר 385584
לא צריך בדיוק ESP. יש לשיחה דינמיקה משלה.
גילוי חיים תבוניים בכוכב אחר 385617
תגובה 385616
גילוי חיים תבוניים בכוכב אחר 385691
לא הבנתי למה התכוונת.
גילוי חיים תבוניים בכוכב אחר 385771
לכל שיחה יש דינמיקה משלה, אבל בסופו של דבר, יש לדובר דרך לדעת בסבירות גבוהה למה התכוון בן-שיחו. הדרך הזו היא לא קסם, היא ניתנת לחישוב, ולכן ניתנת לחישוב על-ידי מחשב. אני חושב שיש ראיות נסיבתיות לזה שחישוב כאמור על-ידי מחשב הוא גם פרקטי.
גילוי חיים תבוניים בכוכב אחר 385802
זה פחות או יותר דומה למה שאמרתי בהתחלה.
גילוי חיים תבוניים בכוכב אחר 385631
אני לא מבין למה אנשים ישר עוברים לדבר על זיהוי ניואנסים. הבעיה הבסיסית ביותר, טקסט פשוט וחד-משמעי, מספיק מאתגרת, ואין בכלל טעם לחשוב על סרקזם וכו' לפני שפותרים אותה. אם "יש כאן כדור אדום" נאמר בכנות או לא, אם הוא נכון, ובמידה ואיננו - אם אין כדור, או שהוא איננו אדום, או שהוא איננו כדור... למה בכלל נותנים על זה את הדעת לפני שהושגה התקדמות מספקת עם המקרה הבסיסי?

ואחרי שהבסיס הונח: צריך לזכור שבני אדם *מנחשים* את הכוונות הנוספות/סמויות. יותר מזה - כל מסקנה שלנו, עד למסקנה שאני מסתכל על עיגול, ושהוא עשוי לסמל אפס, או את האות סמך, או אולי משהו אחר בכלל, זה גם במידה מסויימת ניחוש. לא הבחירה של אחד מהם - המסקנה, שכל אחת מאלו היא מסקנה אפשרית, זה גם במובן מסויים ניחוש. מה שאני מנסה להגיד - גם לגבי משפטים בסיסיים התוכנות ההיפותטיות שלנו תעשנה ללא ספק שגיאות, וקל וחומר כשתנסה להתחשב גם בסרקזם. גם בני אדם עושים שגיאות כאלו, אז זה לא מוכיח שום יתרון אינהרנטי של האדם על המכונה (הבדלה מעצבנת).
גילוי חיים תבוניים בכוכב אחר 385634
חרררממפ תגובה 385616 ?
שניה, אני רוצה להיות בטוח - מה בדיוק הכוונה ב"חררממפ", ומאיפה זה הגיע?
גילוי חיים תבוניים בכוכב אחר 385648
טקסט פשוט וחד משמעי הוא בעצם לא פשוט וחד משמעי בכלל. למשל, הדוגמה שלי בתגובה 385347. וגם בדוגמה שלך. למה מתייחס "כאן"? לחדר הזה? לפלנטה הזו? זה תלוי-הקשר. יש הרבה מאוד (אולי אינסוף) פרשנויות לכל משפט. העובדה שהשומעים בוחרים בד"כ את הפרשנות הנכונה מראה ש(א) יש דרך למצוא את הפרשנות הזו, ו(ב) הדרך הזו יכולה להיות פשוטה ויעילה, כי אנשים הרי עושים את זה כל הזמן. אבל אני לא חושב שבאופן מעשי אפשר בכלל להפריד בין "המקרה הבסיסי" (סמנטיקה) ו"המקרה היותר מורכב" (פרגמטיקה). מה שכן ניסיתי לעשות זה להפריד בין תקשורת לאספקטים אחרים של חשיבה אנושית, וסייגתי "הבנת שפה טבעית" לרמה מסוימת של שיחה. בסופו של דבר יש דו-משמעות בכמעט כל ביטוי, אבל אנשים מצליחים בד"כ להבין זה את זה. אני לא חושב שזה אפשרי בכלל להבין תקשורת יותר טוב ממי שהתקשורת מיועדת אליו מלכתחילה, אבל את זה אף-אחד לא ביקש.
גילוי חיים תבוניים בכוכב אחר 385666
לא התכוונתי לרמוז אפילו שהגרסה הפשוטה של הבעיה היא אכן פשוטה. רק הבעתי את הדיעה, שההתדיינות על הניואנסים מוקדמת ומיותרת, שזה דומה לויכוח על האפשרות לעשות לכוכב לכת ספיציפי בגלקסיה רחוקה terraforming במחיר שיהיה שווה את התמורה, לפני שנבנו אפילו המטוס, הרקטה והמצנח הראשונים. זו בעיה מעניינת וקשה, נכון, אבל לפני שאנחנו בכלל יודעים לשגר ולהנחית לשם אנשים, למה חלק מאיתנו (לא אתה) מתייחסים לזה כאל הנושא העיקרי שעל סדר היום?

אשר לקיומם של סימנים המצביעים בודאות מספקת לפרשנות אפשרית אחת, או לקבוצה קטנה של פרשנויות קרובות מספיק במשמעותן - אני כמובן מסכים. לולא הייתי מסכים, לסוסך שולחן חמש בקרוב.

אשר לפשטות הפתרון - תלוי למה בדיוק אתה מתכוון. תרגום טקסט משפה לשפה תהיה בעיה הרבה יותר קלה מאחרות שאפשר לחשוב עליהן, תדרוש פחות ניתוח של הטקסט. הרבה דו-משמעויות לא משנות את התרגום משפה לשפה, ולכן אינן בכלל דו-משמעויות מבחינת תוכנת תרגום טובה, אבל כשאתה מנסה לעשות משהו בהסתמך על המידע שאתה מפיק, הן שונות. נגיד, על איזה משני הספסלים מצווה הטקסט לשבת, על האחד שנאמר שיש עליו צבע טרי או על השני? מבחינת התוכנה המתרגמת, זה לא משנה - ההבחנה הזו הייתה בעיה של הקורא בטקסט המקורי, ותשאר כזו במתורגם. מבחינת אנדרואיד, לעומת זאת, יש כאן באמת דו-משמעות.
גילוי חיים תבוניים בכוכב אחר 385690
?terraforming מה זה?
גילוי חיים תבוניים בכוכב אחר 385693
שינוי הסביבה למשהו שדומה לקיים על פני כדור הארץ.
גילוי חיים תבוניים בכוכב אחר 385694
האם יש תכנונים כאלה? הרי קשה להאמין שיש דרך לעשות זאת, לא?
גילוי חיים תבוניים בכוכב אחר 385720
תלוי בפרספקטיבה. יש לא מעט דיבורים על טרפורמינג (ובעברית: אֵרוּץ, מילה עתיקה שהמצאתי כרגע והיא הולכת ודוחקת את קודמתה, הארצה, שהמצאתי לפני רגע וחצי) של מאדים ע"י כל מיני בקטריות שיפלטו גזים עד שתיווצר אטמוספירה מתאימה. אם אתה מוכן לחכות כמה אלפי שנה, אני לא בטוח שהרעיון הזוי.

לפרטים: http://www.howstuffworks.com/terraforming.htm

שלך בהארצה,

שכ"ג
גילוי חיים תבוניים בכוכב אחר 385727
''הארצה'' מוצלח יותר. לא תמיד חייבים לדבוק בהתלהבות בחידושים דווקא.
גילוי חיים תבוניים בכוכב אחר 385912
''הארצה'' הומצא קצת לפניך, אם אינני טועה ע''י המתרגם ד''ר עמנואל לוטם (ונדמה לי שהתקבל ע''י האקדמיה).
גילוי חיים תבוניים בכוכב אחר 385914
הארוץ, סליחה, תרוץ שלי הוא שלא ידעתי, אבל זה תחדיש מאד טריויאלי. ההסתייגות שלי ממנו היא הדמיון השמיעתי ל"הערצה".

חידה לחובבי היינלין: מהי סיסמתם של התומכים בטרפורמינג של הירח? בין הפותרים תוגרל פלנטה במערכת Vela.
________________
הנבלה איה הצירא
גילוי חיים תבוניים בכוכב אחר 386241
כבר נפוצה המילה "הארקה" מאותם שורש ומשקל, בחילופי עיצורים.
מה דעתך?
גילוי חיים תבוניים בכוכב אחר 385786
אוה, הבנתי. חשבתי שאתה מתכוון למשמעות מילולית מול משמעות אמיתית. אני חושב שאפשר למתוח את הגבול במשמעות שהדובר לא מנסה בכוונה להסתיר-חלקית (סרקאזם, רמיזות, הומור, וכאלה. מק-סי-מום מטאפורות). טקסט כתוב מנסה בד"כ להמנע מהסתרות כאלה, ומנסה את כל יכולתו להיות ברור וחד-משמעי. לכן יש לי שתי סיבות למתוח את הגבול דווקא שם: הראשונה היא שאם פיצחנו טקסט כתוב, כבר עשינו את המיליארד הראשון שלנו. השנייה היא שהעובדה שטקסט מדעי מתאמץ כל-כך להיות חד-משמעי ולהמנע מסרקאזם ודומיו מראה שגם אנשים הם כנראה לא כאלה איי-איי-איי בלהבין רמזים‏1, אז מה ילינו עלינו, יצירי הביטים?

לעניין הויתור על פתרון דו-משמעות בתרגום, כאן אני מרגיש פחות נוח. אתה צריך לדעת כמה דו-משמעויות יש לך כדי שתוכל להחליט שחלק מהם לא רלבנטיים. לך תדע, אולי דווקא בשפה שאליה אתה רוצה לתרגם צריך לבחור משמעות אחת? תרגום זו משימה קצת משונה, ואני חושב שהיא קשה יותר ולא פחות מהבנת שפה, כי צריך לחשוב בכמה רמות – אתה קודם-כל צריך להבין את הטקסט, ורק אחר-כך לנסות לתרגם מילולית. אני לא חושב שאפשר להגיע לתוצאה טובה בלי להבין את המשמעות, אפילו אם לא משתמשים בהבנה הזו עד הסוף בכל מלה.

באופן כללי, אני חושב שאם מצאנו דרך לפתור בצורה טובה (ולא רק "בד"כ לא רחוק יותר מדי מהאמת", כמו שעושים היום) דו-משמעות אחת, פתרנו את כולן. אם יש לך מנוע שמסוגל לשפוט את הסבירות של כל אמירה ואמירה, ואתה יכול להבין משפט כמו "יש כאן כדור אדום", אתה מסוגל להבין הרבה מאוד משפטים שהיית אולי מחשיב כקשים מאוד. "צבע טרי – לא לשבת" זו דווקא דוגמה פשוטה. החלק הראשון של המשפט דיבר על ספסל ספציפי, אז אתה יכול בשקט להניח שגם החלק השני מדבר עליו, אלא אם כן יש סיבה לחשוב אחרת. לא צריך הנחות נוספות.

לא הבנתי את הקטע עם השולחן והסוס.

1 בשביל לדעת את זה, בעצם, מספיק לשאול את החברה שלי
גילוי חיים תבוניים בכוכב אחר 385799
תרגום במקרים רבים דורש הבנה סמנטית. את זה מחשב לא יכול לעשות, וקשה לראות איך יוכל. בקש ממחשב לתרגם לאנגלית משפט כמו ''העם שניצח במלחמה הניב גם מנצחים רבים בתזמורת'', ותגלה את הבעיה.
גילוי חיים תבוניים בכוכב אחר 385811
חכם בלילה. את זה לא יוכל לעשות גם אדם.
גילוי חיים תבוניים בכוכב אחר 385814
הא?
גילוי חיים תבוניים בכוכב אחר 385818
לתרגם את הדוגמה. זה לא עובד באנגלית, זה עובד רק בעברית. צריך לבחור על איזה משחק מלים לוותר, על כמה, ולעומת מה. אף אדם לא יכול לעשות את זה מושלם, ולא כל אדם יכול לעשות את זה בצורה סבירה בכלל, אז זה לא ממש מפתיע שאנחנו לא יודעים איך לעשות את זה עם מחשב. לא זו המטרה של הבנת שפה טבעית (או של תרגום אוטומטי, אם כבר).
גילוי חיים תבוניים בכוכב אחר 385822
עזוב את משחק המלים. זה לא בדיוק טקסט ספרותי. כל מתרגם אנושי יידע איזה מנצח כאם הוא "victor" ואידה "onductor". איך המחשב יידע את זה?
גילוי חיים תבוניים בכוכב אחר 385833
לפי סמיכות המילה ''מלחמה'' ל''ניצח'' הראשון ו''תזמורת'' לשני. אחרי שהמחשב עובר על אלפי טקסטים הוא יכול לזהות הקשרים שכאלו.
גילוי חיים תבוניים בכוכב אחר 385840
טוב. אם אני אגיד "המנצח היה חניבעל", או "המנצח היה מנדי רודן" - מה אז?
גילוי חיים תבוניים בכוכב אחר 385844
אז זה יותר קשה, אבל לדעתי טכניקה דומה (אם כי מתוחכמת יותר) תשיג את אותה המטרה. קרוב לודאי ש''חניבעל'' נמצא בקרבה גדולה יותר ל''מלחמה'' מאשר ל''תזמורת'' ברוב הטקסטים שהתוכנה למדה.

כמובן שאפשר להיות אולטרה חכמים ולהגיד ''חניבעל ניצח על צבאו בצורה מופתית, כמו המנצח מנדי רודן'', ואת זה אני חושב שאפשר לפתור רק אם טורחים ללמוד קורס בלמידה חישובית ולא רק שומעים שמועות כמוני.
גילוי חיים תבוניים בכוכב אחר 385847
לא צריך להיות חכמים גדולים כדי להמציא טקסט שבו לא יופיעו לא מלחמה ולא תזמורת, גם כשמדובר על אחד משני אלה.
גילוי חיים תבוניים בכוכב אחר 385848
כן, אבל יופיעו בכל זאת מילים כלשהן שמספקות הקשר (אחרת גם בני אדם ייאלצו לנחש מה המשמעות).
גילוי חיים תבוניים בכוכב אחר 385849
זדה תלוי. קודם כל יכול להיות משהו כמו "המנצח רודן נלחם בחירוף נפש עם הנהלת התזמורת" (נדמה לי שהייתה בפועל סיטואציה כזו). שנית, במסגרת שיחה בספר יכול להיות משהו כמו "אני בטוח שהמנצח יהיה רודן"/ "אז מה? אז שווה ללכת?"/ "לא יודע, הוא קצת מחורפן בזמן האחרון"... וכיו"ב.
בן אדם אינו צריך לנחש. או שהוא מכיר את השמות, או שהוא יברר מי הוא מי.
גילוי חיים תבוניים בכוכב אחר 385865
שתי האפשרויות - הכרת השמות, או בירור המקצועות - הן פשוטות מאוד עבור מחשב.
גילוי חיים תבוניים בכוכב אחר 385884
כמו שאדם מכיר את השמות כך גם מחשב יכול.
גילוי חיים תבוניים בכוכב אחר 385879
הפועל "ניצח" בעברית מקבל ביטוי יחס "על X" רק במשמעות המוסיקלית שלו ולא בצבאית. את הבעיה _הזו_ אפשר לפתור כבר ברמת התחביר (שזה בדיוק מה שגם אנשים עושים).
גילוי חיים תבוניים בכוכב אחר 386206
כמה בני אדם ידעו ש"המנצח היה סטיוארט צ'אלנדר" מתיחס לניצחון על תזמורת, ש"המנצחת היתה ברברה מרויס" מתיחס לניצחון בהוקי קרח?
גילוי חיים תבוניים בכוכב אחר 386217
אנשים יכולים לא לדעת: הם יכולים לברר.
גילוי חיים תבוניים בכוכב אחר 386218
ולמחשבים אין גישה לגוגל?
גילוי חיים תבוניים בכוכב אחר 386249
אתה נוגע פה בשתי נושאים שקשורים זה בזה, רקע משותף ותשתית (או איך שלא קוראים לזה בעברית). ריקוד, לחיצת ידים, זוג חותרים, מעשה אהבים או שניים שאוחזין בטלית, כולם פעילויות של שיתוף שדורשות קואורדינציה מורכבת במימדים שונים. אבל, הקואורדינציה דורשת סידרה של הנחות מוקדמות שהשותפים מחזיקים כל אחד צריך להניח שהשני מעוניין לשתף פעולה, שהשני יודע מה זה טלית, איזה רגל לשים קדימה בשעת הריקוד או מתי תורו להיכנס כשהם מנגנים דואט. בנוסף, כל אחד צריך להניח שהשני יודע שהוא יודע את אותם הדברים, וכה הלאה (אתה יכול לראות כיצד טיורינג ניכנס לסיפור?).

הרקע המשותף - ידע על העולם, ידע אחד על השני, ידע על הדינמיקה של שיותף פעולה, ידע על העובדה שהשני הוא יצור תבוני בעל רגשות, כוונות, מחשבות וזכרונות - איננו דבר סטטי אלא הוא חלק מתהליך דינמי שנבנה תוך מהלך הפעילות. הפעילות עצמה יוצרת עובדות חדשות שעדכנות ומצטרפות למאגר הרקע המשותף, וכך נבנית התשתית שמאפשרת את המשך שיתוף הפעולה.

שיחה היא שיתוף פעולה פר אקסלנס, והיא מתאפשרת רק אם קיים רקע משותף שמעוגן בתשתית. בשיחה פנים אל פנים אתה מתכנן מה אתה רוצה לומר, אבל אתה גם צריך לוודא שיבינו אותך. זה נעשה על ידי רקע משותף תחילי, וגם על ידי מערכת סימנים שמאותת הבנה הדדית. ברגע שאמרת/כתבת (אם כי תקשורת מילולית שונה מתקשורת כתובה) דבר מה, והובנת, והבנת שהבינו אותך (וכו'), הפרט החדש מצטרף למאגר התשתית ואפשר להתייחס אליו בהמשך. למשל, "לדודה שלי שרה נולדה בת." "מזל טוב," "היא שוקלת 2.5 קילו." "מי, שרה?" השאלה האחרונה משתמשת בידע המשותף ששרה היא הדודה, ולא צריך לשאול "מי, הדודה שרה?"
גילוי חיים תבוניים בכוכב אחר 386256
נכון. שיחה טבעית היא פעולה מסובכת.

מסקנה: התוכנה המשוחחת לא תהיה פשוטה, תצטרך לדעת המון על העולם, ולזכור מה אמרו לה לפני רגע.
גילוי חיים תבוניים בכוכב אחר 386267
נדמה לי שבעיית הידע והזכרון הם דווקא החלקים הפחות מסובכים לתוכנה. ידע וזכרון רלוונטי לשיחה, זה כבר דבר אחר, לפני שעברנו לבעיות היותר מורכבות.
גילוי חיים תבוניים בכוכב אחר 386563
התכוונתי למשהו הרבה יותר פשוט, תגובה 386267 ניסחה את זה בצורה מוצלחת ממני. בניגוד למה שנדמה לכל מני אנשים, הבעיה בפיתוח מחשב שמבין שפה שונה לגמרי מהביות איתם מתמודד בן אדם שמנסה להבין שפה. הדברים שקשים לנו, זיכרון, ידע, מהירות חישוב וכו', הם דברים שקלים מאד למחשבים, דברים בהם מחשים לא רק טובים כמונו, אלא אף טובים מאיתנו. בכלל, כל חוק בשפה שניתן לניסוח בצורה חד משמעית, מחשב "יבין" אותו טוב מבן אדם.
גילוי חיים תבוניים בכוכב אחר 385866
(למידה חישובית היא לאו דווקא הטכניקה היחידה לעיבוד שפה טבעית בכלל ותרגום אוטומטי בפרט. לא בשמיים גם להכניס לתוכנה את ההקשרים הללו מראש.)
גילוי חיים תבוניים בכוכב אחר 385883
(כל אחד מדבר על מה שהוא מכיר)
גילוי חיים תבוניים בכוכב אחר 385868
קח את דוגמת בית הספר למשפט שהוא קל מאוד לאדם וכנראה קשה מאוד למחשב: "Melvin flung the plate at the wall, and it broke." בעברית: "מלווין הטיח את הצלחת בקיר, והיא נשברה." אבל רגע, למה לא "הוא נשבר" - הקיר? לכל אדם סביר בתרבויות הרלוונטיות ברור מי מהשניים צפוי להישבר מההתנגשות, אבל ידע העולם שנדרש לשם כך הוא כבד למדי - בהתחשב בכך שגם קיר עשוי להישבר, בנסיבות אחרות (ואפילו בהתנגשויות עם סוגים אחרים של plates).
גילוי חיים תבוניים בכוכב אחר 385881
מעניין שאתה שואל, כי בדיוק אתמול הייתי בהרצאה בנושא הזה בדיוק.

יש נושא שלם בהבנת שפה טבעית שעוסק בהבנת אנאפורה (ביטויי גוף וכאלה), ומסתבר שיש חוקים די ברורים לכך (Centering Theory), עוד לפני רמת הסמנטיקה. במקרה הספציפי הזה, "plate" הוא מושא ישיר ואילו "wall" הוא מושא עקיף, ולכן יש לו עדיפות להיות המשמעות של "it" על פני חברו המסוייד.

השווה "The wall had the plate flunged at by Melvin, and it broke". זה משפט קצת מבלבל, אבל הוא מבלבל פשוט כי אתה יודע שלא סביר שקיר אכן ישבר מזריקת צלחת. אבל כל המאפיינים של המשפט מצביעים על המשמעות הזו, וזהו הדרך הנכונה להבין אותו.
גילוי חיים תבוניים בכוכב אחר 385897
מה יש לכם עם המלווין הזה? אי אפשר לעבור לשמות קצת יותר סימפטיים?
גילוי חיים תבוניים בכוכב אחר 386123
יפה.
גילוי חיים תבוניים בכוכב אחר 386179
לא הבנתי... אתה יכול להסביר שוב?
אני אמקד את השאלה:
מה קורה אם משווים את
"Melvin flung the plate at the wall, and it broke."
ו
"Melvin flung the ball at the plate, and it broke."
ואת ההיפוך שלהם
"The X had the Y flunged at by Melvin, and it broke"
?
אמנם ההיפוך של השני נשמע (לי) פחות מבלבל מההיפוך של הראשון, אבל בגרסא הישירה שלהם שניהם ברורים באותה מידה למרות שה it מתייחס למושא אחר בכל פעם.
גילוי חיים תבוניים בכוכב אחר 386198
הממם. כנראה שטעיתי: קדימות של מושא ישיר על מושא עקיף לא עד כדי חזקה, ובאמת חייבים להשתמש בסמנטיקה. ואילו הקדימות של נושא על מושא היא כן חזקה יותר מסמנטיקה, ולכן אסור להפוך את המשפט הראשון אבל אפשר להפוך את השני.
גילוי חיים תבוניים בכוכב אחר 386203
עוד תגובה.

התאוריה‏1 עסקה הרבה ברצף של משפטים, ולא במשפט בודד. אז נניח:

Melvin played with the ball.
Then he flung the ball at the plate, and it broke.

ברור מהדקדוק שהכוונה בit לplate, אחרת היה כתוב:

Melvin played with the china doll.
Then he flung it at the plate, and it broke.

אמור להיות רצף של צורת שימוש בשמות גוף; לא דקדוקי לשבור רצף כזה בלי פרוטוקול מסוים, ומצד שני לא דקדוקי להמנע מלהשתמש בשמות גוף כשהפרוטוקול מאפשר. לכן ברוב הגדול של המקרים, לא תצטרך סמנטיקה כדי להבין שם גוף.

למעשה, אני חושד שאפילו הדוגמה הראשונה שלי (ובעצם גם שלך) בתגובה הזו לא דקדוקית בכלל, ואולי כדאי לשאול דובר אנגלית ילידי או (לעבור לדוגמאות בעברית). אני חושד שדובר אנגלית ילידי היה מנסח זאת בכלל כ:

Melvun flung the ball at the plate, which broke.

1 http://www.cs.tau.ac.il/~nachum/NLP/ וחפש "anaphora"
גילוי חיים תבוניים בכוכב אחר 386969
בחקירות בלשניות, הנתון האמפירי שבודקים הוא תמיד(?) מה נשמע לאנשים דקדוקי - האם משפט נתון נשמע להם תקין או לא. אבל אני חושב שנתון מעניין אחר הוא לתת להם להעריך משפטים באופן לא בינארי: איזה משפט נשמע להם טוב יותר. וגם אם "יוסי זרק את החולצה על הצנצנת, והיא נשברה" יובן על-ידי אנשים, ויישמע להם תקין, אני חושב שהם יעדיפו "יוסי זרק את החולצה על הצנצנת, והצנצנת נשברה" (או "..., וזו נשברה") - מה שמחזק את הנקודה המקורית שלך.
גילוי חיים תבוניים בכוכב אחר 385896
טוב, זה מוכר לי עוד מהקטע שבו גרושו(?) מרקס שובר קיר כשהוא נשען עליו/זז ממנו...
גילוי חיים תבוניים בכוכב אחר 385903
הארפו.
גילוי חיים תבוניים בכוכב אחר 385928
אכן.:)
גילוי חיים תבוניים בכוכב אחר 386626
[צ] "תרגום... דורש הבנה סמנטית... את זה מחשב לא יכול לעשות, וקשה לראות איך יוכל." [/צ]
למה אתה חושב שמחשב לא יכול לעשות את זה?
גילוי חיים תבוניים בכוכב אחר 386628
טוב, היה צ"ל, "קשה *לי*". אני פשוט לא רואה, לפחות במה שידוע לי על המחשב כרגע, שהוא יוצא מגבולות הסינטקס.
גילוי חיים תבוניים בכוכב אחר 386639
אני לומד עכשיו קורס קומפילציה. החודש הראשון זה סינטקס, ואחרי זה עוברים קצת לסמנטיקה.

(מה ידוע לך על המחשב כרגע?)
גילוי חיים תבוניים בכוכב אחר 386648
לא הרבה, חוץ מזה שכל דבר שראיתי אותו עושה עד כה בענייני שפה היה סינטקטי.
ויש דרישה למאמר מייד כשאתה מסיים את הקורס!
גילוי חיים תבוניים בכוכב אחר 386663
אני? תבקש ממי שהעביר את הקורס בסמסטר שעבר.
גילוי חיים תבוניים בכוכב אחר 386665
אגב, למען הסר ספק: אין לי מושג האם יש קשר כלשהו בין סמנטיקה של שפות תכנות לסמנטיקה של שפות טבעיות. ברור שהבעיה השניה קשה בכמה סדרי גודל.
גילוי חיים תבוניים בכוכב אחר 386671
אהה. עכשיו הבנתי. ברור שאני דיברתי על השנייה.
גילוי חיים תבוניים בכוכב אחר 385678
סתם אסוציאציה: אותו דבר נכון לראיה. יש אינסוף אפשרויות לעבור מהתמונה הדו-ממדית על הרשתית לעולם תלת-ממדי שיוצר אותה, אבל המוח מסתדר לא רע והפרשנות שהוא נותן בד"כ תואמת את העולם האמיתי, אם הקאנטיאנים יסלחו לי.

(כן, אני יודע שע"י השוואת התמונות משתי העיניים מקבלים רמזים טובים על הממד השלישי, אבל כידוע גם בעלי עין אחת לא נתקלים בקירות)
סלחנו. 385723
גילוי חיים תבוניים בכוכב אחר 386386
"למשל: "היה דיון מעניין באייל והצטרפתי אליו". לא אמרתי מפורשות שהסיבה שהצטרפתי לדיון היתה שהוא היה מעניין, אבל זה מובן מאליו לכל אדם, כי כל אדם יודע או יכול להסיק שסיבה להצטרפות לדיון היא העניין שלו, ושזה שזו הסיבה שהצטרפתי זו פרשנות כל-כך סבירה למשפט שאפשר להניח שזו הסיבה שצרפתי את שתי האמירות ביחד למשפט אחד מלכתחילה, בלי בכלל לשקול פרשנויות אחרות."

כשהמתמטיקה חדרה לראשו של אחד מחברי העתודאים, אי-שם בשנה ב', הוא החל לאבד את היכולת לעיבוד טבעי (לאו דווקא של שפה).יום אחד, כשראה אדם מתגלגל על הרצפה ולצידו אופניים שזה עתה נפלו על הרצפה, הוא סרב להסיק שהאדם נפל מהאופניים, היות ולא היתה לו כל הוכחה לכך. סתם, אנקדוטה.
גילוי חיים תבוניים בכוכב אחר 386387
זה לא מפתיע. אני מכיר רבים שראו אנשים מתפוצצים לגזרים באוטובוסים, לאחר שהובאו מחבלים מתוניס לישראל, וסירבו להסיק את הקשר שבין הדברים. (כנ''ל לגבי קסאמים שנורו משטחים ש''נוקו'' מיהודים והסירוב להכיר בקשר שלהם לתכנית ההתנקנקות)
גילוי חיים תבוניים בכוכב אחר 386397
עזוב את זה, אני מכיר אנשים שראו פעם אחר פעם כבאיות דוהרות ברחוב, ולאחר מכן שמעו ברדיו על דליקה, וסירבו להסיק שהכבאית היא הגורם לדליקה.
גילוי חיים תבוניים בכוכב אחר 386503
למזלנו, יש שוטרים קצת יותר חכמים ממך...
גילוי חיים תבוניים בכוכב אחר 386529
לא יותר חכמים מעמרי. יותר חכמים מהאנשים שהוא הזכיר.
LOL 386630
גילוי חיים תבוניים בכוכב אחר 386389
זו באמת לא מסקנה הגיונית במיוחד. הרבה יותר סביר שהאיש והאופניים גם יחד נזרקו לשם מחללית של חייזרים.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים