בתשובה להאייל האלמוני, 16/05/06 22:04
גילוי חיים תבוניים בכוכב אחר 385811
חכם בלילה. את זה לא יוכל לעשות גם אדם.
גילוי חיים תבוניים בכוכב אחר 385814
הא?
גילוי חיים תבוניים בכוכב אחר 385818
לתרגם את הדוגמה. זה לא עובד באנגלית, זה עובד רק בעברית. צריך לבחור על איזה משחק מלים לוותר, על כמה, ולעומת מה. אף אדם לא יכול לעשות את זה מושלם, ולא כל אדם יכול לעשות את זה בצורה סבירה בכלל, אז זה לא ממש מפתיע שאנחנו לא יודעים איך לעשות את זה עם מחשב. לא זו המטרה של הבנת שפה טבעית (או של תרגום אוטומטי, אם כבר).
גילוי חיים תבוניים בכוכב אחר 385822
עזוב את משחק המלים. זה לא בדיוק טקסט ספרותי. כל מתרגם אנושי יידע איזה מנצח כאם הוא "victor" ואידה "onductor". איך המחשב יידע את זה?
גילוי חיים תבוניים בכוכב אחר 385833
לפי סמיכות המילה ''מלחמה'' ל''ניצח'' הראשון ו''תזמורת'' לשני. אחרי שהמחשב עובר על אלפי טקסטים הוא יכול לזהות הקשרים שכאלו.
גילוי חיים תבוניים בכוכב אחר 385840
טוב. אם אני אגיד "המנצח היה חניבעל", או "המנצח היה מנדי רודן" - מה אז?
גילוי חיים תבוניים בכוכב אחר 385844
אז זה יותר קשה, אבל לדעתי טכניקה דומה (אם כי מתוחכמת יותר) תשיג את אותה המטרה. קרוב לודאי ש''חניבעל'' נמצא בקרבה גדולה יותר ל''מלחמה'' מאשר ל''תזמורת'' ברוב הטקסטים שהתוכנה למדה.

כמובן שאפשר להיות אולטרה חכמים ולהגיד ''חניבעל ניצח על צבאו בצורה מופתית, כמו המנצח מנדי רודן'', ואת זה אני חושב שאפשר לפתור רק אם טורחים ללמוד קורס בלמידה חישובית ולא רק שומעים שמועות כמוני.
גילוי חיים תבוניים בכוכב אחר 385847
לא צריך להיות חכמים גדולים כדי להמציא טקסט שבו לא יופיעו לא מלחמה ולא תזמורת, גם כשמדובר על אחד משני אלה.
גילוי חיים תבוניים בכוכב אחר 385848
כן, אבל יופיעו בכל זאת מילים כלשהן שמספקות הקשר (אחרת גם בני אדם ייאלצו לנחש מה המשמעות).
גילוי חיים תבוניים בכוכב אחר 385849
זדה תלוי. קודם כל יכול להיות משהו כמו "המנצח רודן נלחם בחירוף נפש עם הנהלת התזמורת" (נדמה לי שהייתה בפועל סיטואציה כזו). שנית, במסגרת שיחה בספר יכול להיות משהו כמו "אני בטוח שהמנצח יהיה רודן"/ "אז מה? אז שווה ללכת?"/ "לא יודע, הוא קצת מחורפן בזמן האחרון"... וכיו"ב.
בן אדם אינו צריך לנחש. או שהוא מכיר את השמות, או שהוא יברר מי הוא מי.
גילוי חיים תבוניים בכוכב אחר 385865
שתי האפשרויות - הכרת השמות, או בירור המקצועות - הן פשוטות מאוד עבור מחשב.
גילוי חיים תבוניים בכוכב אחר 385884
כמו שאדם מכיר את השמות כך גם מחשב יכול.
גילוי חיים תבוניים בכוכב אחר 385879
הפועל "ניצח" בעברית מקבל ביטוי יחס "על X" רק במשמעות המוסיקלית שלו ולא בצבאית. את הבעיה _הזו_ אפשר לפתור כבר ברמת התחביר (שזה בדיוק מה שגם אנשים עושים).
גילוי חיים תבוניים בכוכב אחר 386206
כמה בני אדם ידעו ש"המנצח היה סטיוארט צ'אלנדר" מתיחס לניצחון על תזמורת, ש"המנצחת היתה ברברה מרויס" מתיחס לניצחון בהוקי קרח?
גילוי חיים תבוניים בכוכב אחר 386217
אנשים יכולים לא לדעת: הם יכולים לברר.
גילוי חיים תבוניים בכוכב אחר 386218
ולמחשבים אין גישה לגוגל?
גילוי חיים תבוניים בכוכב אחר 386249
אתה נוגע פה בשתי נושאים שקשורים זה בזה, רקע משותף ותשתית (או איך שלא קוראים לזה בעברית). ריקוד, לחיצת ידים, זוג חותרים, מעשה אהבים או שניים שאוחזין בטלית, כולם פעילויות של שיתוף שדורשות קואורדינציה מורכבת במימדים שונים. אבל, הקואורדינציה דורשת סידרה של הנחות מוקדמות שהשותפים מחזיקים כל אחד צריך להניח שהשני מעוניין לשתף פעולה, שהשני יודע מה זה טלית, איזה רגל לשים קדימה בשעת הריקוד או מתי תורו להיכנס כשהם מנגנים דואט. בנוסף, כל אחד צריך להניח שהשני יודע שהוא יודע את אותם הדברים, וכה הלאה (אתה יכול לראות כיצד טיורינג ניכנס לסיפור?).

הרקע המשותף - ידע על העולם, ידע אחד על השני, ידע על הדינמיקה של שיותף פעולה, ידע על העובדה שהשני הוא יצור תבוני בעל רגשות, כוונות, מחשבות וזכרונות - איננו דבר סטטי אלא הוא חלק מתהליך דינמי שנבנה תוך מהלך הפעילות. הפעילות עצמה יוצרת עובדות חדשות שעדכנות ומצטרפות למאגר הרקע המשותף, וכך נבנית התשתית שמאפשרת את המשך שיתוף הפעולה.

שיחה היא שיתוף פעולה פר אקסלנס, והיא מתאפשרת רק אם קיים רקע משותף שמעוגן בתשתית. בשיחה פנים אל פנים אתה מתכנן מה אתה רוצה לומר, אבל אתה גם צריך לוודא שיבינו אותך. זה נעשה על ידי רקע משותף תחילי, וגם על ידי מערכת סימנים שמאותת הבנה הדדית. ברגע שאמרת/כתבת (אם כי תקשורת מילולית שונה מתקשורת כתובה) דבר מה, והובנת, והבנת שהבינו אותך (וכו'), הפרט החדש מצטרף למאגר התשתית ואפשר להתייחס אליו בהמשך. למשל, "לדודה שלי שרה נולדה בת." "מזל טוב," "היא שוקלת 2.5 קילו." "מי, שרה?" השאלה האחרונה משתמשת בידע המשותף ששרה היא הדודה, ולא צריך לשאול "מי, הדודה שרה?"
גילוי חיים תבוניים בכוכב אחר 386256
נכון. שיחה טבעית היא פעולה מסובכת.

מסקנה: התוכנה המשוחחת לא תהיה פשוטה, תצטרך לדעת המון על העולם, ולזכור מה אמרו לה לפני רגע.
גילוי חיים תבוניים בכוכב אחר 386267
נדמה לי שבעיית הידע והזכרון הם דווקא החלקים הפחות מסובכים לתוכנה. ידע וזכרון רלוונטי לשיחה, זה כבר דבר אחר, לפני שעברנו לבעיות היותר מורכבות.
גילוי חיים תבוניים בכוכב אחר 386563
התכוונתי למשהו הרבה יותר פשוט, תגובה 386267 ניסחה את זה בצורה מוצלחת ממני. בניגוד למה שנדמה לכל מני אנשים, הבעיה בפיתוח מחשב שמבין שפה שונה לגמרי מהביות איתם מתמודד בן אדם שמנסה להבין שפה. הדברים שקשים לנו, זיכרון, ידע, מהירות חישוב וכו', הם דברים שקלים מאד למחשבים, דברים בהם מחשים לא רק טובים כמונו, אלא אף טובים מאיתנו. בכלל, כל חוק בשפה שניתן לניסוח בצורה חד משמעית, מחשב "יבין" אותו טוב מבן אדם.
גילוי חיים תבוניים בכוכב אחר 385866
(למידה חישובית היא לאו דווקא הטכניקה היחידה לעיבוד שפה טבעית בכלל ותרגום אוטומטי בפרט. לא בשמיים גם להכניס לתוכנה את ההקשרים הללו מראש.)
גילוי חיים תבוניים בכוכב אחר 385883
(כל אחד מדבר על מה שהוא מכיר)

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים