בתשובה לאלון עמית, 24/05/05 20:24
מחשבות חדשות (שלי) על מאמרים ישנים 304113
נתחיל מהחלק הקל (שמשום מה אף אחד לא התייחס אליו, עד כמה שראיתי) לפחות לגבי 3 כדאי להחליף, לא?
מחשבות חדשות (שלי) על מאמרים ישנים 304124
ודאי. לכן אם מישהו היה אומר "אני פותח את המעטפה, אם יש שם 3 אני מחליף ואחרת <אלגוריתם כלשהו שאינו "החלף בוודאות">" היה הגיון בשגעון. לעומת זאת מי שאומר "אני פותח את המעטפה, אם יש שם 3 אני מחליף ואחרת אני גם-כן מחליף" וגם אומר "ברור שעד שפתחתי את המעטפה אין טעם להחליף" צריך עדין להסביר מה קורה כאן.

גם ברור לי למדי שהכנסת ה"תועלת" (לעומת התוחלת) עם התפוקה השולית הפוחתת, כמו שעשה תובל באחת מתגובותיו, עוזרת להיחלץ מהסבך, לפחות טנטטיבית. עדיין אני מחפש תשובה מניחה את הדעת בעולם בו התועלת ליניארית, וגם לקבל קצת מספרים אמיתיים על העולם שלנו.

כמה כסף אתה מוכן לשלם תמורת השתתפות במשחק? (ההצעה הטובה ביותר עד כה: 99 אג').

99 אג' פעם ראשונה...
99 אג' פעם שניה...
הג'נטלמן בשורה האחרונה - כמה אמרת?
אני רוצה להבין 304150
מי נתן לך הצעה טובה מ-‏50 אג'?
מחשבות חדשות (שלי) על מאמרים ישנים 304160
אני נותן 4-5 שקלים.

אבל אם המשחק הוא חד פעמי ואין אפשרות להוראת קבע המשחק שלך מאוד מבאס (הסיכוי שלי להרוויח סכום שהוא יותר מעשרות שקלים הוא נמוך מאוד).
מחשבות חדשות (שלי) על מאמרים ישנים 304349
זה באמת שמרני עד אימה.
חברת סט פטרסבורג בע''מ. 304291
מכיוון שאתה כבר שואל אותי- מישהו שהיה מציע לי משחק כזה, הייתי מתעלם ממנו כי ברור לי שאין לו משאבים לעמוד בהתחיבויותיו.
מחשבות חדשות (שלי) על מאמרים ישנים 304190
כמובן. הטענה היא שגם ל-‏9 כדאי להחליף. מה דעתך?

אפשר אולי לערוך סיכום-ביניים של המצב. השאלה מציגה אתגר לאינטואיציה: לכאורה כדאי תמיד להחליף, ולכאורה אין שום טעם להחליף (יכולת מראש לחשוק במעטפה הדרומית, לפתוח את השנייה ולחזור בתרועה לזו שרצית).

כיוון אחד לחידוד הבעייה הוא מתמטי. האם ניתן לנסח את הסתירה הזו כשני חישובים שונים של אותו ערך המובילים לתוצאות שונות? ניסינו, למשל, לחשב את תוחלת הרווח, שהיא כאילו חיובית וכאילו אפס. הגענו למסקנה שאין כזו תוחלת. מתמטית, אפשר להירגע; אינטואיטיבית, לא נראה שהתקדמנו.

אפשר לפטור כלא מעניין את כל המצב הזה, פשוט כי הוא לא ייתכן: המוסד שמארגן את המשחק הזה זקוק לאינסוף משאבים כדי לעמוד בהבטחות שלו. זה נכון, ולכן אני לא בטוח שאפשר להסיק מסקנות מרחיקות לכת מהחידה; אם מדמיינים שמשהו בלתי-אפשרי קרה, אין מה להתפלא אם קורים עוד דברים מוזרים אחר-כך.

עם זאת, אפשר לנסות לחשוב מה בכל-זאת צריך לעשות אם עומדים במצב הזה. תשובה אפשרית אחת הוא שנימוק ההחלפה עומד בעינו: אחרי שראית מה יש במעטפה, אכן כדי להחליף. ומה, שואל שכ"ג, הרווחנו מכך שבכלל פתחנו אותה? דב סאמט (אותו הזכרתי קודם) כתב לי בהקשר הזה כך:

That is, it is possible that one wants to do something for ANY
information one gets, and yet one has no reason to do it
without having the information. Obviously this cannot
happen in a finite setup. So, here is yet another case where infinity is
counter intuitive.

אני חושב שעוזי אמר דבר דומה.
חררמפ 304292
אצתדק ואומר שכתבתי את התגובה שלי בלי לקרוא את זאת.
מחשבות חדשות (שלי) על מאמרים ישנים 304393
אתה חי בשלום עם הטענה הזאת?
מחשבות חדשות (שלי) על מאמרים ישנים 304408
אבל כתוב במפורש שאין עם זה שום בעיה, ועוד באנגלית.

אתך במאבקך הצודק,
(-)
מחשבות חדשות (שלי) על מאמרים ישנים 304532
אני באמת סקרן - יש לך דרך ליישב את הבעיה?
מחשבות חדשות (שלי) על מאמרים ישנים 304553
הדרך הקלה: להגיד שאני לא רואה שום בעיה (למרות שזה לא ממש נכון).

במקום הבעיה של אלון, אני מעדיף לחשוב על הווריאנט של אורי, עם שתי מעטפות בלתי תלויות (שבכל אחת מחביאים 3-בחזקת-מספר-המטבעות-עד-עץ). כדי להגדיל את המוטיבציה לבחור במעטפה הראשונה, אני מציע *להכפיל* את הסכום במעטפה הזו.

מבחינה מתמטית, כפי שאלון ציין, למשתנה המקרי שמודד את הרווח במקרה של החלפה *אין תוחלת* (הטור לא מתכנס) - אבל זה נכון רק *לפני* שדגמנו את המעטפה הראשונה. אחרי הדגימה, יש למשתנה הזה תוחלת - והיא תמיד אינסופית. לכן כדאי לעבור מן המעטפה הראשונה לשניה - וההחלטה הזו לא תלויה בערך שמצאנו שם.

שרלוק הולמס אמר על מצבים כאלה שכאשר מסירים את הבלתי אפשרי, מה שנשאר - בלתי סביר ככל שיהיה - מוכרח להיות האמת. הוכחנו שאחרי שפותחים את המעטפה הראשונה, כדאי (מבחינת התוחלת) תמיד להחליף; אז ככה זה.
מחשבות חדשות (שלי) על מאמרים ישנים 304652
אם כך אתה חי בשלום עם ה"הסבר" של דב סאמט. אתה מכיר עוד דוגמאות בהן ניתן להוכיח מתמטית שמשתלם לעשות משהו חסר כל טעם?

למשל, אתה יכול לדמות מצב בו קטע הקידוד
If A then func()
else func()

עדיף על
func()

?
מחשבות חדשות (שלי) על מאמרים ישנים 304656
(בלי שטויות כמו איזו תועלת שיכולה לנבוע מהעיכוב הקטן של ביצוע הקטע הראשון)
מחשבות חדשות (שלי) על מאמרים ישנים 304692
הסיטואציה הבסיסית, שבה אתה מעניק לי מתנה בשווי אינסופי, כל-כך מופרכת, עד שזה לא מפתיע שהאינטואיציה שלנו לגבי קבלת החלטות מסתבכת.

מבחינת התוחלת אין שום הבדל בין מעטפה עם 3-בחזקת-X (כאשר X הוא מספר המטבעות עד העץ הראשון) לבין 1000-בחזקת-X.
מחשבות חדשות (שלי) על מאמרים ישנים 304693
כמו שנהוג לומר כאן לאחרונה: אני צריך לישון על זה (למרות שאני מעדיף מזרן וכרית).

בניסוח עם המעטפות אני לא באמת מעניק לך מתנה בגודל אינסופי אלא בגודל סופי בהחלט (אותו 3-בחזקת-x, כשאת x קיבלתי אחרי מספר סופי של הטלות מטבע) אלא שהגודל הזה אינו ידוע לך. אתה יכול *לחשוד* בי שאם הוא יצא גדול מדי אני רימיתי, ואז עפ"י הסכום במעטפה אתה כבר יכול להחליט לא להחליף אותה אם הוא גדול ("שכ"ג בטח לא סיכן 3 מיליארד שקל בשביל הניסוי הטפשי הזה. אסתפק הפעם במיליארד") - אבל זה כבר סיפור אחר, וכאן באמת יש טעם לפתוח את המעטפה.
שאלה קצת דבילית 304698
אם נחזור רגע לסיפור עם המטבעות. גם אם מובטח לי שהטקטיקה שתבחר תהיה להמשיך עד שתפסיד את הכל, ז"א שאני לא אתן לך בסוף דבר בשום מקרה, גם אז אם אני אנסה לחשב את התוחלת אני אקבל שתוחלת ההפד שלי היא אין סופית (למרות שהרווח שלך הוא אפס). איפה פספסתי את התשובה?
שאלה קצת דבילית 304729
אני לא חושב שזה נכון (שתוחלת ההפסד שלך היא אינסופית). במקרה הזה תוחלת ההפסד שלך תלויה באסטרטגיה שלי (שיכולה להיות "עצור כשמציעים לך 3", "עצור כשמציעים לך 9", ... או "אל תעצור לעולם"), ולכל אסטרטגיה יש לי (ולך) תוחלת רווח אחרת. בסדרת האסרטגיות הזו, התוחלת שלך לא חסומה (כי אני עלול לחכות עד שיציעו לי 3-בחזקת-מאה, וזה יקרה בסיכוי חצי-בחזקת-מאה), אבל בכל מקרה אני לא חושב שאפשר לומר שהיא אינסופית.
שאלה קצת דבילית 304731
ואם האסטרטגיה של הבוחר היא "אל תעצור לעולם"?
שאלה קצת דבילית 304741
טענה יפה. הנה הלך המחשבה שלי בעניין ( אני מדבר על המשחק ללא המעטפות):

למעשה עלינו להחליט על איסטרטגיה שאומרת: אני משחק לכל היותר K פעמים. זה נותן תוחלת סופית. רק נותר לקבוע מהו K. נשים לב שבכל נקודה במשחק, המשחק הבא הוא למעשה אותו משחק בדיוק, רק עם סכום התחלתי חדש, מכאן שאם משיקולים כל שהם אנו מחליטים על איסטרטגיה של K צעדים, אותם שיקולים ימשיכו להיות נכונים בכל צעד במשחק, ומכאן שאי אפשר למצוא K סופי כזה.

בוא נקבל את ההנחה ש "אל תעצור עד שתפסיד" היא איסטרטגיה בלתי קבילה, ואז לכאורה אין לנו כלל איסטרטגיה "רציונלית".
*אבל* - מה שבעצם הראינו היא שאם קיימת איסטרטגיה שאומרת לנו מתי להפסיק, היא צריכה להיות "אינווריאנטית" לנקודת התחלת המשחק. לכן אני מציע איסטרטגיה בזאת:
לפני כל צעד, הטל מטבע עם הסתברויות p 1-p . אם מקבלים עץ- ממשיכים, אחרת מפסיקים. האיסטרטגיה הזאת מקיימת את הדרישה (שהמצאנו עכשיו) , שלא משנה באיזה שלב אתה במשחק, תמיד עושים אותו דבר. השאלה היחידה היא איזה ערך של p יש לבחור. ברור שכמה שהוא יותר קרוב ל1 כך התוחלת תגדל ולכן הפארדוקס הפסיכולוגי נותר כשהיה, אבל לפחות סילקנו את שאלת הפוקר היהודי ( בחרת K? שיחקת K ולא נכשלת? למה שלא תמשיך עוד K, הרי לפניך אותו מצב בדיוק).
שאלה קצת דבילית 304744
קל להיחלץ מהסבך עם איסטרטגיות מהסוג הזה. בשביל מה, אגב, אתה מטיל מטבע? למה לא איסטרטגיה "שחק X סיבובים"? אה, זה בעצם מה שעוזי אמר? חרמפפפ.

הבעיה היא לא למצוא איסטרטגיה, אלא ל*הצדיק* אותה (בהנחת תועלת לינארית בתוחלת, אחרת כל העסק קל מדי).
שאלה קצת דבילית 304747
כי כמו שאמרתי, הלוגיקה שהביא אותך לשחק X סיבובים היא שיקול נכון בכל שלב במשחק. אני מנסה לפרמל את השאלה כך שלא יתקלו‏1 כל פעם במכשול הזה. אני מסכים עם סמיילי שהשאלה דבילית. על תרמיות פונצי כבר דיברנו פעם? דיברנו תגובה 278934.

1 על מי אני עובד. כדי ש*אני* לא אתקל כל פעם. חשבתי שזה עשוי גם לעניין אחרים.
שאלה קצת דבילית 304748
הבנתי.

על שיטת פונצי (בנוסח טיפה שונה) דיברתי עם טובה עד לפני זמן מה.
שאלה קצת דבילית 304750
לא תמיד ברור איפה פונצי נגמר ו''כלכלה היא לא משחק סכום אפס'' מתחיל.
שאלה קצת דבילית 304769
זה רעיון יפה מאד - הוא מאפשר לממש את ה"הבטחה" לרווח אינסופי. נניח שהמשחק מתחיל בהצעה בגובה שקל אחד, ואתה צריך בכל שלב להחליט אם לממש את הפרס או להמר (ואז להפסיד לגמרי או לשלש את הפרס, בסיכויים שווים). באסטרטגיה ההסתברותית, אנחנו נותנים לקוביה להחליט בשבילנו: בסיכוי p מממשים, בסיכוי q=1-p מהמרים.
תוחלת הרווח בשיטה הזו היא (2p/(3p-1 אם p גדול מ-‏1/3, ואינסוף אחרת!
שאלה קצת דבילית 304770
שים אותי co-author , אשמח להקטין את הארדוש שלי:)
שאלה קצת דבילית 304948
אם תעדן את זה עוד קצת, כך שאתה משנה את p בהתאם לגובה הפרס בשעת ההטלה כדי להכניס למשחק שיקולי תועלת (להבדיל מתוחלת), זה יהיה בכלל יופי. לא?
שאלה קצת דבילית 305096
קצת מסובך לטפל ב"תועלת" (שקלול של תוחלת ושונות?), כי התוחלת אינסופית כל הזמן.
שאלה קצת דבילית 305615
ה"תועלת" שאני מדבר עליה מבטאת את הערך השולי הפוחת של הכסף. אני רוצה ש p יהיה כמעט 1 כשהסכומים קטנים, ויקטן עם עלייתם כך שכאשר יש לי כבר מליון שקל מובטחים אני אפרוש בשמחה ולא אסכן אותם בסיבוב נוסף.
שאלה קצת דבילית 305749
הבעיה היא שההחלטה על הסכום "מליון" בתור נקודת הcut off היא שרירותית. ברגע שעשית את זה, בעצם הכרזת שאתה לא מאמין למשחק הזה מעבר לסכום נתון.
שאלה קצת דבילית 305851
האמת היא שאחרי ששלחתי את התגובה ההיא חשבתי שאם כבר מכניסים את שיקולי התועלת אין צורך בהטלת הקוביה שכן הבעיה נפתרת מאליה במקום בו הרווח השולי של זכיה נוספת קטן מההפסד של הסכום שיש בידי באותו רגע. אם פונקציית התועלת אינה ידועה לי לגמרי (ברנולי חשב שהיא לוגריתמית, אבל אפילו אם הוא צדק היא בטח שונה לאנשים שונים) הקוביה יכולה להכניס קצת ''פאזינס'' לעסק.
שאלה קצת דבילית 305880
להגיד שהתועלת היא לוגריתמית זאת רמאות. אז תשנה את סכום הזכיה ל שלוש בחזקת שלוש בחזקת N. העניין הוא לא לטשטש את הגבול, אלא לאפשר תוחלת אין סופית מבלי להכנס לפרדוקס של עומר: אל תפסיק עד שתפסיד.
שאלה קצת דבילית 305975
אני לא מבין,

לכאורה למשחק תוחלת אינסופית אבל אם תשחק אותו אינסוף פעמים בטוח תפסיד.
לכאורה אי אפשר לייצר אסטרטגיה מתמטית למשחק.

מה הבעיה להשתמש באסטרטגיה כלכלית תוך שימוש בתועלת ?
הרי המטרה היא להרוויח, לא?
שאלה קצת דבילית 306016
אם אתה רוצה להגדיר פונקציית תועלת בהתאם לתנאי הבעיה זה לא קשה, אבל אם הפונקציה הזאת קשורה לענייני כלכלה באופן כללי - כלומר לשאלה מה ערכו של הדולר ה- 1,000,001 יחסית לדולר הראשון ולדולר ה 1,000,000,001 עבורך (בלי שום קשר למשחק ספציפי), הרי אפשר להמציא משחק בו היא תמשיך לגדול לעד באופן שלא יאפשר לך לפרוש ולגשת לקופה, אם אתה טיפוס רציונלי ועקבי. למשל, כמו שראובן הראה, אם פונקציית התועלת שלך לוגריתמית, מתי תפרוש ממשחק בו הרווח גדל יותר מהר מאקספוננט? כדי להיחלץ מזה צריך פונקציית תועלת חסומה מלמעלה, וזאת קצת בעיה (אם כי אולי לא בעיה עצומה) כשמסתכלים על כל מיני ביל גייטסים שממשיכים לצבור הון כמיטב יכולתם במקום לעשות משהו אחר עם הזמן שמוקצב להם בעולם הזה. פונקציית התועלת שלי, אני חושב, אכן מוגבלת מלמעלה בסביבות 50 מליון דולר.
שאלה קצת דבילית 306062
>> הרי אפשר להמציא משחק בו היא תמשיך לגדול לעד באופן שלא יאפשר לך לפרוש ולגשת לקופה

התועלת *תמיד* מוגבלת מלמעלה. אין ליצור אנוש תועלת אינסופית.

>>כשמסתכלים על כל מיני ביל גייטסים שממשיכים לצבור הון כמיטב יכולתם

אתה בוודאי מתכוון לסטיב באלמר ולא לגייטס, אשר חילק כבר בערך מחצית הונו הנוכחי לצדקה, והתחייב להוריש לכל יורשיו סכום "פעוט" של 10 או 100 מיליון דולר בלבד.
שאלה קצת דבילית 306229
נו, אנחנו מדברים פה על "אידאליזציות":
1) מדובר בשחקן רציונלי (קרי- יצור שמעוניין בהגדלת תוחלת התועלת שלו)
2) לתועלת הזאת אין גבול עליון
3) לבנק במשחק יש יכולת לספק כל תועלת שנרצה.

אולי תטען שהפרדוקס האמור מראה ששלושת ההנחות סותרות זו את זו, אבל אם תקרא בעיון את הפתיל, תמצא דרך אחת לפחות לזכות בתועלת אינסופית (בממוצע).
מצד שני, אם תטען שהפרדוקס הזה לא רלוונטי לחיי אנוש, אולי אתה צודק.
שאלה קצת דבילית 306237
אני לא בטוח בכלל שהתועלת תמיד חסומה למלמעלה. מיד אחרי שחישבתי את החמישים מליון ההם הבנתי שאני משקר. יש המון מטרות נעלות שהייתי בשמחה תורם להן כסף אם היה לי, החל מהקרן להצלת שבלול החוף הסיישלי ועד תשלומי פנסיה לכל אזרח ישראלי מעל גיל 22 (גם הקרן להגנת האייל היתה נהנית מכמה מליונים קטנים).

בקיצור, הרצון לאסוף כסף כדי לתרום אותו לא חוסם את פונקציית התועלת.
שאלה קצת דבילית 306099
נדבר שוב כשתגיע ל-‏35 מיליון.

האמת, לא נכון. רציתי לגבות את זה בטענת-השרוול שאנשים שאופק העושר שלהם מוגבל ב-‏50 מיליון הם לא הטיפוסים שיגיעו גם לחמישה מיליון. אבל נזכרתי במוסף ה"מרקר" מאחד החגים האחרונים, שהוקדש לעשירי הייטק שמקדישים עצמם ליוזמות למען הקהילה. כמעט כולם התעשרו מהנפקה מוצלחת בימי הבועה, וכמעט אצל כולם היה המוטו שכבר אין להם באמת מה לעשות למען עצמם עם הכסף. יכול להיות שטענת השרוול שלי לא מופרכת, אבל ברור לפחות שבועות הייטק יכולות לייצר יוצאים מן הכלל ברוכים.
שאלה קצת דבילית 306169
אם פונקצית התועלת שלך חסומה, הרי שהיא לא יכולה להיות אדטיבית בשום צורה ולפיכך ניתוח המשחק תלוי בכמה כסף יש לך כרגע ומה התחזית העתידית שלך. לא שזה לא הגיוני , אבל זה מסבך את הניתוח.
שאלה קצת דבילית 306260
למיטב הבנתי ברגע שמכניסים "תועלת" לא ליניארית ניתוח המשחק תלוי בכמה כסף יש לך כרגע, גם היא לא חסומה (אזהרה: אני לא מתמטיקאי כך שאם אני טועה אנא הסבר לי את זה במונחים שכל הדיוט יבין).
שאלה קצת דבילית 306294
מיטב הבנתך נכונה. בעצם רק ציינתי שחסומה גורר לא לינארית.
שאלה קצת דבילית 306307
או קבועה, כמובן, אלא שאז אין שום טעם למשחק שלנו ואפשר לעשות דברים טובים יותר עם הזמן.
שאלה קצת דבילית 306321
"ואפשר לעשות דברים טובים יותר עם הזמן."
מה למשל?
שאלה קצת דבילית 306324
לענות על שאלות טרחניות של אלמונים.
שאלה קצת דבילית 304733
אני מדבר על המקרה בו הטקטיקה (שיהיה אסטרטגיה) שלך נתונה מראש, והיא אם המטבע נופל על פלי תמשיך (בסכום מושלש) ואם על עץ, תפסיק (ולא תקבל כלום). אני חושב שהתוחלת עבור אסטרטגיה כזו היא אין סופית (כשלוקחים אותה כגבול של תמשיך עד שהמטבע נופל על עץ או עד שנגמרים N משחקים, כש-N שואף לאינסוף), למרות שהרווח שלך יהיה בכל מקרה אפס.
שאלה קצת דבילית 304734
וכבר אמרתי שהשאלה דבילית?
שאלה קצת דבילית 304736
הנה חישוב אלטרנטיבי לתוחלת: אם בהסתברות 1 הרווח הוא 0, התוחלת צריכה להיות 1*0=0.

איך מיישבים את הסתירה?
שאלה קצת דבילית 304739
(לשניכם)

אין כאן סתירה. אם האסטרטגיה ה-N אומרת לעצור ברגע שמציעים לך 3-בחזקת-N, אז התוחלת שלה היא (3/2)-בחזקת-N, ולכן סדרת התוחלות שואפת לאינסוף.
מאידך, אפשר להסכים שכאשר N שואף לאינסוף, סדרת ה*אסטרטגיות* "שואפת" לאסטרטגיה החמדנית שאומרת "אל תעצור לעולם". אבל באסטרטגיה הזו (בהסתברות 1) הרווח הוא 0, ולכן התוחלת שלה אפס.

אם כך, הוכחנו שהתוחלת אינה פונקציה רציפה של האסטרטגיה.
ובתרגום לשפת בני אדם 304745
(אתה יכול להסתפק במשפט הראשון והאחרון, את השאר אני מאמין שהבנתי)
שאלה קצת דבילית 304752
יפה, תודה.
מחשבות חדשות (שלי) על מאמרים ישנים 306182
אתה חושב שסתם ציטטתי את דוב סאמט במקום להגיד מה דעתי? אין לי ממש מושג. כזכור, תנאי-ההתחלה כאן הם אבסורדיים, ולכן העסק לא מדיר שינה מעיני; בפרט, לשאלתך על התוכנית - התשובה היא שמן הסתם אפשר לקצר כל if then כזה לפקודה האחת. מחשב הוא לא המקום לחפש בו תוחלות-רווח לא חסומות.
מחשבות חדשות (שלי) על מאמרים ישנים 306258
המממ. אתה מנסה לרמוז שאנחנו לא מכונת טיורינג?
מחשבות חדשות (שלי) על מאמרים ישנים 306503
שאני, מכונת טיורינג בלה שכמוני, ארמוז דבר כזה? אם לא הייתי מכונת טיורינג, הייתי נעלב :-)

אני חושב שאתה מבין למה התכוונתי. אם לא, שוּט.
מחשבות חדשות (שלי) על מאמרים ישנים 306509
נו, כך נפלה לה עוד אשליה...

חזרה לעמוד הראשי

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים