בתשובה לשוקי שמאל, 18/12/05 1:53
סיכוי טוב יותר 371322
מאחר ואין זה נכון לדבר על "הסתברות לסיכוי הזכייה", הנה משהו שעלה בראשי לפני כמה שנים ושיכול אולי לסייע כאן. זה התחיל מן השאלה "מה הסיכוי שהסיכוי הוא אכן הסיכוי?", שהתבררה כשאלה הלא נכונה. לבסוף הגעתי לנוסח: "כיצד נגלם בסיכוי גם את גודל המדגם על פיו הוא מחושב?". בתקופה האחרונה אף עשיתי בתוצאת שתובא להלן שימוש כדי למיין שכיחויות משוערות של ארועים, שכל אחת מהן חושבה עפ"י מדגם בגודל אחר.

אז ככה: לא פעם בחיים (לפחות אלו שלי) צריכים אנו להעריך סיכויים על סמך ניסיון מועט בלבד. כיצד אנו עושים זאת? כאשר מדובר בהתרחשות שקרתה די פעמים, נניח משחק במכונת מזל היפותטית אותה ניסינו מאה פעמים שב40 מהן זכינו, אנו נוהגים לקבוע את סיכוי הזכיה בניסיון הבא כשכיחות ההצלחות עד כה, שבמקרה זה הינה 40/100. האם זה נכון? מדוע אם כך אין זה עובד גם במספרים קטנים? – למשל האם לאחר ניסיון בודד שהצליח סיכוי ההצלחה בניסיון הבא (באותם התנאים) הוא 1? שהרי אם כך, הרי כדאי לנו להמר על הצלחה בהגרלה הבאה בכל כספנו, ואף ללוות לשם כך סכומים נוספים. ומה אם מתוך שלושה ניסיונות היינו מקבלים שתי הצלחות? האם די בכך כדי לטעון שהסיכוי להצלחה לפי מידע זה, הוא שני שליש, בדיוק כבשני מיליון הצלחות מתוך שלושה מיליון ניסיונות? האין בכמות הניסיון שרכשנו ולא רק בשכיחות ההצלחות, כדי להשפיע על הסיכוי להצלחה בניסיון הבא?

ננסה לנסח זאת באופן מדוייק יותר. בהנתן הגרלה חוזרת בסיכוי קבוע p שאינו ידוע, נשאל את עצמנו, לאחר N ניסיונות מתוכן הצלחנו n פעמים, מאילו pים יכולה היתה תוצאה זו להתקבל. התשובה היא כמובן ש*כל* p ממשי בין אפס לאחד יכול להניב כל N וn כנ"ל. בפרט, הסיכוי שp, על סמך N וn הנ"ל יהיה בעל כל ערך נתון – הוא אפס. בנסיבות מצערות אלה, כל שאנו יכולים לצפות אם כן הוא לחפש את הערך הקרוב ביותר לp האמיתי והלא ידוע, על סמך תוצאות הניסיונות.

בקיצור נמרץ (שיפורט לפי דרישה): נגדיר אם כן את הערך הקרוב ביותר לp כזה שסטייתו הריבועית ממנו מינימלית. כידוע, עבור התפלגות נתונה, הקבוע סביבו הסטיה הריבועית היא מינימלית הוא ממוצע ההתפלגות. לכן נמצע על p. לפי משפט Bayes ‏1, ממוצע זה הוא האינטגרל לפי p של p כפול הביטוי להתפלגות הבינומית הניתן ב(2) ב http://mathworld.wolfram.com/BinomialDistribution.ht... , חלקי האינטגרל על הביטוי, ללא כפל נוסף בp (נירמול). התוצאה (המפתיעה, לפחות אותי) אינה n/N, אלא ...
(n+1)/(N+2)
אותה אכנה בחיבה סטי ( - סיכוי טוב יותר).
כלומר, לאחר n הצלחות מתוך N ניסיונות, אם אין ידע רלוונטי נוסף, או חסרה היכולת לשקלל ידע כזה, הניחוש הטוב ביותר עבור הסיכוי הצלחה בניסוי הבא שנערך באותם באותם התנאים - הינו סטי ולא שכיחות ההצלחות עד כה.

תכונות סטי: ככל שN וn גדלים, אך שומרים על אותו היחס, כך סטי שואף לשכיחות המצטברת n/N, כאשר הטייתו ממנה היא תמיד לכיוון הערך חצי. סכום סטי והסטי של האירוע המשלים (כלומר, אם מגדירים את ההצלחה ככישלון ולהיפך) – הוא 1. בפרט, אם השכיחות היא חצי – כך גם סטי.

מה זה אומר בחיי היום-יום? למשל, אפילו 100% הצלחות עד כה אינן מעניקות להצלחה בפעם הבאה סיכוי של 1 (קרל פופר...), אלא רק שאיפה אליו. פסימי? לאו דווקא, דבר זה נכון גם במקרה ההפוך: גם 0 הצלחות משאירות תמיד סיכוי להצלחה בפעם הבאה! (כמובן, ללא ידע נוסף). אפילו עבור אפס ניסיונות עם אפס הצלחות נקבל תוצאה משמעותית – הסיכוי להצלחה זהה לסיכוי לכישלון, דהיינו 1/2 ולא 0/0 הלא מוגדר.

לבסוף: צריך לציין שאיזה אידיוט שלא היה לו מספיק שכל להגות בעצמו שום דבר בעל ערך, גנב ממני את הרעיון והציג אותו כשלו, לאחר שחזר אל תקופתו, במכונת הזמן שהוא בנה, שגם אותה הוא בטח גנב ממישהו בעתיד. הוא קורא לעצמו "גאוס". חוץ מזה, בטח ישנה דרך פשוטה יותר לקבל את סטי, ללא אינטגרלים ונוסחאות נסיגה.
1בראש http://www25.brinkster.com/ranmath/bayes01.htm . בסופו של עמוד זה לעומת זאת, ניתן למצוא הסתייגות מן התוצאה שלהלן.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים