בתשובה לאפופידס, 08/10/11 14:59
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 584069
השאלות שאתה שואל נוגעות לתשתית הלוגית/פילוסופית של תורת ההסתברות, שאני לא בקיא בה במיוחד. אנסה להגג קצת בכל זאת.

לגבי ההבדל בין "לא ידוע" ל"מוגרל" - אתה מן הסתם לא יודע מה אכלתי היום לארוחת הבוקר, אבל תסכים אתי שזה יהיה קצת מאולץ לחשוב על הגרלה בהקשר הזה. מהמלה "מוגרל" משתמע שקיימת איזושהי התפלגות ממנה מגרילים, ואולי הטענה המרכזית כנגד הגישה הבייסיאנית היא שכל ניסיון לנקוב במפורש בהתפלגות שכזו הוא בעייתי. למשל, אם מנסים לבחון האם מטבע נתונה, אמיתית לגמרי, היא הוגנת או לא, זה יהיה קצת מוזר להניח אפריורי (כלומר לפני שהטלנו אותה) התפלגות אחידה בין 0 ל-‏1 להסתברות שהיא מראה "עץ" (הרי ברור שההסתברות הזו היא באיזור 1/2); מצד שני, כל ניסיון לנקוב בהתפלגות אחרת יהיה שרירותי במידה רבה (זה מתקשר להבדל שבין informative prior לבין non-informative prior). כשהפרמטר שמנסים לאמוד לא מוגבל לתחום חסום שקצוותיו ידועים המצב יותר גרוע, כי קשה עוד יותר לחשוב על התפלגות אפריורית הגיונית: ההסתברות ל"עץ" בדוגמא הקודמת היתה בהכרח בין 0 ל-‏1, אבל כשמנסים לאמוד, למשל, דברים שקשורים לעוצמות של רעידות אדמה (שכידוע, אינן חסומות מלמעלה), אנחנו בבעיה. קיימת גישה סטטיסטית בשם Empirical Bayes שמנסה להתגבר על הבעיה הזו דרך שימוש בנתונים עצמם כדי להרכיב התפלגות אפריורית (נשמע אוקסימורון, נכון?), אבל אני לא מבין מספיק כדי לספר עליה עוד.

בנוגע לדוגמת החוצנים: אף סטטיסטיקאי - שכיחותן, בייסיאני, או מה שזה לא יהיה - לא ינסה להסיק או לחזות ממדגם של נתון אחד בלבד, ולכן אני מוחה בתוקף כנגד ההשמצה הפרועה "בהיותך שכיחותן, אתה מעריך שהסיכוי להבזק סגול גם מחר הוא 1". בכלל, יש תופעות שלא צריך להחיל עליהן אנליזה הסתברותית/סטטיסטית כי הן לא שייכות לתחום השיפוט של הדיסציפלינות האלה (זה מתקשר יפה להבדל בין העידן השני לשלישי בהיסטוריה של המחשבה האנושית אליבא דאפרון, כפי שציטטתי אותו בתגובה 583799). גם את האנליזה של לפלס על ההסתברות שהשמש תזרח מחר אף אחד לא לוקח היום ברצינות, וזה לא בגלל שהיום יודעים שהעולם קיים יותר מ-‏6000 שנה.

ולגבי השאלה האחרונה שלך, "היכן תהיה השגיאה הממוצעת נמוכה יותר - בהערכות הבייסיאניות או באלו השכיחותניות?", התשובה כמובן תלויה בהנחות המודל שלך על העולם. אם הן בייסיאניות, ואתה צודק בהתפלגויות האפריוריות שאתה מניח, אז כמובן שההערכות הבייסיאניות יהיו יותר מדויקות, ולהיפך. זו אולי נראית תשובה מתחמקת, אבל אם אתה מתכוון לערוך ניסוי אמיתי על כל מיני תופעות בחיים סביבנו, אז התוצאה שלו תהיה מאד תלויה בבחירה של התופעות שתחקור. בשאלות כמו "האם עצמים נופלים למעלה או למטה" הגישה הבייסיאנית תפסיד בנוק-אאוט, בשאלות כמו "האם גברים בממוצע גבוהים יותר מנשים" היא תפסיד בנקודות, ועל שאלות כמו "האם תרופה א' עובדת טוב יותר מתרופה ב"' ימשיכו הביוסטטיסטיקאים להתווכח. העניין שוב מתקשר לגבולות השיפוט של השיטה ההסתברותית/סטטיסטית.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 584242
הועלו כאן כמה עניינים הדורשים ממני חשיבה מחודשת. אחשוב ואשוב.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 585497
מדגם של נתון אחד בלבד עשוי להיות בעל משמעות רבה מאוד. למשל, פגשת אדם חדש. באינטרקציה הראשונה בינכם הוא פישל (פשלות הן עניין סטטיסטי) האם אמונך בו ישתנה לאחר המדגם היחיד?
בתיאוריה סטטיסטית, המצב מובהק (הא!) עוד יותר. מדגם של ניסוי אחד אינו שונה מהותית מכל מדגם אחר.
ספציפית, נניח שההבזק הסגול הופיע ברצף 10 פעמים. האם מוצדק להסיק שהסיכוי לו הוא 1?
השיטה הבייסיאנית מובילה לעיתים לתוצאות שנראות מוטעות, או נחותות, כמו למשל, שהשמש לא תזרח מחר. זכור, כי מבחינה פיזיקלית, יגיע יום כזה. אם הבייסיאנים היו יכולים לשרוד עד אז, הם היו צוחקים אחרונים.

לגבי השגיאה הממוצעת - בהנתן בדיקה של תופעות ש*באמת* אין עליהן מידע מוקדם, השיטה הבייסיאנית תנצח בנוק אאוט מרהיב. השכיחתן שהגיע בלילה ימדוד כל דקה וימהר להכריז שתמיד יהיה חושך, וזה שיגיע בחורף יחליט שתמיד קר.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים