בתשובה לרון פרסלר, 24/09/11 16:33
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 582682
קראתי עכשיו ברפרוף חלקים מהמאמר של יונידיס. מעניין מאד, וגם עצוב מאד. תודה על הלינק.

אני נזהר שלא להיכנס לענייני הסקה בייסיאנית כאן (ידעת על התהום שפעורה בין סטטיסטיקאים "רגילים" לסטטיסטיקאים בייסיאניים?), אז בוא נעזוב את חישוב ההסתברות של נכונות השערת האפס :-)

ולגבי עשרים המאכלים והסרטן - אני מסכים אתך לחלוטין שאם המחקרים ייעשו על-ידי עשרים חוקרים בלתי-תלויים שלא מודעים אחד לעבודת האחר, אז באמת נקבל (בממוצע) שאחד מהמאכלים יימצא כמסרטן באופן מובהק. מה שעצוב יותר זה שכפי הנראה רק המאמר (השגוי) הזה יתפרסם, וזה בדיוק אפקט המגרה שהזכרתי במאמר. מצד שני, אם חוקר יחיד יבדוק את עשרים המאכלים, והוא חוקר אחראי, אז הוא ישתמש באחת מהשיטות הקיימות להקטנת ההסתברות לגילוי שגוי (בד"כ תיקון בונפרוני או False discovery rate [Wikipedia]).
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 582722
הנה הבדיקה האמפירית שיונידיס עשה על מחקרים "יוקרתיים" (הוא ספר כמה מחקרים שכאלו הופרכו או התגלו כמופרזים): http://jama.ama-assn.org/content/294/2/218.full.pdf+...

לא ידעתי על התהום הפעורה, אבל אשמח לדעת. שוב, למדתי מתמטיקה, לא סטטיסטיקה, ושם מתמקדים בעיקר בהסתברויות רציפות ולא דיסקרטיות, וגם זה היה כבר לפני לא מעט שנים. בכל אופן אשמח לדעת איך סטטיסטיקאים "רגילים" אומדים נכונות השערה. כלומר איך עוברים מ- (P(D|H0 ל- (P(H0|D ללא בייז. מכיוון שלסטטיסטיקה יש כל-כך הרבה השפעה על מה שאנחנו חושבים שאנחנו יודעים כיום, חשוב לי להבין.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583799
מתנצל על העיכוב בתגובה.

סטטיסטיקאים "רגילים"‏1 בכלל לא מנסים לאמוד הסתברויות כמו (P(H0|D כי עבורם הנכונות של השערת האפס היא לא מאורע שמשייכים לו הסתברות. ניסיתי לכתוב משהו על ההבדלים שבבסיס בין שתי ההשקפות, אבל לא יצא לי משהו מוצלח, אולי בגלל שאני לא מתעסק באופן קבוע בסטטיסטיקה בייסיאנית. אני כן יכול להגיד שהרוב המוחלט (להערכתי הרבה מעל 90%) של הניתוחים הסטטיסטיים שנעשים כיום בפועל - כלומר במסגרת יישום של סטטיסטיקה ברפואה, הנדסה, כלכלה וכו' - הם לא בייסיאניים, אבל דומני שהחלק הבייסיאני הולך וגדל. לגבי ה"תהום" - קולגה שלי סיפר לי לא מזמן איך פעם בכנס, חוקר חשוב התחיל את ההרצאה שלו במילים "I have converted to Bayesianism", והפך לשיחת היום.

בשיטוטיי ברשת לצורך כתיבת התגובה הזו נתקלתי בשני קישורים מוצלחים. הראשון הוא פוסט בבלוג של פרופסור ב-NYU, שמדגים איך שאלה מאד פשוטה‏2 מקבלת שתי תשובות הפוכות כשמנתחים אותה בכלים סטטיסטיים "רגילים" ובבייסיאניים. השני הוא המאמר Modern Science and the Bayesian-Frequentist Controversy של בראד אפרון מסטנפורד, שסוקר ממעוף ציפור מגביהת-טוס, ובשפה יפהפיה, את המקום של הסטטסיטיקה במדע. למרות הכותרת, אין במאמר הרבה תוכן "קשה" על ההבדלים שבין שתי הגישות, אבל הייתי ממליץ לכל מי שמתעניין בסטטיסטיקה לקרוא אותו (זה מאמר קצר ומאד נגיש). ציטוט יפה:

Using Bayes rule doesn’t make one a Bayesian. Always using Bayes rule does.

ועוד ציטוט שאהבתי מתוכו, שלא קשור למחלוקת הנ"ל:

A cartoon history of western thought might recognize three eras: an unpredictable pre-scientific world ruled by willful gods and magic; the precise clockwork universe of Newton and Laplace; and the modern scientific perspective of an understandable world, but one where predictability is tempered by a heavy dose of randomness. Deterministic Newtonian science is majestic, and the basis of modern science too, but a few hundred years of it pretty much exhausted nature’s storehouse of precisely predictable events. Subjects like biology, medicine, and economics require a more flexible scientific world view, the kind we statisticians are trained to understand.

1. באנגלית קוראים להם frequentists, כדי להבדיל אותם מהבייסיאניים, אבל "תדירותניים" מצלצל לי לא משהו.
2. מטילים מטבע לא בהכרח הוגנת 14 פעמים, והיא נוחתת על "עץ" 10 פעמים. האם ההסתברות שבשתי ההטלות הבאות היא תנחת על "עץ" גבוהה מחצי או קטנה?
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583811
1 שכיחותנים?
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583812
ואללה, יותר טוב.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583816
2 לא התרשמתי. התשובות הבייסיאנית והשכיחותניות קרובות מאד, ורק הפרמטרים נבחרו כך שיצא מעל ומתחת לחצי. הבדל משמעותי הרבה יותר הוא כאשר יצא רק "עץ", אבל אז ברור שהתשובה השכיחותנית (ליתר דיוק, ניראות מירבית) היא שגויה.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583817
לא התכוונתי שתתרשם מהבדל דרמטי בתוצאות, כי באמת אין. זה סתם קישור נחמד שמדגים יפה, ובלי הרבה מתמטיקה, את שתי הגישות.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583818
סוף סוף נמצא לי מחנה (:
כאשר צריך להעריך הסתברות על סמך m הצלחות מתוך n ניסיונות ואיני יודע מהי ההתפלגות אפריורי, אני משתמש ב:
p=(m+1)/(n+2)
שזה מה שמקבלים אם ממצעים על כל ההתפלגויות אפריורי האפשריות (=התפלגות אחידה) ומבצעים חישוב הדומה לזה שבקישור הראשון שלך.

יתרון אחד של הערכה זו לעומת זו השכיחותנית (p=m/n) הוא טיפולה האחיד בכל המקרים, כולל מקרי קצה, במיוחד כאשר מדובר במדגמים מזעריים.
יתרונה השני של הערכה בייסיאנית זו הוא (כאמור לעיל) שהיא נכונה. כלומר: אם נגריל סיכוי בין אחד לאפס ונטיל מטבע שנותן "עץ" עפ"י סיכוי זה, וננסה לנחש את הסיכוי עפ"י מספר ה"עצים", ההערכה הבייסיאנית תהיה מדוייקת יותר.
הנה קוד שבודק ומאשר זאת. ההפרשים אינם מרשימים - 6% במקרה זה, אבל הם מראים בבירור שההערכה השכיחותנית רחוקה יותר מן הסיכוי האמיתי מאשר זו הבייסיאנית.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583820
המשפט "אם נגריל סיכוי בין אחד לאפס ונטיל מטבע שנותן..." הוא בדיוק ההנחה הבייסיאנית הבסיסית. ברור שתחת ההנחה הזו, האנליזה הבייסיאנית היא הנכונה, וכך גם החיזויים שלה. השכיחותניים, מצד שני, לא מניחים שהסיכוי הנ"ל הוא משהו שמוגרל, אלא שהוא סתם קבוע לא ידוע.

אפופידס - אתה ואני כבר דיברנו פעם בדיוק על הבעיה הזו, וכבר אז אמרתי לך שאתה בחברה מצוינת, זו של לפלאס, שניסה לענות בדיוק בדרך הזו על השאלה "מהי ההסתברות שהשמש תזרח מחר בבוקר?" (ראו את Sunrise problem [Wikipedia]).
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583823
אכן דיברנו, אבל רק עכשיו התברר לי שאני מקבל עמלה שמנה על כל מומר חדש (:

תוכל להסביר לי מה ההבדל בין "לא ידוע" לבין "מוגרל"? הרי בפועל, כל עוד לא מערבים קוואנטים, תמיד מדובר על "לא ידוע" - כבדוגמת זריחת השמש.

אוסיף דוגמא נוספת: במסגרת מפגש ראשון עם תרבות חוצנית, אתה נשלח להתארח בפלנטה נביולון 8. בלילה הראשון שם, נודדת שנתך ובשעה 26:34 (היממה שם ארוכה יותר) אתה ניגש לחלון ומבחין בהבזק סגול חזק המציף את השמיים לכמה שניות ונעלם. אתה מגרד את פדחתך ולא מוצא לתופעה כל הסבר או מקור אפשרי שאתה יודע עליו וזה גם לא דומה למשהו הזכור לך. מאחר שכך, אתה אומר לעצמך "לפחות סטטיסטיקה אני יודע, אז אחשב מה הסיכוי להבזק דומה גם מחר". בהיותך שכיחותן, אתה מעריך שהסיכוי להבזק סגול גם מחר הוא 1. אבל אז מתעורר הבייסיאני המפוקח שבך ומעריך, עפ"י הנוסחא שבתגובתי הקודמת (תוצאת החישוב הזה) שהסיכוי להופעת ההבזק גם מחר הוא רק 2/3.

בשבוע בו אתה מבלה שם אתה ממשיך לחשב בשני אופנים את הסיכויי להישנות כל תופעה שאינה קשורה לשום דבר שאתה מכיר בה אתה נתקל (לעיתים יותר מפעם אחת), לטובת הארצן שיחליף אותך. בסופו של דבר מגיעים שניים לשהות של כמה שנים. לאחר שהם חוזרים לכד"א אתם נפגשים ואתה בודק את תיעודיהם הנוגעים לאירועים אותם תיעדת ומשווה את שכיחותם להערכות שנתתה. היכן תהיה השגיאה הממוצעת נמוכה יותר - בהערכות הבייסיאניות או באלו השכיחותניות?
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583825
מוגרל != מוגרל מהתפלגות אחידה.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583836
כמובן. טענתי היא שבהינתן שלא ידוע מהי ההתפלגות, ממצעים על כל ההתפלגויות האפשריות ומקבלים...התפלגות אחידה.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583845
מטבע יכול לפול גם על הצד הצר. למה אתה לא ממצע על כל ההתפלגויות על שלוש אפשרויות?
למה לקחת רק את האפשרויות "יהיה הבזק סגול" ו"לא יהיה הבזק סגול", והתעלמת מ"יהיה הבזק ירוק", ו"יהיה ריח של כרוב כבוש"?
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583879
אבל מה התפלגות ההתפלגויות ?
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 584069
השאלות שאתה שואל נוגעות לתשתית הלוגית/פילוסופית של תורת ההסתברות, שאני לא בקיא בה במיוחד. אנסה להגג קצת בכל זאת.

לגבי ההבדל בין "לא ידוע" ל"מוגרל" - אתה מן הסתם לא יודע מה אכלתי היום לארוחת הבוקר, אבל תסכים אתי שזה יהיה קצת מאולץ לחשוב על הגרלה בהקשר הזה. מהמלה "מוגרל" משתמע שקיימת איזושהי התפלגות ממנה מגרילים, ואולי הטענה המרכזית כנגד הגישה הבייסיאנית היא שכל ניסיון לנקוב במפורש בהתפלגות שכזו הוא בעייתי. למשל, אם מנסים לבחון האם מטבע נתונה, אמיתית לגמרי, היא הוגנת או לא, זה יהיה קצת מוזר להניח אפריורי (כלומר לפני שהטלנו אותה) התפלגות אחידה בין 0 ל-‏1 להסתברות שהיא מראה "עץ" (הרי ברור שההסתברות הזו היא באיזור 1/2); מצד שני, כל ניסיון לנקוב בהתפלגות אחרת יהיה שרירותי במידה רבה (זה מתקשר להבדל שבין informative prior לבין non-informative prior). כשהפרמטר שמנסים לאמוד לא מוגבל לתחום חסום שקצוותיו ידועים המצב יותר גרוע, כי קשה עוד יותר לחשוב על התפלגות אפריורית הגיונית: ההסתברות ל"עץ" בדוגמא הקודמת היתה בהכרח בין 0 ל-‏1, אבל כשמנסים לאמוד, למשל, דברים שקשורים לעוצמות של רעידות אדמה (שכידוע, אינן חסומות מלמעלה), אנחנו בבעיה. קיימת גישה סטטיסטית בשם Empirical Bayes שמנסה להתגבר על הבעיה הזו דרך שימוש בנתונים עצמם כדי להרכיב התפלגות אפריורית (נשמע אוקסימורון, נכון?), אבל אני לא מבין מספיק כדי לספר עליה עוד.

בנוגע לדוגמת החוצנים: אף סטטיסטיקאי - שכיחותן, בייסיאני, או מה שזה לא יהיה - לא ינסה להסיק או לחזות ממדגם של נתון אחד בלבד, ולכן אני מוחה בתוקף כנגד ההשמצה הפרועה "בהיותך שכיחותן, אתה מעריך שהסיכוי להבזק סגול גם מחר הוא 1". בכלל, יש תופעות שלא צריך להחיל עליהן אנליזה הסתברותית/סטטיסטית כי הן לא שייכות לתחום השיפוט של הדיסציפלינות האלה (זה מתקשר יפה להבדל בין העידן השני לשלישי בהיסטוריה של המחשבה האנושית אליבא דאפרון, כפי שציטטתי אותו בתגובה 583799). גם את האנליזה של לפלס על ההסתברות שהשמש תזרח מחר אף אחד לא לוקח היום ברצינות, וזה לא בגלל שהיום יודעים שהעולם קיים יותר מ-‏6000 שנה.

ולגבי השאלה האחרונה שלך, "היכן תהיה השגיאה הממוצעת נמוכה יותר - בהערכות הבייסיאניות או באלו השכיחותניות?", התשובה כמובן תלויה בהנחות המודל שלך על העולם. אם הן בייסיאניות, ואתה צודק בהתפלגויות האפריוריות שאתה מניח, אז כמובן שההערכות הבייסיאניות יהיו יותר מדויקות, ולהיפך. זו אולי נראית תשובה מתחמקת, אבל אם אתה מתכוון לערוך ניסוי אמיתי על כל מיני תופעות בחיים סביבנו, אז התוצאה שלו תהיה מאד תלויה בבחירה של התופעות שתחקור. בשאלות כמו "האם עצמים נופלים למעלה או למטה" הגישה הבייסיאנית תפסיד בנוק-אאוט, בשאלות כמו "האם גברים בממוצע גבוהים יותר מנשים" היא תפסיד בנקודות, ועל שאלות כמו "האם תרופה א' עובדת טוב יותר מתרופה ב"' ימשיכו הביוסטטיסטיקאים להתווכח. העניין שוב מתקשר לגבולות השיפוט של השיטה ההסתברותית/סטטיסטית.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 584242
הועלו כאן כמה עניינים הדורשים ממני חשיבה מחודשת. אחשוב ואשוב.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 585497
מדגם של נתון אחד בלבד עשוי להיות בעל משמעות רבה מאוד. למשל, פגשת אדם חדש. באינטרקציה הראשונה בינכם הוא פישל (פשלות הן עניין סטטיסטי) האם אמונך בו ישתנה לאחר המדגם היחיד?
בתיאוריה סטטיסטית, המצב מובהק (הא!) עוד יותר. מדגם של ניסוי אחד אינו שונה מהותית מכל מדגם אחר.
ספציפית, נניח שההבזק הסגול הופיע ברצף 10 פעמים. האם מוצדק להסיק שהסיכוי לו הוא 1?
השיטה הבייסיאנית מובילה לעיתים לתוצאות שנראות מוטעות, או נחותות, כמו למשל, שהשמש לא תזרח מחר. זכור, כי מבחינה פיזיקלית, יגיע יום כזה. אם הבייסיאנים היו יכולים לשרוד עד אז, הם היו צוחקים אחרונים.

לגבי השגיאה הממוצעת - בהנתן בדיקה של תופעות ש*באמת* אין עליהן מידע מוקדם, השיטה הבייסיאנית תנצח בנוק אאוט מרהיב. השכיחתן שהגיע בלילה ימדוד כל דקה וימהר להכריז שתמיד יהיה חושך, וזה שיגיע בחורף יחליט שתמיד קר.
מחקר (לא) חדש על מחקרים חדשים שמגלים כי... מגלה כי... 583841
מצחיק שעושים ניסויים אמפיריים כדי להוכיח התפלגות סטטיסטית, מצחיק עוד יותר שזה עובד, SPOOKY...

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים