בתשובה לתשע נשמות, 16/02/15 22:06
ומה עם יתר ההמלצות? 651050
מהניסיון המקצועי שלי, יש טווח מאד רחב של איכות סטטיסטית במחקרים רפואיים/ביולוגיים. לפעמים היא מחפירה ולפעמים היא מצוינת, ושיתוף של סטטיסטיקאי או מתמטיקאי בצוות החוקרים לא בהכרח מוביל לאפשרות השניה.

בדיוק אתמול בערב הגשתי ביקורת עמיתים (סיבוב שני) למאמר מהסוג הזה. בגירסה הראשונה של המאמר נפלה טעות הסתברותית גסה ביותר‏1, מהסוג שאני מזהיר מפניה בפני תלמידי שנה א', שגרמה לכך שכמעט כל התוצאות המתמטיות שלו היו שגויות, וששרת האינטרט הייעודי שהמחברים הקימו עבורו, מן הסתם במאמץ ובממון רב, נתן פלטים שגויים לחלוטין. שניים מבין ארבעת מחברי המאמר באים ממחלקה מכובדת לסטטיסטיקה בארה"ב (השניים האחרים רופאים), ואחד משני הסטטיסטיקאים הוא חבר סגל בכיר שם (ניחוש שלי: הפאשלה היתה של השני, שהוא תלמיד מסטר או דוקטורט שזוכה להנחיה גרועה).

בנוגע למשפט האחרון שלך: הוא לא לגמרי מדויק, אבל הרוח שלו נכונה. כצפוי, דיברנו כבר על העניין.
______________
1. התוחלת של X בריבוע זה לא אותו דבר כמו ריבוע התוחלת של X.
ומה עם יתר ההמלצות? 651051
תודה על ההסברים שלך בקישור, יש לי שאלה על משהו שעוד לא הבנתי, אם ניקח לדוגמה את המחקר ששכ"ג קישר, כתוב שם:
In women, higher rates were observed for death from all causes (adjusted hazard ratio 1.15, 95% confidence interval 1.13 to 1.17, for each glass of milk),
אולי אתה יכול להסביר מה אומר הטווח 1.13 עד 1.17, ואיך מחשבים אותו?
איזה כיף! 651063
את יודעת כמה זמן אני מחכה לראות את יובל כותב שוב "רווח סמך"? אני מחכך את כפות ידי בהנאה, ממש כאילו אני או'סאליבן לפני השחור האחרון שמשלים מכסימום.
איזה כיף! 651065
(אני מגרד בראשי בנסיון להבין למה לשחורים קשה להשלים מקסימום, ומגחך לאור הפוטנציאל האי-פוליטיקלי קורקט של זה).
איזה כיף! 651066
(שלא להזכיר בדיחה ידועה על מקסימומים ומינימומים)
איזה כיף! 651070
בדיוק קראתי בספר ("מעולם ועד עתה", שון קרול, ותודה לע.ו.) את הצרוף "שחורים שחורים" (ה "ש" הראשון הוא "ש" השימוש), וחשבתי על המשפט האפשרי "לאחרונה גילו אסטרופיזיקאים שחורים שחורים שחורים ..." אבל כמה אסטרופיזיקאים שחורים כבר יש?

סלח לי, ניל.
איזה כיף! 651073
אתה ממליץ?
איזה כיף! 651076
אני רק באמצע כך שאשמור את השיפוט לסוף. בינתיים אני די נהנה, כן (אח, אח, האנטרופיה המשונה הזאת!).
איזה כיף! 651097
אתה בחור רציני. משום מה האסוציאציה הראשונה שעלתה לי לגבי התגובה שלך, זה שהיא עונה לא רע גם על השאלה 'האם הנך ממליץ על החיים האלה', לפחות לטעמי‏1.

1עד כדי הסוגריים‏2.
2 אולי גם איתם? הממ.
איזה כיף! 651100
רבים טוענים שבמשפט הראשון שלך יש ''ר'' אחת מיותרת.
איזה כיף! 651101
כל עוד אלה שרבים וטוענים לא דורכים ויורים, דיינו.
איזה כיף! 651118
אתה טוען שאתה לא בחור‏1 רציני? למה? נראה לי שזה אחד החורים הרציניים ביותר בסביבה (חורים שחורים הם תמיד רציניים, חורים לא רציניים מתלבשים בצבעים עליזים‏2).

---------------------
1. מעניין כמה שנים עברו מאז כינו אותך "בחור" בפעם האחרונה.
2. האם יש קשר בין המונח "צבעים עליזים" לצבעי הקשת של דגל הגאווה?
איזה כיף! 651134
תודה לשניכם על ההסבר הבהיר והממצה (וגם ליובל). מזל שיש אינטרנט. מה שלא היה ברור לי הוא אם הטווח תלוי גם בשיפוט סובייקטיבי של החוקרים. לפי מה שהבנתי, לא.
איזה כיף! 651172
כך מרימים מנופים לבנים לבנים לבנים חסונים, בוני בניינים.
איזה כיף! 651192
או כמו המדורים השונים שהיו בחנות לבגדים תחתונים בדרום אפריקה של תקופת האפרטהייד:
- לבנים לבנים לבנים לבנים
- לבנים לבנים לבנים שחורים
- לבנים לבנים לבנות לבנות
- לבנים לבנים לבנות שחורות
- לבנים צבעוניים לבנים לבנים
- לבנים צבעוניים לבנים שחורים
- לבנים צבעוניים לבנות לבנות
- לבנים צבעוניים לבנות לבנות
אפליה צבעית! 651196
מה פשעו הבנות השחורות שמנעת מהן ללבוש לבנים צבעוניים?

______
כן, ברור שזה טייפו, אבל זה היה מתבקש.
איזה כיף! 651207
בדרום אפריקה של האפרטהייד היה גם מעמד נפרד ל''צבעוניים'' שהיו לא לבנים ולא שחורים (בעיקר הודים).
איזה כיף! 651208
אז להוסיף על אותו עיקרון גם "לבנים צבעוניים לבנות צבעוניות"?
איזה כיף! 651335
נו, אפשר כבר לקבל הסבר לסוף המשפט האחרון שלך? אני במתח כבר שבוע.
איזה כיף! 651337
חגיגה בסנוקר?
איזה כיף! 651339
ואללה, עכשיו הבנתי.
איזה כיף! 651340
אני לא.
איזה כיף! 651341
אל תצפה לגדולות ונצורות http://en.wikipedia.org/wiki/Ronnie_O%27Sullivan
איזה כיף! 651342
יש גם בעברית‏1

1 רוני אוסליבן [ויקיפדיה]2
2 וערך ארוך ושלם יותר מהערך על לואי ה-‏13‏3, כריסטיאן התשיעי‏4 וטום צ'יימברס‏5 ביחד.
3 לואי השלושה עשר, מלך צרפת [ויקיפדיה]
4 כריסטיאן התשיעי, מלך דנמרק [ויקיפדיה]
5 טום צ'יימברס [ויקיפדיה]
איזה כיף! 651354
שמע, עם כל הכבוד לצ'יימברס שהצליח פעם אחת בקריירה להגיע לחמישיה השניה של ה-NBA, שחקן שהגיע חמש פעמים למקום הראשון בעולם ראוי קצת יותר לערך על שמו (בדוק בכמה שפות יש בכלל ערך על צ'יימברס - גם בעברית לא היה לולא העונה הקטסטרופלית שלו במכבי). זה לא ד"ר J, נניח, שכאן המקום לציין שהשבוע הוא חגג 65 שנה (וגם שלפני שבע שנים זכיתי לראות אותו מטווח אפס כאן בירושלים!).
איזה כיף! 651359
"להגיע למקום הראשן בעולם" בספורט פאבים זניח. נראה לי שמספר הצופים (כולל טלוויזיה) במשחק אליפות נמוך ממספר קוני הכרטיסים במשחק ממוצע של הפיניקס. אבל, לצורך העניין, תחליף את צ'יימברס בריקי מקקאו‏1, בויראט קוהלי‏23 שניהם קפטנים של נבחרות לאומיות בספורט הלאומי של מדינתם, בפיל טיילור‏4, אלוף עולם 14 פעמים(!) בספורט פאבים מגוחך לא פחות, או בדייויד בריאנט‏5, עם שלוש אליפויות בשתי "מקצועות" שונים (מעניין שאפילו בויקיפדיה האנגלית אין ערך על בארי ריגבי, שמחזיק שתי אליפויות עולם בבליסת פאי).

3 ואני ממש לא מתחייב על האיות.
איזה כיף! 651361
ספורט פאבים זניח? פחות צופים מבמשחק של הפיניקס? ה-BBC קנה את זכויות השידור של הספורט הזניח הזה בבריטניה ומשדר למעלה מ-‏260 שעות שלו בשנה, כאשר הזכיה של או'סאליבן משכה קהל ממוצע של 2.1 מיליון צופים בבריטניה (ולטענת ראשי הספורט, סך כולל של 28.5 מיליון צופים). נראה לי שזה קצת יותר ממשחק של פיניקס, אפילו בתקופתו של סטיב נאש. אף אחד מהדברים שהזכרת לא מתקרב אפילו לפופולריות של הסנוקר - להוציא הקריקט בהודו, שאכן עשוי לגמד מבחינת מספר המתעניינים בו כמה וכמה מסוגי הספורט המובילים בעולם. הבעיה של הקריקט היא שאף אחד מחוץ להודו (ואולי מדינות סמוכות) לא מתעניין בו. בישראל מתעניינים יותר באו'סאליבן.

בשנת 2000 ה-BBC נהג לקיים באתר שלו מדי שבוע משאל על "עשרת הגדולים של המאה בתחום...". הזדמנתי לשם כשהמשאל עסק בתחום הספורט. מי הייתם מצפים שיהיו בין עשרת המובילים באותו זמן? פלה? קרל לואיס? מארק ספיץ? ג'סי אוונס? מייקל ג'ורדן? ג'ים תורפ? אני לא זוכר מי מאלה כן הצליח להשתחל, אבל בין עשרת הגדולים במשאל שבעה היו שחקני קריקט הודים - מה שמלמד כנראה על הדמוגרפיה של גולשי אתר ה-BBC יותר מאשר על הספורט העולמי.
איזה כיף! 651362
2.1 זה מספר הצופים הממוצע במקבילית המוחות או שירי הודיה לאל‏1 - באותו ערוץ, ספרינגווצ', סידרה על האביב (בחיי) קיבלה כמעט שלוש מליון צופים‏1. למשחקי רוגבי‏2 וקריקט‏3 יש הרבה יותר צופים בעולם בכלל (ובבריטניה בפרט).

1 מקור.
2 מספר 7 ו-‏8 בארועים הכי נצפים בעולם בטלויזיה (http://en.wikipedia.org/wiki/List_of_most_watched_te...)
3 מספר 10 ברשימה מלמעלה. ממש לא רק בהודו ופקיסטאן, גם בבריטניה ובאוסטרליה.
איזה כיף! 651367
קריקט הוא הספורט השני הכי פופולרי בעולם, אחרי כדורגל. והנה בימים אלה מתקיימת באוסטרליה וניו זילנד אליפות גביע העולם בקריקט, למי שמתעניין ב"גוּגלִי" או "דוּסרה".
איזה כיף! 651376
השתכנעתי, יש מקום בויקיפדיה העברית גם לערכים על שחקני הרוגבי והקריקט הגדולים בעבר ובהווה. מעל במה זו אני מפנה קריאה נרגשת להמוני חובבי הרוגבי והקריקט דוברי העברית: מהרו ומלאו את החסר!

הרוגבי והקריקט, כמו הבייסבול, הם משחקים פופולריים מאד בחלק מהמדינות שבהן שלטה מעצמה מסוימת - ובעלי נוכחות קרובה לאפס בשאר העולם. ויקיפדיה בשפות השונות משקפת את העובדה הזו. לגבי או'סאליבן, הוא שחקן שבמשך שנים רבות היה השחקן הבולט או אחד משניים-שלושה הבולטים בספורט יחידים מסוים - כמו, למשל, רפאל נדאל, מיכאל שומאכר, פלויד מייוות'ר או טייגר וודס. בעיני, זה עושה אותו ראוי בהחלט לערך על שמו - הרבה יותר מאשר צ'יימברס, שהיום רק חולי היסטוריה של ה-NBA ואוהדים ותיקים מאד של הקבוצות שבהן הוא שיחק זוכרים שהוא היה שם אי פעם.
איזה כיף! 651378
מה עם פיל טיילור (גם על הפלויד הזה לא כתוב יותר מידי בוויקיפדיה)? אגב בייסבול, גם על בייב רות יש ערך כמעט מעליב בויקיפדיה העברית, אמנם יותר ממרק מקגייור ווילי מייז, אבל עדיין, מעליב יחסית לאוסליבן. זה לא שאני רוצה לקרוא ערכים על שחקני רוגבי, קריקט, דוקים, בייסבול או פוטבול, פשוט האורך והעומק של הערך על שחקן בספורט חסר חשיבות הפתיעה אותי. לא נראה לי שיש חובב ספורט בישראל שלא יודע מי היה צ'יימבז, לא נראה לי שיש בישראל חובב היסטוריה (או ספרות) שלא יודע מי היה לואי ה-‏13...
איזה כיף! 651382
אני סבור שסנוקר הוא פחות אזוטרי מדארטס; אני מכיר כמה וכמה ישראלים שעוקבים בענין אחרי או'סאליבן ומעלליו, ולא מכיר כאלה שעוקבים אחרי טיילור. ואל תדאג, אחרי הקרב מול פקיאו יהיה קצת יותר גם על מייוות'ר. מה שיפה בויקיפדיה הוא שבניגוד לאנציקלופדיה מסורתית, היא מאפשרת להביא לידי בטוי גם את מדת הענין של אנשים בנושא ולא רק את מדת החשיבות שלו בעיני עורך כלשהו. בייב רות' הוא דמות חשובה יותר בהיסטוריה של הספורט העולמי, אבל אין לו בארץ מעריצים שיטרחו להקדיש לו את הזמן ולכתוב ערך מושקע - לאו'סאליבן יש. לכך כיוונתי גם ביחס לקריקטאים ושחקני הרוגבי: אין להם ערכים בעברית כשם שאין לשחקני בוליווד ערכים - כי יש להם המון מעריצים, אבל רק במדינות מסוימות.

חשבתי להעיר שצ'יימברס אולי מוכר, אבל כדי שיהיה ערך רציני אתה צריך בדרך כלל שיהיה מישהו שלא רק יכיר אותך אלא גם יעריץ אותך - וצ'יימברס לא השאיר אחריו מעריץ אחד בישראל (אלא אולי מבין אוהדי הפועל). אבל מסתבר שלא די בכך; גם שחקנים שזכו להערצה מוצדקת לא זכו לערכים משמעותיים יותר - כך לגבי מגי וג'ונסון וגם ארל וויליאמס. למעשה, שלושת אלה זכו לערכים שאינם שונים בהרבה מזה שזכה לו קונסטנטין פופה. הייתי מצפה ממכבי שתשלם כמה פרוטות לשעה למישהו ממועדון האוהדים כדי שידאג לבנות עליהם ערכים מושקעים יותר, אבל היא לא עשתה זאת - אז לצ'יימברס אין מה להרגיש רע. באותה הזדמנות הסתבר לי שוויליאמס הוא היום מורה לחנוך מיוחד(!) וגם, למרבה הצער, שמגי נהרג בתאונת דרכים לפני 12 שנה - לא ידעתי זאת. עצוב.
איזה כיף! 651383
ועל כך - על זה שהוא נחשב בישראל לספורט פחות אזוטרי מבאולינג, דארטס או בליסת עוגות; על זה שיש ישראלים שעוקבים אחריו עד כדי לרצות לכתוב עליו ערך שלם בויקיפדיה - הפליאה.
איזה כיף! 651408
את זה אפשר לומר על סוגי ספורט רבים - יש שיאמרו על כולם. אני סבור שסנוקר (ובאולינג) לא פחות מעניינים מגולף, למשל, ויתכן שהישראלי הממוצע יכול להתחבר אליהם יותר משום שיש לו יותר הזדמנויות להתנסות בהם בעצמו; וכל אלה מעניינים הרבה יותר משחיה צורנית או מהרמת משקולות, אף ששני אלו נכללים באולימפיאדות. נראה שיש בעולם רבים שמסכימים אתי - לפחות עד כמה שהדבר מתבטא בשעות שידור, ספונסורים וחוזי פרסום.
איזה כיף! 651410
העובדה שגולף הוא ספורט פופולרי (או שהוא בכלל ספורט) היא עובדה מפתיעה בפני עצמה. אבל בכל זאת יש הבדל בכמה סדרי גודל כמות הכסף בין גולף לסנוקר. ברשימת עשרת השחקנים המרוויחים בעולם נמצאים שני שחקני גולף, אין אף שחקן סנוקר במאיה הראשונה. אגב, לאדם סקוט, מספר 95 ברשימה, או אפילו לפיל מייקלסון, מספר 8, אין בכלל ערך בויקידפיה העברית.
איזה כיף! 651411
אפרופו כסף וקריקט, 80% מהכנסות באליפות העולם מגיעות מהודו. אלא שב-‏2007 ארע אסון כשאירלנד העיפה מהתחרות את פקיסטן ובנגלדש את הודו וכך לא התקיים מפגש בין שני היריבות הודו ופקיסטן. כדי למנוע אסון פיננסי נוסף מועצת הקריקט העולמי שינתה את החוקים כדי להבטיח שתמיד יתקיים משחק בין הודו לפקיסטן ע"י הקטנת מספר הקבוצות ושיטת משחקים בה כל קבוצה משחקת נגד כל שאר הקבוצות בשלב הראשון.
איזה כיף! 651412
הכל ענין של גאוגרפיה. גולף פופולרי במיוחד בארה"ב, ולגמרי במקרה שם מסתובב גם הכסף הגדול של המפרסמים ושל הטלביזיה ושל הפרסים בטורנירים. הסנוקר פחות תפס שם, והוא חזק יותר דווקא בשווקים אירופיים קטנים יותר ומפוזרים יותר. למרות זאת, או'סאליבן הרוויח בחייו למעלה משמונה מיליון ליש"ט כפרסים בטורנירים - לא בליגה של הטניס, אבל בכל זאת סכום נאה. אגב, שמת לב שאותו "הפלויד הזה" תופס את המקום הראשון ברשימה?
איזה כיף! 651414
כן, שמתי לב, שמת לב שהוא קיבל הכי מעט מפרסומות...
איזה כיף! 651427
באגרוף המודל העסקי שונה מבענפים אחרים בגלל אופי הספורט. קשה להרוויח מפרסומות כיוון שחברות לא מעונינות להשתמש במתאגרפים כפרזנטורים. לכל מתאגרף בכיר יש קרבות בודדים בשנה והם לא במסגרת של טורניר קבוע. לכן המודל מתבסס על שידור ישיר של הקרבות בערוצי צפיה בתשלום, ועל תשלום ישיר של סכומי עתק למתאגרפים עצמם.
איזה כיף! 651352
זאב רווח סמך?
ומה עם יתר ההמלצות? 651239
כפי ששכ"ג אמר, מדובר ברווח סמך. אבל לדעתי המונח שיותר דורש הסבר בציטוט הנ"ל הוא hazard ratio, אז אגיד קודם משהו עליו.

בסטטיסטיקה צריך לעתים קרובות לנתח את התפלגות הזמן עד שמשהו ספציפי קורה. למשל: הזמן מרגע אבחון מחלה כלשהי עד שמתים ממנה (או במקרים אחרים, עד שמחלימים ממנה), זמן הפעולה של מכשיר אלקטרוני עד שהוא מתקלקל, או הזמן שחבר פרלמנט מכהן עד שהוא פורש או לא נבחר יותר. תת-התחום הסטטיסטי הרלוונטי נקרא "ניתוח שרידות" (survival analysis).

מסתבר שנוח יותר למדל ולנתח מתמטית זמנים שכאלה לא דרך פונקציית ההתפלגות שלהם, אלא דרך פונקציה שנובעת ממנה במובן מסוים, ונקראת "פונקציית סיכון" (hazard function). יהיה לי קשה להסביר כאן מה הפונקציה הזאת בדיוק אומרת, אבל אינטואיטיבית, לדברים שקורים בד"כ תוך זמן קצר יש פונקציית סיכון עם ערכים גבוהים, ולהיפך. למשל, אם נסתכל על הזמן עד להתפתחות סרטן אצל עכברים רגילים ואצל עכברים שנחשפו לקרינה רדיואקטיבית מסיבית, פונקציית הסיכון בקבוצה השניה תהיה עם ערכים גבוהים יותר.

המודל הנפוץ ביותר בניתוח שרידות נקרא המודל של קוקס (Cox), או proportional hazard. ההנחה הבסיסית שלו היא שלפונקציית הסיכון של הזמן שבו אנחנו מתעניינים (למשל הזמן עד התפתחות סרטן) בקבוצה אחת (עכברים רגילים) יש בדיוק אותה הצורה כמו לפונקציית הסיכון בקבוצה השניה (עכברים שנחשפו לקרינה), רק שערכי הפונקציה כולם בקבוצה השניה מוכפלים בקבוע כלשהו. הקבוע הזה נקרא "יחס הסיכון", וזה ה-hazard ratio שמופיע בציטוט. כשהקבוע הזה גדול מ-‏1, זה אומר (באופן גס) שבקבוצה השניה הדברים קורים בד"כ תוך זמן קצר יותר, וכשהוא קטן מ-‏1, תוך זמן ארוך יותר.

בציטוט שהבאת אומרים (פחות או יותר) שאצל נשים, כל כוס חלב נוספת ביום גורמת לפונקציית הסיכון של הזמן עד המוות לגדול פי 1.15, כלומר חלב מקצר לנשים את החיים (אבל שימו לב - זה לא נכון לפרש את הממצא הזה שכל כוס חלב מקצרת את החיים של נשים ב-‏15%, או משהו בסגנון).

ועכשיו סוף סוף לרווחי סמך. המספר 1.15 שנקבתי בו בפיסקה הקודמת הוא מה שנקרא "אמד נקודתי" - כלומר מספר בודד, ולא טווח של מספרים. הבעייה עם אמדים נקודתיים היא שהם לא משקפים את הווריאביליות של הגודל שניסינו לאמוד, ולכן נותנים תחושה כוזבת של דיוק. הרי ברור שאילו היינו בוחרים מדגם מקרי אחר של נשים למחקר, היינו מקבלים תוצאות קצת אחרות, פשוט כי בכל מדגם יש מידה מסוימת של אקראיות טהורה. דוגמא אחרת, ברוח הימים הנוכחיים: שני סקרים מצאו שלמועמד X יש 63% תמיכה בציבור, אבל סקר א' התבסס על 100 נסקרים, וסקר ב' על 5000 נסקרים. האמד הנקודתי של שני הסקרים (63%) הוא זהה, אבל ברור שסקר ב' יותר אמין. רווח סמך הוא דרך לכמת את אי הוודאות הזו, והוא טווח של מספרים (שבד"כ במרכזו נמצא האמד הנקודתי) שבהם אנחנו מעריכים, בדרגת ביטחון גבוהה למדי, נמצא הגודל שבו אנחנו מתעניינים (אחוז התמיכה האמיתית באוכלוסייה במועמד X, או היחס האמיתי בין שתי פונקציות הסיכון). בציטוט שהבאת כתוב בעצם: במחקר שלנו מצאנו שיחס הסיכון הוא 1.15, אבל אל תתפסו אותנו במילה - הוא כנראה איפשהו בין 1.13 ל-‏1.17.

שאלת גם איך מחשבים את רווח הסמך הזה. התשובה שלי היא שאני לא יודע, כי לא קראתי את המאמר - יש הרבה וריאנטים על המודל של קוקס, ולא ברור לי במה השתמשו כאן (ואני גם לא מומחה בניתוח שרידות). בכל אופן, אני מקווה שעזרתי להבין את רוח הדברים.
ומה עם יתר ההמלצות? 651246
תודה! אבל אתה עוד לא משוחרר. כתבת שאם כל כוס חלב נוספת ביום גורמת לפונקציית הסיכון של הזמן עד המוות לגדול פי 1.15, זה לא אומר שהכוס הזו מקצרת את החיים ב-‏15%. אבל אתה יכול לומר משהו שזה כן אומר, במונחים נגישים להדיוטות, אפילו רק בערך או עם הנחות נוספות?
ומה עם יתר ההמלצות? 651268
כן, אני יכול. אנסה בכל זאת להסביר מה זה פונקציית סיכון.

כזכור, אנחנו מתעסקים בניתוח הזמן עד שמשהו ספציפי קורה (באנגלית התחום נקרא גם time-to-event analysis). לשם הקונטקרטיות ולמרות המורבידיות, נחשוב על "מוות" בתור המשהו הספציפי.

בניסוח לא מדויק, הערך של פונקציית הסיכון בנקודת הזמן t היא ההסתברות שאדם שזכה להגיע לגיל t ימות תוך זמן קצר אחרי t. כתבתי "היא ההסתברות" אבל זה שקר גס, כי סיכון זה גודל שיכול להיות גדול מ-‏1. הסיבוך הזה קורה בגלל ש"זמן" זה גודל רציף, אז כדי להקל על עצמנו בהסבר, בוא נעבור לדבר על זמן בדיד - נמדוד גיל של אנשים רק בשנים שלמות.

נניח שזמן החיים של אדם מתפלג באופן אחיד (בדיד) בין שנה אחת ל-‏80 שנה. כלומר, כשאדם נולד, יודעים שיש לו הסתברות של 1/80 למות בגיל שנה, הסתברות של 1/80 למות בגיל שנתיים, וכך עד הסתברות של 1/80 למות בגיל 80. אלה הסתברויות לא מותנות. אבל אם ידוע שאדם שרד את השנה הראשונה של חייו, מהי ההסתברות שימות בגיל שנתיים? אם הוא שרד את השנה הראשונה, נותרו לו רק 79 אפשרויות, והיות שהן שוות הסתברות (אמרנו התפלגות אחידה), ההסתברות המותנית שימות בגיל שנתיים, בהינתן ששרד עד גיל שנה, היא 1/79. ההסתברות המותנית הזאת, 1/79, היא בדיוק הסיכון שלו בשנה השניה. באופן דומה, ההסתברות המותנית שמישהו ששרד את גיל שנתיים ימות בגיל 3 היא 1/78 - כלומר פונקציית הסיכון בגיל 3 היא 1/78 - וכך הלאה, עד שהסיכון בגיל 80 הוא 1: מי ששרד את גיל 79, ימות בוודאות בגיל 80.

בזמן רציף, כאמור, העניינים קצת מסתבכים טכנית, כי צריך לקחת גבולות על dt ששואף ל-‏0, והסיכון יכול לצאת (ואכן הרבה פעמים יוצא) גדול מ-‏1, כך שאי אפשר לתת לו אינטרפרטציה של הסתברות. אבל העיקרון לא משתנה: ערך פונקציית הסיכון בנקודה t משקף את הנטייה למות "עכשיו" עבור אלו שהגיעו לגיל t.

עד עכשיו דיברנו רק על מצב עניינים אחד: אנשים באשר הם. במחקרים בד"כ משווים בין קבוצות שונות של אנשים, למשל אנשים שלא שותים חלב בכלל, אנשים ששותים כוס חלב אחת ביום, אנשים ששותים שתיים, וכו'. בכל קבוצה שכזו תיתכן עקרונית התפלגות זמן חיים אחרת (למשל אם מאמינים שצריכת חלב משפיעה על הבריאות), ואז תהיה לקבוצה גם פונקציית סיכון אחרת. ההנחה של המודל של קוקס היא שאם ניקח שתי קבוצות כלשהן, פונקציות הסיכון שלהן יהיו שונות זו מזו רק בכפל בקבוע, שהוא בדיוק יחס הסיכון ביניהן.

במאמר שג'וד שאלה עליו אומרים שיחס הסיכון בין כל שתי קבוצות נשים "סמוכות" (למשל הנשים ששותות 3 כוסות ואלה ששותות 4 כוסות) הוא 1.15. עכשיו סוף סוף אני יכול לתת אינטרפרטציה למספר הזה: אם ניקח קבוצה גדולה של נשים בנות אותו הגיל, חלקן שותות 3 כוסות חלב ליום וחלקן שותות 4, ונעקוב אחריהן במשך זמן יחסית קצר (נניח, חודש), אזי אחוז הנשים שימותו במהלך הזמן הנ"ל בקבוצה השניה צפוי להיות גדול בערך פי 1.15 מאחוז הנשים שימותו בקבוצה הראשונה. הכל תחת ההנחה של המודל של קוקס.

יצא לי ארוך, אז אני שומר לפעם אחרת את דעתי לגבי הריאליות של המודל של קוקס.
ומה עם יתר ההמלצות? 651272
תודה רבה, יובל. תענוג לקרוא את ההסברים שלך.
ומה עם יתר ההמלצות? 651328
כן, תודה!
ומה עם יתר ההמלצות? 651258
תודה רבה יובל! מאד עזרת להבין את רוח הדברים.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים