בתשובה לירדן ניר-בוכבינדר, 19/02/15 22:36
ומה עם יתר ההמלצות? 651268
כן, אני יכול. אנסה בכל זאת להסביר מה זה פונקציית סיכון.

כזכור, אנחנו מתעסקים בניתוח הזמן עד שמשהו ספציפי קורה (באנגלית התחום נקרא גם time-to-event analysis). לשם הקונטקרטיות ולמרות המורבידיות, נחשוב על "מוות" בתור המשהו הספציפי.

בניסוח לא מדויק, הערך של פונקציית הסיכון בנקודת הזמן t היא ההסתברות שאדם שזכה להגיע לגיל t ימות תוך זמן קצר אחרי t. כתבתי "היא ההסתברות" אבל זה שקר גס, כי סיכון זה גודל שיכול להיות גדול מ-‏1. הסיבוך הזה קורה בגלל ש"זמן" זה גודל רציף, אז כדי להקל על עצמנו בהסבר, בוא נעבור לדבר על זמן בדיד - נמדוד גיל של אנשים רק בשנים שלמות.

נניח שזמן החיים של אדם מתפלג באופן אחיד (בדיד) בין שנה אחת ל-‏80 שנה. כלומר, כשאדם נולד, יודעים שיש לו הסתברות של 1/80 למות בגיל שנה, הסתברות של 1/80 למות בגיל שנתיים, וכך עד הסתברות של 1/80 למות בגיל 80. אלה הסתברויות לא מותנות. אבל אם ידוע שאדם שרד את השנה הראשונה של חייו, מהי ההסתברות שימות בגיל שנתיים? אם הוא שרד את השנה הראשונה, נותרו לו רק 79 אפשרויות, והיות שהן שוות הסתברות (אמרנו התפלגות אחידה), ההסתברות המותנית שימות בגיל שנתיים, בהינתן ששרד עד גיל שנה, היא 1/79. ההסתברות המותנית הזאת, 1/79, היא בדיוק הסיכון שלו בשנה השניה. באופן דומה, ההסתברות המותנית שמישהו ששרד את גיל שנתיים ימות בגיל 3 היא 1/78 - כלומר פונקציית הסיכון בגיל 3 היא 1/78 - וכך הלאה, עד שהסיכון בגיל 80 הוא 1: מי ששרד את גיל 79, ימות בוודאות בגיל 80.

בזמן רציף, כאמור, העניינים קצת מסתבכים טכנית, כי צריך לקחת גבולות על dt ששואף ל-‏0, והסיכון יכול לצאת (ואכן הרבה פעמים יוצא) גדול מ-‏1, כך שאי אפשר לתת לו אינטרפרטציה של הסתברות. אבל העיקרון לא משתנה: ערך פונקציית הסיכון בנקודה t משקף את הנטייה למות "עכשיו" עבור אלו שהגיעו לגיל t.

עד עכשיו דיברנו רק על מצב עניינים אחד: אנשים באשר הם. במחקרים בד"כ משווים בין קבוצות שונות של אנשים, למשל אנשים שלא שותים חלב בכלל, אנשים ששותים כוס חלב אחת ביום, אנשים ששותים שתיים, וכו'. בכל קבוצה שכזו תיתכן עקרונית התפלגות זמן חיים אחרת (למשל אם מאמינים שצריכת חלב משפיעה על הבריאות), ואז תהיה לקבוצה גם פונקציית סיכון אחרת. ההנחה של המודל של קוקס היא שאם ניקח שתי קבוצות כלשהן, פונקציות הסיכון שלהן יהיו שונות זו מזו רק בכפל בקבוע, שהוא בדיוק יחס הסיכון ביניהן.

במאמר שג'וד שאלה עליו אומרים שיחס הסיכון בין כל שתי קבוצות נשים "סמוכות" (למשל הנשים ששותות 3 כוסות ואלה ששותות 4 כוסות) הוא 1.15. עכשיו סוף סוף אני יכול לתת אינטרפרטציה למספר הזה: אם ניקח קבוצה גדולה של נשים בנות אותו הגיל, חלקן שותות 3 כוסות חלב ליום וחלקן שותות 4, ונעקוב אחריהן במשך זמן יחסית קצר (נניח, חודש), אזי אחוז הנשים שימותו במהלך הזמן הנ"ל בקבוצה השניה צפוי להיות גדול בערך פי 1.15 מאחוז הנשים שימותו בקבוצה הראשונה. הכל תחת ההנחה של המודל של קוקס.

יצא לי ארוך, אז אני שומר לפעם אחרת את דעתי לגבי הריאליות של המודל של קוקס.
ומה עם יתר ההמלצות? 651272
תודה רבה, יובל. תענוג לקרוא את ההסברים שלך.
ומה עם יתר ההמלצות? 651328
כן, תודה!

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים