בתשובה ליובל נוב, 31/10/15 21:59
עד אנחנו מחכים ליובל נוב 666856
השאלה הראשונה היא על מקדם הקורלציה.
נניח שכל אלפי המשתתפים טועים בדיווח שלהם לכל הכיוונים, גם למעלה וגם למטה בצורה אקראית. מקדם הרגסיה a לא ישתנה, כלומר הקו יהיה באותה זווית כמו קודם, אבל הנקודות יהיו מפוזרות במרחק משני הצדדים שלו ומקדם המתאם יהיה נמוך.

הסטטסיטיקאי של המחקר לא יכול להתעלם ממקדם הקורלציה הנמוך ולומר שעל כל עליה X בבשר מעובד יש עליה aX בסרטן. מה הוא עושה עם זה?

אני מניחה שהוא ישקלל את זה בכל מיני כלים מסובכים ויקבל a נמוך ממה שהוא באמת. למעשה במחקרים כאלה אנחנו מעוניינים בשיעור הסיכון RR, אינני יודעת איך מחשבים אותו אבל מניחה שאותה שגיאה התחלתית תתבטא בכל התוצאות, זה לא יכול להיות אחרת. נכון?

ואז יתפרסם שכל 50 גרם בשר מעובד מעלים סיכון לסרטן ב-‏18%. אוקי, זה המספר הטוב ביותר שהצליחו לקבל מהנתונים, אבל אי אפשר להשוות את המספר הזה לשיעור עליית סיכון בגלל עישון שהוא הרבה יותר קרוב למציאות. אני צודקת? זאת בעצם השאלה שלי.

המצב במציאות הוא גרוע יותר כי הטעויות אינן אקראיות, ודווקא מי שאוכל הרבה ממשהו רע ידווח על פחות, זאת אומרת שגם מקדם הרגרסיה יימעך.

תודה יובל שזכרת גם את השאלה הקודמת שלי מפעם, גיגלתי random effect model. קצת שכחתי מה היה הסיפור עם זה, למיטב זכרוני אפשר ליישם את זה על מחקר כולסטרול אם עושים לכל משתתף בדיקה קלינית מקדימה כדי לראות את התגובה שלו לכולסטרול במזון. אני לא יודעת אם זה ריאלי למחקר תצפיתי.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים