בתשובה לנגה אדמון, 14/12/02 23:04
רגרסיה 0.2 113229
0.2 מלמדת על התאמה חלשה ביותר בין המשתנים, ונסיונאים יאמרו אפילו - אי-תלות סטטיסטית בין המשתנים. נאמר שרוצים לעמוד על התלות הסטטיסטית בין X לY. לצורך פשטות נאמר שהתוחלת של X ושל Y היא אפס, כלומר שממוצע הערכים שהם מקבלים הוא אפס. אז השונות של X תהיה פשוט תוחלת הריבוע של X, כלומר הערך הממוצע של X בריבוע, וכנ"ל לגבי Y.
פרמטר המתאם (קורלציה) יוגדר במקרה זה כתוחלת המכפלה X*Y, חלקי השורש של מכפלת השונות של X בשונות של Y.
במקרה הפשוט ביותר בו Y הוא פונקציה לינארית של X,
Y=kX
אז
EY^2 = E(k^2X^2) = k^2 * EX^2
EXY = E(kX^2) = k * EX^2
ואז המתאם יהיה בדיוק 1, כלומר מתאם מלא בין Y לבין X. לעומת זאת אם המדידות שלנו יתפזרו בצורה אחידה למדי במישור (X,Y), למשל אם המישור הוא מטרה במטווח ואנו מודדים מקבץ יריות, אז הקורלציה בין Y ל-X אמורה להיות נמוכה למדי.

כל מי שעשה מעבדה או שתיים בפיסיקה בתיכון אמור לדעת שהקורלציה בין שני משתנים שאמורים להיות תלויים, תמיד
יוצאת לפחות 0.9, ובמקרים האיומים ביותר בסביבות 0.5. 0.2 זה בערך מה שמקבלים אם מודדים את התלות של מספר הציפורים הנודדות מעל ארצנו במספר נשיכות הכלבים באיזור גוש דן.
תלוי 113263
הכל תלוי, כמובן, בגודל המדגם.
אם R הוא מקדם המתאם (המחושב מתוך דגימה של n נתונים), אז לסטטיסטי
T=sqrt((n-2)*R^2/(1-R^2))
יש התפלגות "t" עם n-2 דרגות חופש. המתאם שיחשב מובהק‏1 תלוי לכן ב- n. למשל:
במדגם בגודל n=10, רק מקדם מתאם R=54% ומעלה הוא מובהק.
אם n=30, מספיק R=30%.
אם n=100 מספיק R=16%,
ואם n=2000 מספיק לקבל R=3.5%.

1 מובהק: לא סביר שיתקבל מספר כזה אם המשתנים באמת אינם תלויים.
רגרסיה 0.2 113296
ליאור, אתה חי בעולם של פיזיקה, בעוד שאנחנו עוסקים במדעי החברה. להשיג 0.9 זו פנטזיה במצב כזה. אפילו 0.7 זה חלום רטוב. 0.5 זה מרשים מאוד, 0.4 זה נאה, 0.2 הוא בסדר כזה, לא משהו. הסיבה, כמובן, היא שאין שום דבר שמשפיע עליו רק דבר אחד, אלא יש סדרה של גורמים, רבים מהם כלל אינם ידועים לנו, שמשפיעים על השונות.
רגרסיה 0.2 לדוגמה 113310
למי שתהה איך נראה גרף עם מתאם 0.2, הנה אחד לדוגמה:
התמונה התחתונה כמובן
(ומתחת לה אחת הפסקאות המחורבנות ביותר שחיברתי מעולם)
רגרסיה לדוגמא 113503
כמו שעוזי ו. אמר, המשמעות של מקדם המתאם תלויה בגודל הדגימה. הפיסקה שהבאת היא אכן מחורבנת למדי, בלי להעליב :-)

בכל מקרה, אני מקווה שתסכים איתי שאם התוחלת של ביצועי הרופא בהנחה שממוצע הציונים שלו הוא 95 גבוהה מהתוחלת של ביצועיו בהנחה שממוצע הציונים שלו הוא 65 (ואם סטיית התקן ושאר המומנטים דומים בשני המקרים), כדאי יותר להעסיק את הרופא בעל ממוצע 95 גם אם סטיית התקן היא גדולה.
רגרסיה לדוגמא 113534
לא נעלבתי, תודה (:

במקרה של התאמה נמוכה בין ציוני הרופא לביצועיו, הייתי מעדיף להכניס לשיקולים מדדים מהימנים יותר. למשל, הערכה של ביצועיו בתקופת ההתמחות או פשוט הארכה של תקופת התמחותו.

_______________
ליאור, ו45 כניסות חדשות ליצירתו 'גרף למאמר 'סיכון מחושב או טמטום לשמו".

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים