בתשובה לעוזי ו., 14/02/06 2:29
פוטנציאל הוא מושג חמקמק. 368363
אם תיענה לבקשת האלמוני האחר, אנא כלול בהסבר שלך למה מתכוונים כשאומרים משפט בנוסח "הגובה מושפע מהתורשה ב 30%, מהתזונה בגיל הרך ב 40% והשאר גורמים לא מזוהים".
פוטנציאל הוא מושג חמקמק. 368381
בהמשך לתגובה הקודמת, משפטים כאלה מופיעים כאשר מעורבים בבעיה כמה גורמים מסבירים. כדי לאמוד את זמן התגובה Y לבדיחה (נחש של מי), אנחנו לא מסתפקים במבחני אכילת גזר (X1). עורכים גם מבחני המלטות מאולמות דחוסים (X2) וסיבולת (X3). שוב מניחים שהמודל ליניארי (כלומר, Y הוא קבוע, ועוד מקדם מסתורי כפול X1, ועוד מקדם כפול X2, ועוד מקדם כפול X3, ועוד גורם שגיאה פרטי; כל ארבעת המקדמים משותפים לכל האוכלוסיה).

אחרי שנאסוף נתונים מאלף פתאים-מתנדבים, אנחנו יכולים לאמוד את מקדמי המתאם ובכך להציג מודל לא-רע להערכת Y; המודל ליניארי (כי כך הנחנו), ועכשיו אפשר להציב בו מקדמים מפורשים - ארבעת המספרים שממזערים את סכום ריבועי השגיאות.

כמקודם, הצבה במודל היא צד אחד של הסיפור (הצד הפרקטי, של הערכת Y פרטנית). כדי לפרסם מאמר ב"הארץ שלנו", צריך לנרמל את מקדמי המתאם ולהעלות אותם בריבוע (ככה.)
אם ריבוע המקדם של X1 שווה ל- 0.30, ריבוע המקדם של X2 שווה ל- 0.40 (אני מרמה כאן; נניח שיצא 0.40 אחרי שזרקנו מ- X2 את המרכיב ש"מקביל" ל- X1 ונשארנו עם המרכיב ה"מאונך"), וריבוע המקדם האחרון הוא 0.1, נדווח לעיתונות ש"זמן התגובה מושפע ב- 30% מיכולת אכילת הגזר, ב- 40% מיכולת ההמלטות וב- 10% מן הסיבולת".

בעיתונות המקצועית ננסח זה אחרת לגמרי: "30% מן השונות בזמן התגובה מוסברים על-ידי השונות ביכולת אכילת הגזר, 40% על-ידי השונות ביכולת ההמלטות, ועוד 10% על-ידי השונות בסיבולת". הנחת היסוד היא שהשונות בין בני-אדם היא דבר מזיק (למודלים שלנו), וצריך להסביר איך השונות הזו התגנבה לשם. ככל שנצליח להסביר חלק גדול יותר ממנה בכך שנתוני הרקע (X1, X2, X3) שונים, מצבנו טוב יותר.

(גם זו תשובה חלקית, בעיקר מאותה סיבה - חסר הקשר למובהקות).
פוטנציאל הוא מושג חמקמק. 368384
תודה.

שמתי לב שאתה לא מדבר בכלל על השאלה עד כמה הנקודות יוצאות קרובות לאותו "קו ריבועים מינימלי" (ישר אם מדובר על שני משתנים), כלומר מהו אותו סה"כ הריבועים - או שמא הממוצע שלהם - שנותר אחרי שנמצא הקו האופטימלי. האם זה אותו "קשר למובהקות" שאתה מזכיר? האינטואיציה שלי אומרת שאם הוא יוצא מספר גדול כנראה מוטב לזרוק את המודל לפח ולחפש אחר.
פוטנציאל הוא מושג חמקמק. 368390
יש קשר למובהקות, אבל סכום הריבועים הוא בעצם עניין פשוט יותר. אם היו אוסרים עלינו מסיבות פוליטיות להשתמש במשתני ה-X, זה היה כמו לאלץ קו מקביל לציר(י) ה-X, ואז סכום הריבועים הוא השונות של Y. כל משתנה שנחלץ מן האיסור הזה ומשתתף במשחק, משפר את הקו ומקטין את סכום הריבועים.

אחד פחות ה*יחס* בין סכום הריבועים בלי X1 לבין סכום הריבועים עם X1 הוא בדיוק "אחוז השונות המוסברת" על-ידי X1. ככל ש- X1 מצליח להוריד יותר את סכום הריבועים, הוא מסביר טוב יותר את השונות.

חזרה לעמוד הראשי

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים