בתשובה להמערכת, 10/07/03 11:47
מאמר מאוד חשוב אבל 166777
אחרים כבר התחילו, אז הנה הנביחה הפרטית שלי המתייחסת לביטוי מטופש החוזר שוב, ושוב, ושוב בעיתונות: "טעות הדגימה המרבית". עושים סקר על 504 איש, יוצא שמיס-פיגי מובילה בסקרים על קרמיט ב-‏18%, ו-"טעות הדגימה המרבית" היא 4.5%. משמע? עורכי העיתון הגאונים יודעים להוכיח מתמטית שאילו נערכו הבחירות מחר, היתה מיס-פיגי מנצחת ב-‏13.5% לפחות. פלא פלאים, הבחירות באמת נערכות למחרת ויש לנו ראש ועד-בית ירוק.

אני יודע מה זה "טעות דגימה", אבל כשאנשים קוראים "מרבית", הם מבינים את זה ככה, כפשוטו.
מאמר מאוד חשוב אבל 167130
מה זה באמת טעות דגימה מרבית?
נראה שתוצאת סקר אמורה לתת טווח מסוים + סיכוי לצאת מהטווח הזה.

וחוץ מזה, איך שזה שהטעויות הן תמיד באזור ה3%, אבל אחוז ההצלחה של הסקרים רחוק בהרבה מ97%?

לי תמיד יש תחושה מציקה שבכל הסקרים, וגם במחקרים פסיכולוגיים וכו', מחשבים את הטעות כאילו המדגם הוא מקרי ובלתי-תלוי, כאשר המדגם האמיתי שלהם הוא של אנשים שקשורים אחד לשני (אנשים שהם חברים אחד של השני, קרובי משפחה, אנשים שהיו במקרה בסביבה וכו').
וידוי 167131
המדגם זה אני, לאור כמות הטלפונים של הסוקרים למיניהם לבית זה. ומה שאני רוצה לדעת זה- מה הסיכוי שכל הדוגמים יתקשרו תמיד אליי? והאם זה אומר שיש לי גם סיכוי טוב מהממוצע לזכות בפיס? :)
טעויות דגימה 167221
1. את "טעות הדגימה המירבית" של העיתון צריך להחליף ב"המספר שהסיכוי של טעות הדגימה לעבור אותו הוא 95%". סטטיסטיקאים קוראים לזה "רווח בר-סמך": טווח תוצאות, שהסיכוי ליפול מחוצה לו קטן (למשל - 5%).

2. הקשר בין גודל טעות הדגימה לבין הסיכוי ליפול לטווח שלה, תלוי גם בגודל המדגם (ואין זה נכון שהסיכוי הוא המשלים ל- 1 של "הטעות המירבית").
בסקרים, "טעות הדגימה המירבית" היא 1.96 סטיות תקן; זה חסום על-ידי 0.98 חלקי (sqrt(n, כאשר n הוא גודל המדגם.
מספר הקסם 1.96 מגיע כמובן מן הדרישה לטעות רק 5% מן התחזיות. אם רוצים לטעות פחות, צריך להגדיל את הטווח.

3. יתרה מזו, טעות הדגימה תלויה גם בגודל שאותו מנסים להעריך. בחיזוי שכיחויות קרובות למחצית, השגיאה גדולה. אם משתמשים באותו מדגם כדי לחזות שכיחויות קטנות (כמו למשל גודלן של מפלגות קטנות), השגיאה קטנה יותר.
השגיאה פרופורציונלית ל- ((sqrt(p*(1-p, כאשר p היא השכיחות שאותה דוגמים.

4. נכון שבחישוב טעות הדגימה, מניחים שהדגימה היא מקרית, ומתוך האוכלוסיה הנכונה. בפרט, בסקרים טלפוניים מתעלמים מכך שלא דוגמים משפחות ללא טלפון, ושהסיכוי לדגום משפחה בעלת יותר מטלפון אחד, גדול יותר. מתעלמים מעובדי משמרות (שלא יהיו בבית ב- 9 בערב), מהקורלציה בין הנכונות-להשתתף-בסקר לבין גיל (צעירים פחות משתפים פעולה), מצב משפחתי (או מספר הילדים שצריך להשכיב לישון באותו ערב), וכדומה.

5. נדמה לי שסוקרים משתדלים לפלח את האוכלוסיה, ולהשתמש בנתוני מרשם האוכלוסין כדי לשקלל את התוצאות. זה אמור להקטין את טעות הדגימה.
מאמר מאוד חשוב אבל 167724
תגובה 167221 עונה על שאלתך, אבל הייתי מחדד עוד טיפה. גם הטענה "הסיכוי שהמדגם טועה ביותר מ-‏3% נמוך מ-‏5%" מניחה הנחות שונות על ההתפלגות א-פריורי, אי-תלות ועוד דברים שעוזי הזכיר. ההתאמה של הנחות אלו למציאות, לעניות דעתי, היא נמוכה עד גבה-בינונית.

כלומר: ניקח את 100 הסקרים הטלפוניים האחרונים שנעשו בארץ, ונדמיין שעבור כל אחד מהם נערך במקביל משאל על כלל האוכלוסייה והתוצאה האמיתית ידועה. בכמה מהסקרים צדק הסוקר, ותחזיתו זהה לתוצאה האמיתית עד כדי "טעות הדגימה המירבית"? הניחוש שלי: הרבה פחות מ-‏95 (שזו ה-"תחזית המתמטית" בתנאים אידאליים). ניחוש נועז יותר: פחות מ-‏50 מהסקרים "נכונים" במובן זה.

זו טענה אינטואיטיבית לגמרי, ואין דרך סבירה לאשר או להפריך אותה. הנה אחד הנימוקים התומכים שלי: את האוכלוסייה היהודית‏1 בישראל אפשר לפלח, נניח, עפ"י דתיים/חילוניים, עשירים/עניים, צעירים/זקנים ועירוניים/שאינם עירוניים. בהרבה מאוד סקרים יש הטייה משמעותית של התוצאה בכל אחד מהפלחים הללו, ואף בכל הצירופים שלהם. יש 16 צירופים אפשריים, ולכן ב-‏504 נדגמים (אם נבחרו היטב!) מיוצגים כ-‏32 איש מכל פלח. זה ממש מעט, אפילו ביחס לגודל הפלח, וגורר טעות דגימה רחבה יותר מזו המחושבת עפ"י ההנחה שהנסקרים הם הומוגניים.

1 ברוב הסקרים שראיתי מתייחסים למדגם של האוכלוסייה היהודית הבוגרת בארץ.
אם כבר פילוח 167749
כשמפלחים את האוכלוסיה לתת-קבוצות (כלומר, דוגמים כל תת-קבוצה בפני עצמה, ומשקללים את התוצאות), לא כדאי לדגום מספר שווה של נשאלים מכל פלח.
אם מספר הנדגמים פרופוציונלי לגודל הפלח, השונות *קטנה* יותר מאשר ללא פילוח.
(למעשה, החלוקה האופטימלית של מספר הדגימות תהיה באופן פרופורציוני לגודל כפול (sqrt(p*q של כל פלח).
אם כבר פילוח 168330
1. תודה על ההסבר לגבי טעות דגימה - דווקא לי נראה שהצורה שמשתמשים בביטוי בעיתון הוא די מדוייק. אם הם חישבו נכון אז בדוגמה של אלון מתגובה 166777 יש סיכוי של 95% שמיס פיגי אכן תנצח.

2. האם יש מודלים מתמטיים שמנסים להעריך את הטעות בצורה טובה יותר מאשר הצורה הנאיבית שהיא ההנחה שהמדגם הוא בלתי תלוי? האם משתמשים בהם? אם לא, למה?

לי קרה פעם שמכר רופא שערך איזשהו מחקר, שאל אותי שאלות במסגרת המחקר וביקש גם את הטלפונים של כל בני משפחתי.
כשסיפרתי על כך לידידה שלומדת מדעי החברה, היא אמרה שזה בסדר, מאחר ובטח הייתי רק שייך לקבוצת הביקורת, שבטח קשר משפחתי לא משפיע על נושא המחקר, וממילא אפשר "לפצות" על התלות בכך שהוא יקח מדגם גדול יותר.
לא נראה שהיא היתה מודעת לכך שהגדלת המדגם יכולה *לפגוע* בדיוק שלו. אני מניח שהיא לא דוגמא מייצגת, אבל בכל זאת, זה הטריד אותי.
אם כבר פילוח 168340
ואולי הוא דווקא חקר את הקשר המשפחתי של הבעיה שלו? היא ביקש את הטלפונים של כל בני המשפחה שלך - יכול להיות שהוא חקר *משפחות* ולא אנשים בודדים.
אם כבר פילוח 168417
הוא היה מוכן לקבל כל טלפון שאני אתן לו: אחים, גיסים, חברים, בני דודים - העיקר שיהיו מוכנים לענות על השאלות.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים