בתשובה לאייל מזדמן, 29/08/03 19:12
טעויות דגימה 167221
1. את "טעות הדגימה המירבית" של העיתון צריך להחליף ב"המספר שהסיכוי של טעות הדגימה לעבור אותו הוא 95%". סטטיסטיקאים קוראים לזה "רווח בר-סמך": טווח תוצאות, שהסיכוי ליפול מחוצה לו קטן (למשל - 5%).

2. הקשר בין גודל טעות הדגימה לבין הסיכוי ליפול לטווח שלה, תלוי גם בגודל המדגם (ואין זה נכון שהסיכוי הוא המשלים ל- 1 של "הטעות המירבית").
בסקרים, "טעות הדגימה המירבית" היא 1.96 סטיות תקן; זה חסום על-ידי 0.98 חלקי (sqrt(n, כאשר n הוא גודל המדגם.
מספר הקסם 1.96 מגיע כמובן מן הדרישה לטעות רק 5% מן התחזיות. אם רוצים לטעות פחות, צריך להגדיל את הטווח.

3. יתרה מזו, טעות הדגימה תלויה גם בגודל שאותו מנסים להעריך. בחיזוי שכיחויות קרובות למחצית, השגיאה גדולה. אם משתמשים באותו מדגם כדי לחזות שכיחויות קטנות (כמו למשל גודלן של מפלגות קטנות), השגיאה קטנה יותר.
השגיאה פרופורציונלית ל- ((sqrt(p*(1-p, כאשר p היא השכיחות שאותה דוגמים.

4. נכון שבחישוב טעות הדגימה, מניחים שהדגימה היא מקרית, ומתוך האוכלוסיה הנכונה. בפרט, בסקרים טלפוניים מתעלמים מכך שלא דוגמים משפחות ללא טלפון, ושהסיכוי לדגום משפחה בעלת יותר מטלפון אחד, גדול יותר. מתעלמים מעובדי משמרות (שלא יהיו בבית ב- 9 בערב), מהקורלציה בין הנכונות-להשתתף-בסקר לבין גיל (צעירים פחות משתפים פעולה), מצב משפחתי (או מספר הילדים שצריך להשכיב לישון באותו ערב), וכדומה.

5. נדמה לי שסוקרים משתדלים לפלח את האוכלוסיה, ולהשתמש בנתוני מרשם האוכלוסין כדי לשקלל את התוצאות. זה אמור להקטין את טעות הדגימה.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים