בתשובה לטל כהן, 07/01/19 16:56
אומואמואה 703403
אומואמואה 703407
אוף, כמה שזה מדויק. גם הטענות מהרקע המתמטי, גם אלה מהרקע הבלשני, וגם אלה מהרקע התכנותי.

(מקור: הצוות שלי אחראי על כמה וכמה מוצרי מזג-אוויר, וגם על מוצרי שפה; ואנחנו עובדים עם כמה וכמה ספקי נתונים למזג-אוויר. אל תשאל.)
אומואמואה 703412
אם כך, אפשר הסבר לגבי הסיכוי לגשם?
אומואמואה 703414
(אוף, עניתי בטעות לעצמי במקום לך. ראה תשובה למטה. סליחה.)
אומואמואה 703413
אין תשובה שמקובלת על כולם (לפחות, מבין אלה שנועצתי בהם). הדבר הכי קרוב להסכמה הוא "זה הסיכוי שירד עליך גשם בהנתן שאתה בנקודה אקראית בשטח הגיאוגרפי הנתון (נניח מנהטן), ברגע אקראי בזמן (מתוך השעה הנתונה)". כלומר זה יכול להיות שיש 70% סיכוי לגשם על פני כל מנהטן במשך השעה, וזה גם יכול להיות גשם על 70% משטח מנהטן, בודאות, במשך כל השעה, וגם יכול להיות גשם על כל מנהטן במשך 70% מהשעה. כל האפשרויות הללו עונות על ההגדרה, כמו גם שילובים שונים שיובילו לאותה ההסתברות. (מה שלא עונה על ההגדרה, וזו בכל-זאת האינטואיציה של חלק מהאנשים: זה הסיכוי שירד גשם היכן שהוא במנהטן, למשך פרק זמן כלשהו במהלך השעה.)

שלא לדבר על זה שהנתון המספרי הוא בד"כ "משופץ". אם תבדוק, תגלה שלעולם אין "50%" בתחזיות מזג-אוויר, וגם לא 5%. הסיבה הרשמית היא שאם המודל חוזה 50%, זה לא "עוזר למשתמשים" (נו, אז לקחת מטריה או לא?), ולכן מעדיפים להזיז את הנתון כלפי מעלה (לטעון ליותר סיכוי לגשם), מה שנקרא "Wet bias [Wikipedia]". לא כל העוסקים בתחום משתמשים באותו wet bias, כלומר חלק יתקנו כל מספר בין 45% ל-‏55% כך שיוצג 55%, אחרים יתקנו מ-‏40% ל-‏60%, וכו'. חלק ירימו 5% ל-‏15%, וחלק לעולם לא יציגו ערך נמוך מ-‏20%. ההסבר האמיתי הוא כמובן שאם התחזית לא מתממשת והציבור נשאר יבש, אף אחד לא יתלונן, אבל אם התחזית לא מתממשת והציבור נרטב, יתלוננו גם יתלוננו. אם מוצג 5% סיכוי לגשם, והלקוח נרטב, הוא יתלונן בסגנון "אמרתם שממש אין סיכוי לגשם!", ולא יתחשב ב-‏19 הפעמים האחרות בהם נטען 5% והצדיק-תמים נשאר יבש.
אומואמואה 703415
תודה. האם במודלים שמשמשים את החזאים רזולצית הזמן והמרחב היא כזו ש"מנהטן בין 1 ל-‏2" היא בתוך אטום בודד ולכן אין משמעות במודל לשאלה מתי/איפה בדיוק יורד גשם בתוך מנהטן בין 1 ל-‏2?

האם יש אתרים שידוע שמפרסמים תחזית לא משופצת?
אומואמואה 703416
לא, הרזולוציה במרחב היא גבוהה בהרבה, הרזולוציה בזמן גבוהה (לא בהרבה). הפרטים המדויקים שונים בין החברות השונות.

אני מניח שיש, אבל אני לא מכיר, חברה שמפרסמת נתונים ללא bias.
אומואמואה 703421
שוב תודה.
אומואמואה 703425
שמעתי פעם על האתר הזה שמפרסם נתונים גולמיים. מה שהוא מפרסם זה רק „סה"כ משקעים״ (באנגלית: accumulated percipation, בעברית: גשם מצטבר) במקום וזמן כלשהו.
אומואמואה 703429
אגב, בערך אליו הפנית בויקיפדיה מוזכר ספרו אל נייט סילבר, אליו התייחסתי בתגובה 703390. הוא מזכיר שם, אם אני זוכר נכון, שתחזיות שבד"כ אינן סובלות מהטייה זו הן אלו הממשלתיות.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים