בתשובה לצפריר כהן, 03/03/17 23:27
על הסכנה במאגרי נתונים רחבים 690153
מאמר נרחב ומעניין בדיוק על הנושא הזה. הכותרת שלו "איך הסטטיסטיקה איבדה את כוחה" קצת מטעה משום שבמושג "סטטיסטיקה" הם מתכוונים למשמעות המקורית של המילה, המאמץ של המדינה להפיק תובנות כלליות על האוכלוסיה (מגרמנית Statistik), מה שמכוון לאיסוף נתונים מסוג אלה של הלמ"ס או סקרי בחירות ולא סטטיסטיקה לניסויים מעבדתיים או הנדסיים. הטענה של המאמר היא שהכמות העצומה של נתונים שנמצאת כיום בידיהם של ארגונים פרטיים וציבוריים מפתה או מייתרת את השימוש בסטטיסטיקה מדגמית. בשעה שבאיסוף נתונים סטטיסטי השאלה קובעת איזה נתונים יאספו ובאיזו שיטה, כשיש מאגרי נתונים עצומים הנתונים הם אלה שקובעים את השאלות - בא נריץ חיתוכים שונים ונראה אילו דברים מעניינים יעלו. מה שמחמיר את הבעיה, לטענת המאמר, זה שהשקיפות שהיא חלק בלתי נפרד מאיסוף, ניתוח והמסקנות מעיבוד הנתונים שנעשה ע"י גופים ציבוריים נעלמת כשזו נעשיות על ידי חברות פרטיות (מסתירים את הממצאים כדי להימנע מביקורת או כדי להשיג יתרון עסקי), או ע"י מתודולגיות שאפילו טכנאי המידע לא בדיוק יודעים מה מטרתן.
אובר - מניפולציות על הנהגים 690964
אלגוריתמים לניתוח מידע איפשרו לאובר לערוך מניפולציות חשאיות על נהגים כדי להגדיל את רווחיה. למשל, הם נתנו פרסים חסרי ערך לנהגים כדי לפתות אותם לנהוג שעות ארוכות יותר או לנסוע לאזורים שהנהג לא מרוויח.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים