בתשובה לא. דה (בוטון), 02/07/14 14:59
מהפיד שלי בפייס 634570
2. יש לי הסבר אפשרי לתופעה הזאת‏1 - מעולם ה Machine learning. כשאלגורתם קלסיפיקציה אמור לסווג לאיזה קבוצה שייך סיגנל כלשהו, (שקול ללהבין מסיגנל קולי איזה מילה הוא אומר למשל), יש הבדל עצום בביצועים כאשר אתה יודע אפריורית על מספר קטן של קבוצות מוגדרות מראש, או כאשר אין ידע כזה כלל.
דוגמה קיצונית: עבור קטע מוקלט שכולל מילה אחת, שתי המשימות:
א. זהה את המילה שנאמרה
ב. האם המילה שנאמרה היא 'סוכר'
יפעלו באופן שונה מאד, ועם ביצועים שונים מאד.

עבור המשימה השנייה, בדרך כלל ינסה האלגוריתם להגדיר איזו פונקצית מרחק בין הסיגנל ששמע לסיגנל ידוע מראש של 'סוכר', ואם המרחק יהיה מספיק קצר, הוא יכריז: "תוצאה חיובית, נאמר כאן 'סוכר' ".
לעומת זאת, כדי למצוא 'איזה מילה נאמרה', צריך לבדוק עבור מרחב עצום של אפשרויות, למי הסיגנל קרוב יותר. ואז, בהינתן סיגנלים/הקלטות רועשים, קשה מאד יהיה לומר בבירור האם נאמר 'סוכר', 'מסוגר', 'שופר', 'פוקר' (ב-פ' רפה, אז מה אם אין מילה כזאת) וכו'.

לכן, כשאתה יודע מראש שאתה אמור לשמוע 'סוכר', גם מילים מאד רועשות אבל שמזכירות ולו במעט את המילה 'סוכר' כבר יסומנו כתשובה חיובית, רק בגלל שמראש החיפוש נעשה במרחב מצומצם יותר.
דוגמה משעשעת שנתקלתי בה לאחרונה של המקרה הזה: החבובות מסבירות פנומנולוגיה.
כמה קל לשמוע את הזמר חוזר שוב ושוב על המילה phenomena, נכון?‏3

1 מעבר לאמירה הכללית שהמוח הוא מדהים - ואגב, כל מי שניסה להעביר בטלפון ראשי תיבות באנגלית‏2 וידע היטב ש-F ו-S נשמעים אותו דבר בטלפון.
2 יש מן נוהג כזה של לקרוא לפרוייקטים בתעשייה בר"ת של שלוש אותיות אנגליות, וכנראה שאין מספיק כאלה כי כרב ראיתי כמה וכמה צירופים שחזרו על עצמם בפרוייקטים שונים.
3 זהו, שלא.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים