בתשובה להפונז, 06/08/18 15:41
לא הבנתי 700995
בכל חברה ואפילו בכל פרוייקט זה אחרת, אבל באופן כללי, בונים מערכות המסוגלות לאחזר נתונים, לבנות על גביהם מודלים סטטיסטיים ולקבל החלטות בהתאם למודלים אלו.
דוגמא 1: מערכת לסיווג טקסט מקבלת מסמך (למשל ידיעה חדשותית), קובעת באיזה נושא הוא עוסק (חקלאות) ובהתאם לזאת מפנה אותו לבעלי העניין (אנשי יח"צ של איגוד החקלאים). במקרה זה אין צורך ליצור מודל באופן רציף.

דוגמא 2: מערכת Real Time Bidding מקבלת בקשה להצעת מחיר עבור הזכות להציג מודעה באפליקציה ידועה שפתח באותו רגע משתמש ידוע. המודל מחשב, עבור כלל המפרסמים עבורן יש לחברה הסכמים מה הסיכוי להקלקה עבור כל אחת מן המודעות הפוטנציאליות ומציע את המכפלה המקסימלית של סיכוי בתיגמול שתקבל החברה מן המפרסם עבור הקלקה עבור הצגת מודעה. במקרה שישנה זכיה, הוא גם יכול לבדוק אם היתה בפועל הקלקה או שלא, ומוסיף מידע זה כדי לאמן מודל חדש (בזמן אמת או פעם בכמה זמן).

דוגמא 3: ה-data scientist יוצר מודל Deep Learning שבהינתן קטע טקסט מזהה את השפה ומתרגם את הקטע לאנגלית (או לג'יבריש, אותו כסף :)

דוגמא 4: ה-data scientist יוצר מודל שמזהה מאפייני גלישה של משתמשים נורמטביים ומתריע ברגע שהסיכוי לאנושיות נורמטיבית נמוך מסף מסויים (חשש לבוט).

כשאני צריך להסביר מה אני עושה אני מתאים את התשובה לידע של השואל. לפעמים אני עונה "מלמד מחשבים איך ללמוד בעצמם", בידיעה שזה מה שיעבור להם בראש, לפעמים "בינה מלאכותית" ולפעמים "מתכנת מחשבים".
לא הבנתי 700999
בקיצור, מהנדס אלגוריתמים בתחום של למידה ממוחשבת.
או יותר בקיצור, אלגוריתמאי למידה ממוחשבת,ML algorithms engineer בלעז.
לא הבנתי 701006
אלא שהרבה פעמים data scientists לא עושים שום דבר שדומה להנדסת אלגוריתמים. לעיתים קרובות (אולי בדרך כלל) העבודה שלהם כוללת בעיקר ניתוח נתונים ובניית מודלים (מתמטיים וסטטיסטיים) סביבם. לפעמים הם אפילו מתכננים ועורכים ניסויים. דווקא די סביר לתאר עבודה כזו כ-"מדע".

בכל מקרה, כנראה שעם הזמן תעמיק הדיפרנציאציה בין סוגים שונים של data science, והתיחום בין תת-ההתמחויות השונות יעבור סטנדרטיזציה שתביא עימה אוסף חדש של titles מעצבנים. יש למה לחכות.
לא הבנתי 701008
בתור אלגוריתמאי מזה לא-נעים-להודות-כמה-שנים, חלק ניכר וקריטי מעבודתי הוא ניתוח נתונים, בניית מודלים (צתמטיים, פיזיקליים וסטטיסטיים), וגם ערכית ניסויים במערכות שונות כדי לבחון התאמה למודלים הנ''ל.
אני מאד מוחמא מלהתקרא ''מדען'', אבל בכל זאת...
לא הבנתי 701009
**אני מודע לזה שיש אמביגיואיטי נפוץ שמאחד תחתיו 'אלגוריתמאים', שחלק ממה שמבדיל בין שתי הקבוצות זה שאחת מהן יודעת לעשות אלגוריתמים על גרף והשנייה יודעת לייצר גרפים בפייתון או Matlab (אבל יודעת לעשות FFT וטרנספורמציות, נניח).
לא הבנתי 701028
כמה הצעות:
כוהן נתונים - data priest
שר נתונים - data lord
גנן נתונים - data gardner
לא הבנתי 701010
החלק של ה-data הוא מרכיב גדול, בעיקר כשמדובר בסביבה רבת נתונים, רבת משתנים, לעיתים כאוטית. כל הסיפור של איסוף נתונים, ארגון, חיבור מקורות מידע, ניקוי ועיבוי נתונים, הבנה של הנתונים בהקשר של הנושא הנבדק, סינון ובחירה של נתונים רלוונטיים וכו'.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים