Data Science זה ענף אשר עוסק בכל מיני תהליכים מתקדמים ומחקר מעמיק ליצירה של הידע מתוך המידע. ההגדרה הפשוטה הזאת שנויה מאוד במחלוקת, בגלל שהיא מתאימה גם לתחום אשר קשור אל ה- BI וגם אל תחום ה- Data Analysis. אז מה בעצם ההבדל?
קשה מאוד לענות במסגרת של הגדרה קצרה. אך המהות היא החשובה באמת, אנחנו אוספים את המידע ומפיקים את התובנות מן המידע הזה.
בגדול, כל בעיה של Data Science מתחילה קודם כל דרך ההבנה הכוללת של הבעיה ויש לנו המון סוגים שונים של בעיות.
מיהו ה- Data Scientist?
מקצוע מדען הנתונים עבר המון גלגולים בכל השנים האחרונות והיום, אין לו הגדרה חד משמעית בדיוק למהו או מיהו בכלל ה – Data Scientist. באופן מסורתי, הדור הראשון של כל אנשי ה- Data Science היו בעיקר מתמטיקאים וסטטיסטיקאים, אנשים בעלי דוקטורט אשר הגיעו לאחר מחקר מאוד רציני באקדמיה, אשר הכירו באופן מעמיק למדי את כל האלגוריתמים, ידעו כמובן לכתוב אותם, אבל לא ממש ידעו איך להשתמש בהם כאשר מדובר על דאטה ארגוני ולא נטו על התחום המחקרי האקדמי.
הדור השני התרחב לדור של המון מהנדסים בעלי רקע מקיף במתמטיקה, אנשים אשר למדו את הנושא הנ"ל באוניברסיטה והם החלו להתעסק בתחום לאחר מכן. לאנשים האלה יש יכולות תכנות מעולות ובד”כ והם מגיעים, בנוסף, עם רקע מקיף ברמות שהן שונות בסטטיסטיקה, לרוב מתואר שני.
הקשר בין מדען נתונים לבין ביג דאטה
הרבה מאוד אנשים מבלבלים בין התחומים הללו, אבל התשובה האמיתית היא שאין שום קשר בין השניים. Data Science עוסק במחקרים רבים על נתונים בשביל להפיק את התובנות העסקיות. הביג דאטה הוא תחום אשר מתאר את הכמויות של הדאטה והסוג של הדאטה. לכן התהליכים של ה – Machine Learning יכולים לרוץ בכל סוג של ארגון ולא רק בתוך הביג דאטה.
שלב הבנת הבעיה של מדען נתונים
לצורך ההמחשה של ההסבר אנחנו ניקח לדוגמא קביעת מחיר של דירה. השלב הראשון ממנו מתחיל כל הפרויקט הוא בעצם הבנת הצורך והמהות של הבעיה עצמה.
יש המון בעיות פשוטות ומורכבות יותר וכל סוג של בעיה יגדיר בעצם את השלבים של העבודה הבאים. הצורך שיש במקרה שלנו, זה לחזות את המחיר של הדירה עם הנתונים הספציפיים.
אם ויש לנו מחירים של מרבית הדירות בכל הסביבה ואנחנו נרצה לחזות את המחיר של הדירה הספציפית, נסתכל על כל המחירים של הדירות בבניין, ואז אנחנו נפעיל מודל פשוט של חישובים ממוצעים של כלל מחירי הדירות אשר השגנו. אנחנו נרצה לחזות את המחיר של הדירה על סמך המון שיקולים נוספים וביצוע ניתוח יותר מעמיק.