معرفی مشاغل داده محور – راهنمای کاربردی


با پر رنگ شدن زمینههای «دادهمحور» (Data Driven)، از تصمیمگیری گرفته تا برنامهنویسی و روزنامهنگاری و رشد چشمگیر مباحث مرتبط با «علم داده» (Data Science)، «هوش مصنوعی» (Artificial Intelligence) و «یادگیری ماشین» (Machine Learning)، نقشهای گوناگونی نیز ایجاد شدهاند که از جمله آنها میتوان به «دانشمند داده» (Data Scientist)، «مهندس داده» (Data Engineer)، «مدیر داده» (Data Manager)، «تحلیلگر داده» (Data Analyst)، «معمار داده» (Data Architect) و «مهندس یادگیری ماشین» (Machine Learning Engineer) اشاره کرد. در ادامه هر یک از این نقشها و مهارتهای مورد نیاز آنها شرح داده شدهاند.
«دانشمند داده» (Data Scientist)
دانشمند داده کسی است که دانش خوبی در حوزه آمار و احتمال و ریاضیات دارد. تخصص دانشمند داده در یک زمینه خاص، او را به یک تحلیلگر ذاتی در آن زمینه مبدل میکند. دانشمند داده برنامهنویسی میداند و دانش قابل توجهی پیرامون مدلسازی در «یادگیری ماشین» (Machine Learning) و «هوش مصنوعی» (Artificial Intelligence) دارد.
یک دانشمند داده دارای «دانش دامنه» (Domain Knowledge) و بینیش کسبوکاری است که موجب میشود بتواند به سازمان در رسیدن به موفقیت کمک کند.
دانشمند داده به تعریف فرضیهها، آزمودن تناسب دادهها و هدف، بررسی مسائل مربوط با گردآوری داده، ساخت نمونههای اولیه، آموزش و تنظیم مدل، مستندسازی و تشریح نتایج میپردازد. همچنین، توانایی برقرار کردن تعامل بصری و شفاهی میان بینش کسب شده از دادهها با افراد درگیر پروژه شامل رهبران تیم، ذینفعان کسبوکار و سایر افراد را دارد.
«مهندس داده» (Data Engineer)
یک مهندس داده، بیشتر برنامهنویسی است که بر زبانهایی مانند «پایتون» (Python)، «جاوا» (Java) و «اسکالا» (Scala) مسلط است. همچنین، در کار با «سیستمهای توزیع شده» (Distributed Systems) برای تحلیل حجم بالای دادهها و در واقع «کلان داده» (Big Data | مَهداده) تسلط دارد. مهندس داده معمولا مسئول ساخت مراحل مربوط به جریان آزاد دادهها است که طی آن از فناوریهای کلانداده برای انجام تحلیلهای داده «زمان واقعی» (Real Time) و یا آماری استفاده میشود.
مهندس داده در تیمی کار میکند که ابزارهای پردازش داده در سطح تولید میسازند. مهندسهای داده بر مولفهها و پلتفرمهای پشتیبانی شده قابل استفاده مجدد متمرکز میشود و علاقه زیادی به جریانهای داده، «استخراج، تبدیل و بارگذاری دادهها» (Extract, Transform and Load Data | ETL) و یکپارچهسازی سیستمها دارند. اینها در واقع فعالیتهایی هستند که مدلهای ساخته شده توسط دانشمند داده را به یک سیستم تولیدی مبدل میکنند. مهندسان داده به سختی برای ساخت جریانهای داده هوش تجاری و نظارت بر کارایی و همچنین «انبار داده» (Data Warehouse) تلاش میکنند.
هم دانشمند داده و هم مهندس داده از مجموعه مهارتهای مشابهی بهره میبرند. در واقع، هر دو آنها با کلان داده کار میکنند، هر دو برنامهنویسی میدانند و هر دو با چگونگی تحلیل دادهها آشنا هستند. با این وجود، دانشمند داده بیشتر یک تحلیلگر خوب محسوب میشود تا برنامهنویس، در حالیکه مهندس داده دقیقا بالعکس این امر است و بیشتر یک برنامهنویس خوب به شمار میآید تا تحلیلگر داده. هر دو نقش بیان شده، مکمل هم هستند نه جایگزین یکدیگر، و هنگامی که در پروژههایی با یکدیگر همکاری کنند میتوانند به خوبی یک تیم قدرتمند را تشکیل بدهند.
مهندس یادگیری ماشین (Machine Learning Engineer)
با رشد یادگیری ماشین و هوش مصنوعی، یک نقش شغلی جدید شکل گرفت، که «مهندس یادگیری ماشین» نام دارد. این نقش، جایگاهی در میان دانشمند داده و مهندس داده دارد. صاحب این نقش در واقع دانشمند داده و مهندس دادهای است که در نقاط ضعف این نقشها قوی است.
یک مهندس یادگیری ماشین، دانشمند دادهای با مهارتهای برنامهنویسی قویتر یا مهندس دادهای با مهارتهای تحلیل بهتر محسوب میشود. با این وجود، مهندس یادگیری ماشین نیز همچنان در یکی از این مهارتها بهتر عمل میکند.
مهندس یادگیری ماشین مسئول بهینهسازی برنامهها و سیستمها برای یادگیری ماشین است. این نقش یکی از نقشهایی است که اخیرا به لیست بلند بالای متخصصان داده شامل «مدیر داده» (Data Manager)، «تحلیلگر داده» (Data Analyst) و «معمار داده» (Data Architecture) اضافه شده است. مهندس یادگیری ماشین معمولا فردی در تیم علم داده محسوب میشود که مشخصا روی یک نوع خاص از یادگیری ماشین، روشها و ابزارهای آن تمرکز کرده است و به طور بالقوه برای ساخت نوع جدیدی از مدلها در حال تحقیق و توسعه است. شایان توجه است که این موضوع ممکن است به نوع خاصی از دادهها یا الگوریتمها مانند «مهندس الگوریتمهای گراف» (Graph Algorithms Engineer)، «مهندس یادگیری عمیق» (Deep Learning Engineer)، «مهندس پردازش زبان طبیعی» (Natural Language Processing Engineer) و دیگر موارد مربوط شود.
مدیر داده (Data Manager)
مدیر داده، یک نقش مدیریتی است که روی حصول اطمینان از عملیات کارآمد و موثر و استفاده از دادهها متمرکز شده است. این نقش، همچون رابطی برای دیگر گروههای شریک تحویل سرویس عمل میکند (برای مثال، سیستمهای کسبوکار، مرکز داده)، و مسئول حصول اطمینان از یکپارچهسازی موثر فرآیند مدیریت داده با دیگر فرآیندها به منظور تامین خواستههای سطح سرویس است.
مدیر داده در قبال «مالک فرآیند داده» (Data Process Owner) مسئول است. از جمله مسئولیتهای مدیر داده میتوان به مدیریت پیادهسازی موثر فرآیند تهیه نسخه پشتیبان و بازیابی اطلاعات، ایجاد تغییر و ارتقای استانداردها، روالها و فناوریهای تهیه نسخه پشتیبان، تعیین گزارشهایی که باید تهیه شوند و برنامه ارائه گزارشها اشاره کرد.
معمار داده (Data Architect)
یک معمار داده مسئول طراحی، ساخت، استقرار و مدیریت معماری داده یک سازمان است. معمار داده چگونگی ذخیرهسازی، مصرف، یکپارچهسازی و مدیریت دادهها توسط موجودیتهای داده و سیستمهای IT گوناگون را تعیین میکند. یک معمار داده در گام اول اطمینان حاصل میکند که سازمان یک استاندارد داده رسمی را مورد استفاده قرار میدهد و داراییهای داده آن در جهت معماری داده تعریف شده و اهداف کسبوکار قرار دارند.
معمولا یک معمار داده بر مدیریت دادهها نظارت داشته، پایگاه داده و دیگر منابع داده را بهینه میکند و کارهای متعدد دیگری را در این حوزه انجام میدهد.
تحلیلگر داده (Data Analyst)
تحلیلگر داده، دادهها را تفسیر و آنها را به اطلاعات تبدیل میکند و بر همین اساس راههایی را برای بهبود کسبوکار ارائه میکند. تحلیلگر داده اطلاعات را از منابع گوناگون گردآوری کرده و الگوها و گرایشهای موجود در آنها مورد تحلیل قرار میدهد. هنگامی که دادهها گردآوری و تفسیر شدند، تحلیلگر داده آنچه را در یک مطالعه جامع کشف شده به همکاران کسبوکاری یا دیگر افراد مربوطه گزارش میدهد.
تحلیلگر داده اغلب پیشنهادهایی پیرامون روشها و راهکارهای مورد استفادهای دارد که سازمان را قادر به بهبود کیفیت و کارایی سیستم داده میسازد. تحلیلگر داده باید تواناییهای زیر را داشته باشد. البته شرایط بیان شده در زیر، همه موارد مورد نیاز نیستند، بلکه برخی از مهمترینها محسوب میشوند.
- گردآوری و تفسیر دادهها
- تحلیل نتایج
- گزارش دادن نتایج به شرکا و ذینفعان پروژه
- شناسایی الگوها و گرایشها در مجموعه داده
- کار کردن با تیم کسبوکار و یا تیم مدیریتی به منظور تامین نیازهای کسبوکار
تحلیلگر داده نیاز به دانستن ریاضیات، علوم کامپیوتر، آمار و احتمال و اقتصاد دارد. همچنین، مواردی نیز وجود دارد که از دانشمند داده انتظار میرود به آنها مسلط باشد و از این جمله میتوان به توانایی تحلیل مجموعه دادههای بزرگ، تجربه در ساخت مدلهای داده، توانایی نوشتن گزارشهای جامع، مهارتهای ارتباطی نوشتاری و شفاهی قوی، توجه به جزئیات و همچنین بهرهمندی از ذهن تحلیلی اشاره کرد.
اگر نوشته بالا برای شما مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشود:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- مجموعه آموزشهای شبکههای عصبی مصنوعی
- مجموعه آموزشهای هوش محاسباتی
- مجموعه آموزشهای برنامه نویسی پایتون (Python)
- آموزش برنامهنویسی R و نرمافزار R Studio
- مجموعه آموزشهای برنامه نویسی متلب (MATLAB)
^^