معرفی Data Science با توضیحی فوق العاده ساده

هر صنعت و سازمانی در حال تغییر و تحول دیجیتالیست. چه در حوزه موسسات دولتی چه حتی کشاورزی داده‌ها یکی از مهمترین کالاها هستند. به طور مثال سنسورها در ماشین‌آلات، سیستم‌های انرژی و حتی وسایل نقلیه تعداد زیادی پارامتر را که حاوی اطلاعات ارزشمند هستند را ضبط و نگهداری میکنند. در این بین؛ فعالان حوزه فناوری‌های دیجیتال برای کشف عوامل موثر بر پدیده‌ها، داده‌ها را تجزیه‌وتحلیل می‌کنند که منجر به کشف عوامل موثر بر بسیاری از پدیده‌ها و همینطور معرفی علومی تازه مانند علم داده (Data Scientist) می‌شود. علم داده مقادیر بسیار بزرگ و پیچیده‌ای از داده را به بینش‌های ارزشمند تبدیل می‌کند.

بنابراین؛ شرکت‌های داده محور با ارزش افزوده‌ای که ایجاد میکنند؛ یک مزیت رقابتی آشکار را به دست می‌آورند. گروه مشاورین AccBI با تجربه و تخصص داده‌های شما را به طلا تبدیل میکنند.

تاریخچه علم داده

قدمت این علم به بیش از یک دهه می‌رسد و دانشمندان زیادی به نام‌های مختلف از آن یاد میکردند ولی اولین کسی که این اصطلاح را در سال 2001 ثبت کرد ویلیام کلیولند (William S. Cleveland) بود. او با توجه به این که مهندسین کامپیوتر نمی‌توانند به خوبی با داده‌ها کار کنند و هم چنین متخصصین آمار هم دانش محاسباتی محدودی دارند؛ خواستار ادغام این دو رشته، تحت عنوان متخصصین علم داده شد.

مهارت‌های دانشمند علم داده

غالبا افرادی که با داده‌ها و تجزیه و تحلی آماری درگیر هستند را با نام دانشمند داده میشناسیم. ولی اگر یکی از آن ها را ملاقات کنید، بعید نیست که او را کت و شلوار پوشیده در یک آزمایشگاه ملاقات کنید. و حتی دفتر کارشان شامل یک میز کامپیوتر است و نه تعداد بسیار زیادی نیمکت همراه با آلات ابزار دقیق. پس آیا واقعا آن‌هادانشمند هستند؟ یا  نام «علم داده» تنها کلمه ایست که باعث می‌شود آن‌ها ارزش بیشتری از آنچه که هستند داشته باشند؟

به دلیل میان رشته‌ای بودن علم داده، علاوه بر تسلط به علوم کامپیوتر، اطلاعات، ریاضیات و آمار باید در سایر حوزه‌های فنی نیز از مهارت کافی برخوردار باشند تا مسائل پیچیده حوزه داده را حل کنند. بنابراین؛ فردی که اطلاعات را جمع‌آوری و تحلیل می‌کند و از آن برای افزایش دانش خود استفاده می‌کند ، یک دانشمند اطلاعات است.

در اینجا برخی از مهارت‌های علم داده را به اختصار معرفی کرده‌ایم:

  • توانایی استخراج معانی مختلف داده‌ها و تفسیر هر کدام به تنهایی
  • توانایی مدیریت ورودی بی‌وقفه اطلاعات با سخت‌افزارهای پیش‌رو
  • کمبودهای نرم‌افزاری و ضعیف بودن پهنای باند
  • ترکیب منابع با یکدیگر
  • تعهد ثبات مجموعه‌های داده
  • تصویرسازی داده‌ها برای فهم بیشتر
  • طراحی مدل‌های ریاضی و آماری با استفاده از نمودارها و گروه‌بندی هر کدام
  • قیاس‌های آماری و انتخاب مدل برتر
  • ارائه نتایج برتر و دیدگاه‌های اصلی با مخاطبین عام و متخصصین سایر علوم

برای یادگیری علم داده باید از کجا شروع کنیم؟

همان طور که در پاراگراف‌های قبلی اشاره شد؛ برای کسب دانش علم داد بایستی علاوه بر فراگیری تخصص های لازم، چندین توانایی و مهارت را نیز داشته باشید. سعی کنید برای کسب تخصص علم داده، این سه راه کار را فراموش نکنید:

  1. در یکی از رشته‌های علوم کامپیوتر، فیزیک، مهندسی صنایع، ریاضی، فناوری اطلاعات یا مدیریت، لیسانس، فوق لیسانس یا دکتری بگیرید.
  2. دریافت مدرک معتبر در زمینه علوم داده یا رشته مرتبط
  3. کسب تخصص و مهارت لازم در زمینه‌ای که می‌خواهید در آن فعالیت کنید

بررسی مزایای علم داده در سازمان‌ها

هر سازمان با توجه به رسالت و هدف اصلی که دنبال می‌کند می‌تواند در زمینه‌های مختلفی از این رشته استفاده کند، مثلا اگر سازمان نیازمند استخدام افراد جدید است، می‌تواند با کمک متخصص علم داده به پردازش اطلاعات موجود بپردازد و باتوجه به پارامترهایی که نیاز است، بهترین گزینه برای شغل مورد نظر را انتخاب کنند.

سرمایه‌گذاری شرکت‌ها در زمینه علم داده باعث می‌شود مدیران با توجه به تجزیه‌وتحلیل داده‌ها، بهترین تصمیم‌ را در هر زمینه بگیرند که این امر خود موجب موفقیت شرکت شده و بر نرخ بازگشت سرمایه (ROI) تاثیر زیادی می‌گذارد.

کاربرد علم داده در ایران

به دلیل قدمت بسیار کم این رشته نسبت به علوم پایه مانند کامپیوتر، مهندسی، فنی و …فضای مناسبی برای استفاده بهینه از آن، در کشورهای درحال‌توسعه (مانند ایران) وجود ندارد. همچنین وجود نداشتن افراد متخصص و خبره که در صنعت مشغول به کار باشند از نقاط ضعف این حوزه به شمار می‌آید؛ چون بیشتر این افراد در مراکز تحقیقاتی یا هیئت علمی دانشگاه‌ها جذب شده‌اند.

با این وجود؛ اولین مرکز پژوهشی که در حوزه علم داده فعالیت میکند در دانشگاه شهیدبهشتی تهران راه‌اندازی شد که هم‌اکنون در مقطع فوق‌لیسانس نیز دانشجو می‌پذیرد. البته دانشگاه تهران نیز این موضوع را به صورت حرفه‌ای دنبال میکند.

تفاوت بین داده کاوی و علم داده

همان طور که گفتیم علم داده علمیست میان رشته‌ای که از ریاضی و آمار و مهندسی و غیره تشکیل شده است؛ ولی داده کاوی از بانک‌های اطلاعاتی با حجم بالا، اطلاعات مفید و کارآمد را پیدا می‌کند که برای الگوهای آینده و شناسایی آن‌ها به کار می‌رود.

  1. علم داده با اطلاعات ساختار یافته، نیمه ساختاریافته و بدون ساختار مرتبط است ولی داده کاوی از داده‌های اکثرا ساختار یافته استفاده می‌کند.
  2. هدف علم داده ساختن محصولات بر مبنای داده‌ها برای سازمان‌هاست ولی هدف داده کاوی تمرکز برای قابل استفاده‌تر کردن اطلاعات است.
  3. تمرکز علم داده، بیشتر بر روی مطالعه علمی است ولی داده کاوی بر روی فرایند کاری تمرکز می‌کند.
  4. در علم داده فرد باید دارای مهارت های زیادی مانند برنامه نویسی، دانش گرافیک و مهارت‌های یادگیری ماشین باشد ولی در داده کاوی فرد با داشتن دانش آمار و جست‌وجو می‌تواند وظیفه‌ی خود را به خوبی انجام دهد.
  5. داده کاوی زیر مجموعه‌ی علم داده است و بر مبنای فرایندهای کاری قرار دارد ولی علم داده براساس علم و رشته است.
  6. خروجی علم داده متنوع است ولی خروجی داده کاوی الگوها و نمونه هاست.