انبار داده چیست و چه تفاوتی با پایگاه داده، دریاچه داده (Data Lake) و دادهگاه (Data Mart) دارد؟


بد نیست پیش از هر چیز به معرفی و توضیح مفهوم انبار داده بپردازیم. انبار داده (Data warehouse) مخزن اصلی اطلاعات است و میتوان از تحلیل آن برای تصمیمگیریهای آگاهانهتر استفاده کرد. دادهها به طور معمول در دورههای منظم از سیستمهای تراکنشی (Transactional information systems)، پایگاههای داده رابطهای (Relational databases) و دیگر منابع وارد یک انبار داده میشوند. تحلیلگران کسبوکار، دانشمندان داده و تصمیم گیران سازمانی از طریق ابزارهای هوش تجاری، کلاینتهای SQL و دیگر برنامههای تحلیلی به دادهها دسترسی مییابند.
اینک دادهها و روشهای تحلیلی برای ماندن کسبوکارها در عرصه رقابت به جزئی ضروری تبدیل شدهاند. کسبوکارها از گزارشها، داشبوردها و ابزارهای تحلیلی برای استخراج بینشهایی از دادههای خود، نظارت بر عملکرد کسبوکار و پشتیبانی از تصمیمگیریها بهره میگیرند. این گزارشها، داشبوردها و ابزارهای تحلیلی از انبارهای داده بهره میگیرند تا دادهها را به طرز مؤثری برای بهینهسازی ورودی/خروجی و ارائه نتایج کوئری در سرعتهای بسیار بالا به صدها و هزاران کاربر همزمان تحویل دهند.
معماری انبار داده
معماری انبار داده شامل سه سطح است. در سطح تحتانی معماری، سرور پایگاه داده قرار دارد که دادهها در آن بارگذاری و ذخیره میشوند. سطح میانی شامل موتور تحلیلی است که برای دسترسی و تحلیل دادهها استفاده میشود. سطح فوقانی کلاینت فرانتاند است که نتایج را از طریق ابزارهای گزارشگیری، تحلیلی و دادهکاوی ارائه میکند.
انبار داده چگونه عمل میکند؟
انبار داده با سازماندهی دادهها در یک شِما عمل میکند. این شِما طرح کلی و نوع دادهها مانند عدد صحیح (integer)، فیلد داده (data field) یا رشته (string) را تعیین میکند. وقتی دادهها تحلیل شدند در جداول مختلف که توسط شِما توصیف شدهاند، ذخیره میشوند. ابزارهای کوئری از شِما برای تعیین این که باید به کدام جداول دسترسی داشته باشند و تحلیل کنند، استفاده میکنند.
مزیتهای انبار داده
مزیتهای انبار داده به صورت زیر هستند:
- تصمیمگیری بهتر
- انسجام دادهها از منابع مختلف
- کیفیت، انسجام و دقت داده
- هوش تاریخی (سوابق)
- جداسازی پردازش تحلیل از پایگاههای داده تراکنشی و بهبود عملکرد هر دو سیستم.
انبار داده در برابر پایگاه داده
یک انبار داده به طور خاص برای تحلیل داده طراحی شده و در آن مقادیر بالایی از دادهها برای درک روابط و روندهای دادهها بررسی میشود.
یک پایگاه داده برای گردآوری و ذخیرهسازی دادهایی مانند ثبت جزییات یک تراکنش استفاده میشود.
[table id=9 /]
انبار داده در برابر دریاچه داده
دریاچه داده (Data lake) برخلاف یک انبار داده یک مخزن متمرکز از همه دادهها است که دادههای ساختیافته و ساختنیافته را شامل میشود. انبار داده از شِماهای از پیش تعریفشده بهره میگیرد که برای روشهای تحلیلی بهینهسازی شدهاند. در یک دریاچه داده، شِما تعریف نشده است و امکان انواع دیگری از تحلیلها مانند تحلیلهای کلانداده، جستجوی تمام متن، تحلیلهای همزمان و یادگیری ماشین را فراهم میسازد.
[table id=10 /]
انبار داده در برابر دادهگاه
دادهگاه (Data mart) یک انبار داده است که در جهت رفع نیازهای یک تیم خاص یا واحد کسبوکار مشخص مانند بخش مالی، بازاریابی یا فروش ایجاد شده است. دادهگاه، کوچکتر و متمرکز است و ممکن است شامل خلاصهای از دادههایی باشد که به بهترین وجه نیازهای کاربران خود را رفع میکند.
[table id=11 /]
اگر این نوشته مورد توجه شما قرار گرفته است، پیشنهاد میکنیم موارد زیر را نیز ملاحظه کنید:
- دادهکاوی چیست؟ بخش اول: مبانی
- انواع ویژگی ها (خصیصه ها) و مفهوم بردار ویژگی در داده کاوی
- پایگاه داده و سیستم های مدیریت اطلاعات
- داده کاوی — آشنایی با مفهوم نمونه و ویژگی
- آموزش آماده سازی داده ها برای تحلیل آماری در SPSS
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- MongoDB چیست؟ — راهنمای شروع با دیتابیس مانگو دی بی
==