انواع پایگاه داده چیست؟ + کاربرد و معرفی منابع یادگیری
امروزه، با رشد روزافزون دادهها و پررنگتر شدن نقش آنها در زندگی بشر، نیاز است روشهای ذخیره و بازیابی اطلاعات به صورت سریع و قابل اطمینان کار کنند. یکی از این روشها استفاده از بانکهای اطلاعاتی (Databaseها | پایگاههای داده) به حساب میآید. در طول سالهای اخیر، فناوری پایگاه داده تغییر کرده و به تکامل زیادی رسیده است. از این رو، لازم است پیش از انتخاب یک سیستم پایگاه داده، آشنایی کافی با انواع پایگاه داده به دست آید. در این مقاله انواع پایگاه داده و ویژگیهای آنها به طور مفصل مورد بررسی قرار میگیرند. اما پیش از آن که به انواع پایگاه داده و سایر مفاهیم مربوطه پرداخته شود، ابتدا باید به این سوال پاسخ داد که اساساً پایگاه داده چیست و به چه معنا است؟ بنابراین، در ادامه به چیستی پایگاه داده یا همان دیتابیس پرداخته میشود.
پایگاه داده چیست ؟
«پایگاه داده» (Database) یک مجموعه سیستماتیک از دادهها است که در آن امکان ذخیرهسازی الکترونیکی و دستکاری دادهها وجود دارد. به واسطه استفاده از پایگاه داده، مدیریت و رسیدگی به دادهها تسهیل مییابد. برای درک بهتر مفاهیم مربوط به پایگاه داده، لازم است یک مثال از کاربرد آن عنوان شود. برای مثال، در یک دفترچه تلفن آنلاین، به منظور ذخیره دیتای افراد، شماره تلفن و سایر جزییات تماس آنها، از پایگاه داده استفاده میشود.
پایگاه داده برای اعمالی مانند مدیریت صورتحساب، مسائل مربوط به مشتری، رسیدگی به دادههای خطا و سایر موارد توسط شرکت توزیع نیروی برق به کار میرود. علاوه بر این، در شرکت فیسبوک از پایگاه داده برای ذخیرهسازی، دستکاری و ارائه دادههای مربوط به اعضا، دوستان آنها، فعالیتهای اعضا، پیامها، تبلیغات و بسیاری موارد دیگر استفاده میشود. بدین ترتیب، میتوان به مثالهای بیشماری از موارد استفاده از پایگاه داده اشاره کرد. اکنون در ادامه به برخی از مزیتهای پایگاه داده پرداخته میشود.
مزایای پایگاه داده
برخی از مزیتهای پایگاه داده به شرح زیر است.
کاهش افزونگی (Redundancy) دادهها
سیستمهای مدیریت دادهها مبتنی بر فایل طراحی میشوند و هر یک از آنها حاوی چندین فایل است که در مکانهای مختلف یعنی، در یک سیستم یا حتی در چندین سیستم ذخیره خواهند شد. به همین دلیل، در برخی از مواقع چندین نسخه از یک فایل وجود دارد که منجر به ایجاد مسئله «افزونگی دادهها» میشود. در صورت استفاده از پایگاه داده، از مسئله افزونگی دادهها جلوگیری خواهد شد. چرا که در چنین شرایطی تنها یک پایگاه داده واحد وجود دارد و در صورت ایجاد تغییر در آن، این دگرگونیها به طور سریع و بدون وقفه در کل ساختار اعمال میشوند. به همین دلیل، بر خلاف سیستمهای مدیریت داده مبتنی بر فایل، در پایگاه داده احتمال مواجه شدن با دادههای تکراری تقریباً به صفر میرسد.
امکان به اشتراکگذاری دادهها
در یک پایگاه داده، کاربران میتوانند دادهها را بین خود به اشتراک بگذارند. البته باید توجه کرد که مجوز دسترسی به دادهها در سطوح مختلفی وجود دارد و به دنبال آن، به اشتراکگذاری دادهها تنها بر اساس پروتکلهای مجوز صحیح امکانپذیر است. علاوه بر این، بسیاری از کاربران راه دور نیز میتوانند به طور همزمان به پایگاه داده دسترسی داشته باشند و دادهها را بین خود به اشتراک بگذارند.
افزایش یکپارچگی دادهها و استقلال از برنامههای کاربردی
یکپارچگی دادهها به پردازشهایی اطلاق میشود که جهت ترکیب کردن دادهها از منابع مختلف با هدف ارائه دادههایی متحد با نمایی واحد در پایگاه داده به کار گرفته میشوند. یکپارچگی دادهها بسیار مهم است چرا که، پایگاه دادههای متعددی در یک سیستم مدیریت پایگاه داده وجود دارند و تمام این دیتابیسها حاوی دادههایی هستند که برای چندین کاربر قابل مشاهدهاند. به همین دلیل، لازم است اطمینان حاصل شود که صحت و یکپارچگی دادهها در کلیه بانکهای اطلاعاتی برای همه کاربران حفظ میشود.
بهبود امنیت دادهها
امنیت داده مفهومی حیاتی و پراهمیت در پایگاه داده است. در حقیقت، ضرورت دارد تنها کاربران مجاز امکان دسترسی به پایگاه داده را داشته باشند. بدین منظور، باید فرآیند احراز هویت آنها با استفاده از نام کاربری و رمز عبور احراز شود. کاربران غیرمجاز نباید تحت هیچ شرایطی اجازه دسترسی به پایگاه داده را داشته باشند، چرا که در این شرایط محدودیتهای تمامیت و صحت دادهها نقض میشوند.
کاهش هزینههای ورود، ذخیرهسازی و بازیابی دادهها
در سیستم مدیریت پایگاه داده پشتیبانگیری (Backup) و بازیابی به طور خودکار انجام میشوند و کاربران نیازی به بکآپ گیری دورهای از دادهها ندارند. در حقیقت، هر دو فرآیند پشتیبانی و بازیابی دادهها توسط سیستم مدیریت پایگاه داده (DBMS) انجام میشوند. علاوه بر این، در صورت لزوم، پس از خرابی یا بروز مشکل در سیستم، امکان بازیابی شرایط قبلی آن وجود دارد.
تسهیل فرآیند انتقال دادهها
سیستم مدیریت پایگاه داده این امکان را ایجاد میکند که کاربران از مزیت دادههای مدیریت شده به بهترین شکل بهرهمند شوند. در همین راستا، کاربران نهایی میتوانند به راحتی و با نگاهی سریع، در مورد تغییرات یا انتقالهای انجام شده در پایگاه داده نظر دهند.
تصمیمگیری عاقلانه
با امکان استفاده از سیستمهای مدیریت پایگاه داده، رسیدگی به دادهها و دسترسی به آنها به بهترین نحوه ممکن انجام میشود. به همین دلیل، میتوان اطلاعات را با کیفیت بهتری تولید کرد و تصمیمات بهتری گرفت. به بیان ساده، با استفاده از پایگاه داده، کیفیت دادهها، دقت، اعتبار و زمان لازم برای خواندن دادهها بهبود مییابند. البته باید توجه کرد که DBMS یا همان سیستمهای پایگاه داده، کیفیت دادهها را تضمین نمیکنند، بلکه به عنوان یک چارچوب برای بهبود کیفیت دیتا استفاده میشوند.
معایب پایگاه داده
- پیچیدگی و زمانبر بودن طراحی سیستمهای پایگاه داده
- هزینههای قابل توجه راهاندازی سختافزاری و نرمافزاری
- الزام ارائه آموزشهای اولیه به کاربران
تا این بخش از مقاله، به تعدادی از مزیتها پراهمیت و کاستیهای جزئی اشاره شد. اکنون در ادامه به معرفی انواع پایگاه داده پرداخته شده است.
انواع پایگاه داده کدامند؟
به طور کلی میتوان گفت که انواع مختلفی از پایگاه دادهها از جمله پایگاه داده رابطهای، پایگاه داده NoSQL، پایگاه داده شیگرا و سایر موارد وجود دارد که هر یک به منظور خاصی استفاده میشوند و کاربرد مشخصی دارند. در این بخش از مقاله، انواع پایگاه داده به طور جامع و همراه با جزییات معرفی شدهاند.
- پایگاه داده رابطهای
- پایگاه داده NoSQL
- پایگاه داده مبتنی بر فضای ابری
- پایگاه داده ستونی
- پایگاه داده ستون گسترده
- پایگاه داده شیگرا
- پایگاه داده کلید مقدار
- پایگاه داده سلسله مراتبی
- پایگاه داده گرافی
- پایگاه داده سری زمانی
پایگاه داده رابطهای
پایگاه دادههای رابطهای از دهه ۱۹۷۰ تا به امروز مورد استفاده قرار میگیرند. پایگاه داده رابطهای روشی است که در آن دادهها در چندین جدول مرتبط ذخیره میشوند. درون این جدولها، دادهها در سطرها و ستونهای مختلف قرار دارند. سیستم مدیریت پایگاه داده رابطهای (RDBMS) یک برنامه است که به واسطه آن، امکان ایجاد، بهروزرسانی و مدیریت پایگاه داده رابطهای فراهم میشود.
زبان پرس و جو ساختاریافته (Structured Query Language | SQL) رایجترین زبان برای خواندن، ایجاد، بهروزرسانی و حذف دادهها است. پایگاه داده رابطهای بسیار قابل اعتماد است و در آن، از استاندارد ACID پیروی میشود. منظور از ACID مجموعهای از استانداردها است که با کمک آنها، تراکنشهای پایگاه داده قابلاعتماد خواهند شد. واژه ACID از مفاهیمی همچون اتمی بودن (Atomicity)، سازگاری (Consistency)، جداسازی (Isolation) و دوام (Durability) برگرفته شده است.
علاوه بر نکات مذکور، پایگاه دادههای رابطهای به گونهای طراحی شدهاند که با دادههای ساختاریافته به خوبی کار میکنند. سازمانهایی که دادههای بدون ساختار یا نیمهساختاریافته زیادی دارند، نباید پایگاه داده رابطهای را به عنوان یک گزینه مناسب در نظر بگیرند. از جمله مثالهای پایگاه داده رابطهای میتوان به Microsoft SQL Server، پایگاه داده اوراکل، MySQL، پایگاه داده PostgreSQL و IBM Db2 اشاره کرد. اکنون برای آشنایی بیشتر با پایگاه دادههای رابطهای در ادامه به شرح مزایای این نوع از انواع پایگاه داده اشاره شده است.
مزیتهای پایگاه داده رابطهای
اکنون برای آشنایی بیشتر با پایگاه دادههای رابطهای، در ادامه به شرح مزایای این نوع از انواع پایگاه داده اشاره شده است. یکی از مزیتهای اصلی استفاده از پایگاه داده رابطهای این است که این نوع پایگاه داده به کاربر این امکان را میدهد تا به سادگی دادهها را در دستههای مختلف طبقهبندی و حتی بتوان چنین دیتایی را به طور کارآمد ذخیرهسازی کند.
به این ترتیب، با استفاده از کوئریها و فیلترهای بیشتر، بیرون کشیدن دادههای مورد نظر به راحتی امکانپذیر است. پس از ایجاد یک پایگاه داده جدید، میتوان به راحتی مجموعه دادههایی را در پایگاه داده گنجاند که تحت دستهبندیهای مختلف قرار گرفتهاند. لازم به ذکر است که به واسطه استفاده از پایگاه داده رابطهای، این عمل بدون تغییر در سیستم موجود امکانپذیر است.
مزیتهای پایگاه داده رابطهای
علاوه بر نکات مذکور، سیستم پایگاه داده رابطهای مزایای متعدد دیگری نسبت به هر نوع پایگاه داده دیگری دارد. در ادامه به برخی از مزیتهای شاخص پایگاه داده رابطهای اشاره میشود.
سادگی مدل
سیستم پایگاه داده رابطهای سادهترین مدل است، چرا که این پایگاه داده به هیچ ساختار پیچیده یا فرآیندهای پرس و جوی خاصی نیاز ندارد و شامل فرآیندهای معماری خستهکننده از جمله، تعریف یا ساختار پایگاه داده سلسله مراتبی نیست. با توجه به اینکه در این نوع دیتابیس ساختار ساده است، امکان مدیریت آن با کمک کوئریهای ساده SQL وجود دارد و برای طراحی به پرس و جوهای پیچیده نیاز نیست.
دقت دادهها (Data Accuracy)
با استفاده از کلید اصلی (Primary Key) و مفاهیم کلید خارجی (Foreign Key) در پایگاه داده رابطهای، امکان ارائه چندین جدول مرتبط با یکدیگر وجود دارد. این موضوع باعث میشود دادهها تکراری نباشند. به طوری که هیچ گونه شانسی برای تکثیر بلااستفاده از دادهها وجود ندارد. از این رو، دقت دادهها در پایگاه داده رابطهای بیش از هر سیستم پایگاه داده دیگری است.
دسترسی آسان به دادهها
برخلاف برخی از پایگاههای داده که تنها با پیمایش از طریق یک درخت یا یک مدل سلسله مراتبی قابل دسترسی هستند، سیستم پایگاه داده رابطهای، هیچ الگو یا مسیری برای دسترسی به دادهها ندارد. به همین دلیل، هر فردی که به دادهها دسترسی پیدا کند، امکان جستجو هر جدولی در پایگاه داده رابطهای را خواهد داشت. به منظور واکشی دادههای مورد نظر با استفاده از کوئریهای اتصال (Join) و عبارتهای شرطی، میتوان تمام یا تعدادی جداول مرتبط را ترکیب کرد.
در چنین شرایطی، امکان تغییر دادههای حاصل در هر تعداد ستون، بر اساس مقادیر ستونها وجود دارد. به دلیل وجود این ویژگی در پایگاه دادههای رابطهای، کاربران میتوانند به راحتی دادههای مربوطه را به عنوان نتیجه بازیابی کنند. علاوه بر این، با کمک این نوع دیتابیس میتوان ستونهای مورد نظر را برای گنجاندن در نتیجه انتخاب کرد تا فقط دادههای مناسب نمایش داده شوند.
یکپارچکی دادهها
یکپارچگی دادهها یکی از ویژگیهای پراهمیت سیستم پایگاه داده رابطهای است. ورود دادههای پایدار و اعتبارسنجی مشروعیت، این تضمین را ایجاد میکنند که تمام دادههای پایگاه داده به ترتیبات مناسبی محدود شوند و دادههای لازم برای ایجاد روابط وجود داشته باشند. این قابلیت اطمینان رابطهای در میان جداول پایگاه داده، به جلوگیری از ناقص بودن، مجزا بودن یا نامرتبط بودن رکوردها کمک میکند. علاوه بر این، یکپارچگی دادهها به افزایش اطمینان از سایر ویژگیهای مهم پایگاه داده رابطهای از جمله سهولت استفاده، دقت و پایداری دادهها کمک میکند.
انعطافپذیری بالا
سیستم پایگاه داده رابطهای به خودی خود ویژگیهایی دارد که برای ارتقا سطح و تعمیمپذیری کاربرد دارند. این نوع پایگاه داده به گونهای طراحی شده است که ساختار منعطفی دارد. به این ترتیب، میتوان در آن، نیازهایی را برآورده کرد که به طور دائم در حال تغییر هستند. این موضوع منجر به تسهیل اعمالی مانند افزایش حجم دادههای دریافتی، بهروزرسانی و حتی در صورت لزوم، حذف میشود. این مدل به تغییرات انجام شده در پیکربندی یک پایگاه داده تن میدهد و میتوان این تغییرات را بدون بروز مشکل و بدون تخریب دادهها در بخشهای دیگر پایگاه داده اِعمال کرد.
یک تحلیلگر داده (Data Analyst) میتواند جداول، ستونها یا دادههای فردی را در سیستم پایگاه داده ارائه شده به سرعت و به آسانی درج، بهروزرسانی یا حذف کند تا با کمک این اقدامات، نیازهای تجاری برآورده شوند. ظاهراً هیچ مرزی برای تعداد ردیفها، ستونها یا جداول یک پایگاه داده رابطهای وجود ندارد. در موارد استفاده عملی، توسعه و تبدیل توسط سیستم مدیریت پایگاه داده رابطهای و سخت افزار موجود توسط سرورها محدود میشوند. به همین دلیل، ممکن است این تغییرات، باعث ایجاد دگرگونی در سایر دستگاههای کاربردی جانبی شود که متصل به سیستم پایگاه داده رابطهای خاصی هستند.
نرمالسازی (Normalization)
به واسطه نرمالسازی این اطمینان حاصل میشود که در ساختار پایگاه داده رابطهای از هر گونه واریانسی اجتناب شود. چرا که وجود واریانس در ساختار این پایگاههای داده منجر به ایجاد تفاوت در یکپارچگی و دقت جداول میشود. با کمک فرآیند نرمالسازی، مجموعهای از مقررات، ویژگیها و اهدافی ارائه میشوند که برای ساختار دیتابیس و ارزیابی مدل پایگاه داده رابطهای به کار میروند. هدف از فرآیند نرمالسازی، مشاهده کامل سطوح مختلف تجزیه دادهها است.
انتظار میرود قبل از حرکت به سطوح بعدی نرمالسازی، نرمالسازی در سطح مربوطه به طور کامل انجام شود. به بیان ساده، معمولاً در صورتی مدل پایگاه داده رابطهای به عنوان مدل نرمالسازی شده پذیرفته میشود که در آن، شرایط لازم فرم نرمالسازی برآورده شده باشد. نرمالسازی باعث ایجاد اطمینان خاطر در مورد طرح پایگاه داده میشود و با کمک آن، امکان ارائه طرح پایگاه داده قوی و قابل اعتماد وجود دارد.
امنیت بالا
با توجه به اینکه دادهها در میان جداول سیستم پایگاه داده رابطهای تقسیمبندی شدهاند، ممکن است برخی از جدولها به عنوان «محرمانه» برچسبگذاری شده باشند. بر خلاف انواع پایگاه دادههای دیگر، با استفاده سیستم مدیریت پایگاه داده رابطهای میتوان به راحتی چنین جداولی را از سایر آنها تفکیک کرد. هنگامی که تحلیلگران داده سعی میکند با یک نام کاربری و رمز عبور وارد سیستم شود، در پایگاه داده مورد نظر، امکان تعیین مرزبندی خاص برای سطح دسترسی آنها وجود دارد. در حقیقت، در چنین شرایطی، بر اساس سطح دسترسی، ارائه پذیرش فقط برای جداولی صادر میشود که تحلیلگران داده مجاز به کار کردن روی آنها هستند.
قابلیت پشتیبانی از تغییرات مختلف در آینده
با توجه به اینکه در سیستم پایگاه داده رابطهای رکوردها بر اساس دستهبندیها در جداول جداگانه نگهداری میشوند، امکان درج، حذف و بهروزرسانی رکوردهایی ساده میشود که تحت آخرین الزامات هستند. وجود این ویژگی در مدل پایگاه داده رابطهای، نیازمندیهای جدیدی را هموار میکند که توسط یک کسب و کار ارائه میشوند. در حقیقت، بر اساس شرایط ارائهشده، میتوان همگام با حفظ کیفیتهای اساسی سیستم مدیریت پایگاه داده رابطهای، هر تعدادی از جدول یا ستون داده جدید یا موجود را درج یا تغییر داد. تا این بخش از معرفی انواع پایگاه داده به برخی از مزیتهای کلیدی پایگاه داده رابطهای اشاره شد. اکنون در بخش بعدی، تعدادی از دورههای شاخص آموزش پایگاه داده فرادرس به طور مختصر معرفی میشوند.
معرفی فیلم های آموزش پایگاه داده فرادرس
- فیلم آموزش پایگاه دادهها (طول مدت: ۱۰ ساعت و ۱۶ دقیقه، مدرس: سید رضا هاشمیان): این دوره آموزشی برای دانشجویان رشته کامپیوتر و یادگیری اصول درس پایگاه داده مناسب است. برای مشاهده دوره آموزش پایگاه دادهها + کلیک کنید.
- فیلم آموزش مقدماتی PostgreSQL برای مدیریت پایگاه داده (طول مدت: ۲ ساعت و ۴۲ دقیقه، مدرس: محمد وفایی مقدم): در این دوره آموزشی، دستورها و نمودارهای مرتبط با تجزیه-تحلیل و کدنویسی پایگاه داده PostgreSQL به صورت مرحله به مرحله آموزش داده میشوند. برای مشاهده دوره آموزش مقدماتی PostgreSQL برای مدیریت پایگاه داده + کلیک کنید.
- فیلم آموزش پایگاه داده MySQL (طول مدت: ۱۰ ساعت و ۱۶ دقیقه، مدرس: سید رضا هاشمیان): این دوره آموزشی فرادرس برای افرادی مناسب است که میخواهند پایگاه داده MySQL را به طور جامع و کاربردی فرا بگیرند. برای مشاهده دوره آموزش پایگاه داده MySQL + کلیک کنید.
- فیلم آموزش SQL Server - مقدماتی (طول مدت: ۹ ساعت و ۶ دقیقه، مدرس: ضحی شبر): در این دوره از مجموعه فرادرس مفاهیم مقدماتی SQL Server به طور مفصل مورد بررسی قرار میگیرند. برای مشاهده دوره آموزش SQL Server - مقدماتی + کلیک کنید.
- فیلم آموزش مقدماتی Oracle APEX برای تولید و توسعه نرم افزارهای تحت وب (طول مدت: ۸ ساعت و ۲۴ دقیقه، مدرس: سید محمدرضا ایزدی شهرکی): این دوره آموزشی برای آن دسته از برنامه نویسان و توسعه دهندگان وب مناسب است که میخواهند از اوراکل در پروژههای خود استفاده کنند. برای مشاهده دوره آموزش مقدماتی Oracle APEX برای تولید و توسعه نرم افزارهای تحت وب + کلیک کنید.
- فیلم آموزش مقدماتی آپاچی کاساندرا (Apache Cassandra) (طول مدت: ۸ ساعت و ۵۳ دقیقه، مدرس: سعید فضلعلی): این دوره آموزشی برای افرادی مناسب است که قصد یادگیری پایگاه داده کاساندرا را دارند. برای مشاهده دوره آموزش مقدماتی آپاچی کاساندرا (Apache Cassandra) + کلیک کنید.
- برای مشاهده همه فیلمهای آموزش پایگاه داده + کلیک کنید.
تا این بخش از مقاله مزیتهای پایگاه داده رابطهای و همچنین، تعدادی از دورههای آموزشی پایگاه داده فرادرس بررسی شدند. اکنون، به ادامه بررسی انواع پایگاه داده پرداخته میشود.
پایگاه داده NoSQL
پایگاه دادههایی که در آنها از SQL به عنوان زبان اصلی دسترسی به دادهها استفاده نمیشود، جز زیر مجموعه NoSQL هستند. NoSQL مجموعه گستردهای را شامل میشود و گاهی اوقات به این نوع دیتابیسها، پایگاه دادههای غیر رابطهای نیز گفته میشود. برخلاف پایگاه دادههای رابطهای، در NoSQL تطابق میان دادهها با طرح از پیش تعریفشده الزامی و ضروری نیست.
به این ترتیب، این نوع پایگاه دادهها برای سازمانهایی مناسب است که به دنبال ذخیره دادههای بدون ساختار یا نیمه ساختاریافته هستند. یکی از مزیتهای پایگاههای داده NoSQL این است که با کمک آنها، توسعه دهندگان میتوانند به راحتی پایگاه دادهها را تغییر دهند و در عین حال، اعمال چنین تغییراتی، روی دیگر اپلیکیشنهای مورد استفاده پایگاه داده تاثیری نداشته باشد. پایگاه دادههایی مانند CouchBase ،CouchDB ،MongoDB و Apache Cassandra همگی پایگاه دادههای NoSQL به حساب میآیند.
مزیتهای پایگاه داده NoSQL
در ادامه به برخی از مزیتهای پراهمیت پایگاه داده NoSQL اشاره میشود.
پایگاه داده فاقد اسکیما
در صورتی که لازم باشد فایلهایی با ساختار تعریف نشده نگهداری شوند و شامل ویژگیهای توزیع شده باشند، استفاده از پایگاه داده NoSQL بسیار مناسب است.
اسکیمای پویا
در پایگاه دادههای NoSQL، پیشرفت ساختارهای داده در مقایسه با عملیاتی کردن عبارات ALTER TABLE با محتوای چندین گیگابایتی، امری آسانتر است.
پشتیبانی از متن بدون ساختار
حجم عمده دادههای موجود در سازمانهای مختلف به صورت بدون ساختار است. بسیاری از پایگاه دادههای NoSQL قابلیت مدیریت و رسیدگی به شاخصگذاری متون بدون ساختار را دارند. در تعدادی از این پایگاه دادهها مشخصه مذکور به عنوان یک ویژگی بومی (سرور MarkLogic) و در برخی از آنها به عنوان مجموعهای یکپارچه از خدمات (Solr یا Elasticsearch) انجام میشوند. توانایی مدیریت متنهای بدون ساختار، اطلاعات را تا حد بسیار زیادی افزایش میدهد. از این رو، سازمانها از آن به عنوان یک ابزار کمکی در جهت بهبود و تسهیل تصمیمگیری استفاده میکنند.
در پایگاه دادههای NoSQL، کاربردهای پیشرفته و پراهمیت مختلفی مانند پشتیبانی از چندین زبان با «جستجوی وجهی» (Facetted Search)، کاراییهای مربوط به اسنیپت (Snippet)، پشتیبانی از Word-stemming وجود دارد. از سوی دیگر، پشتیبانی از فرهنگ لغت و اصطلاحنامه (Thesauri) نیز به عنوان مشخصههای پیشرفته این نوع از پایگاه داده است. علاوه بر خصیصههای مذکور، با استفاده از اقدامات مربوط به هشدار جستجو در دریافت داده، میتوان موجودیتهای نامگذاری شده را از دیکشنریهایی مانند فهرست افراد، مکانها و سازمانها استخراج کرد.
به این طریق، دستهبندی، برچسبگذاری و جستجوی دادههای متنی به بهترین شکل ممکن انجام میشوند. با استفاده از سرویسهای غنیسازی موجودیت، امکان ترکیب اطلاعات استخراجشده با اطلاعات دیگر وجود دارد. در چنین شرایطی، اطلاعات وب به صورت غنی و در همپیچیده ارائه میشوند و تجزیه و تحلیل و استفاده کارآمد بسیار بهبود مییابند. SmartLogic ،OpenCalais ،NetOwl و TEMIS Luxid همگی تعدادی از سرویسهای غنیسازی موجودیت رایج هستند.
ساختار اشیا تودرتو
در صورتی که روی زبان شیگرا تمرکز شود، امکان جلوگیری از Joinهای متعدد وجود دارد و همچنین روابط و جداول مناسبتر به نظر میرسند.
رویههای افزایشی
با کمک پایگاه دادههای NoSQL، نیازی به وجود چندین رویه خواندن یا نوشتن در دیتابیس نیست و میتوان به راحتی از نمونههای مختلف از جمله شمارندهها، برای مشاهده دیدگاه خواننده و سایر موارد استفاده کرد.
قابلیت مدیریت تغییرات در طول زمان
به دلیل ماهیت مستقل از اسکیما پایگاههای داده NoSQL، این نوع از دیتابیسها در زمینه مدیریت و رسیدگی به تغییرات بسیار ایدهآل هستند. یعنی، در صورتی که ساختار پیام XML بین سیستمها دچار تغییر شود، دیگر بازنویسی روالهای ETL ضروری نیست. برخی از پایگاههای داده NoSQL این عمل را همراه با یک گام فراتر انجام میدهند. به طوری که در آنها، یک شاخص جهانی برای ساختار، مقادیر و متن موجود در اطلاعات ارائه میشوند. Microsoft DocumentDB و MarkLogic Server هر دو این قابلیتها را دارند. در صورتی که ساختار یک سند تغییر کند، به واسطه استفاده از چنین شاخصهایی، سازمانها میتوانند فوراً از اطلاعات استفاده کنند و دیگر لازم نیست برای آزمایش و بازنویسی سیستمها چندین ماه منتظر بمانند.
عدم اتکا به SQL magic
زبان SQL به عنوان یک زبان غالب برای کوئری سیستمهای مدیریت پایگاه داده رابطهای استفاده میشود. در طول سالهای خیر، قابلیت ساختاردهی مناسب به کوئریها با چالشهای مختلفی همراه است. نوشتن اتصالات یا همان Joinهای چندجدولی پیچیده از طریق حافظه، امری آسان و ساده نیست. با وجود اینکه در بسیاری از پایگاه دادههای NoSQL قابلیت پشتیبانی از دسترسی SQL ارائه شده است، اما این کار برای سازگاری با برنامههای کاربردی موجود مانند ابزارهای «هوش تجاری» (Business intelligence | BI) انجام میشود. در پایگاه دادههای NoSQL، زبانهای دسترسی مربوط به آنها پشتیبانی میشوند. لازم به ذکر است که این زبانهای دسترسی امکان تفسیر دادههای ذخیرهشده را دارند و ارائه یک مدل رابطهای در پایگاه داده زیربنایی لازم نیست.
این ذهنیت توسعه دهنده محور در طراحی پایگاههای اطلاعاتی و دسترسی به «رابط برنامهنویسی اپلیکیشن» (Application Programming Interface | API) باعث میشوند که انواع پایگاه داده NoSQL در بین توسعهدهندگان برنامهها بسیار محبوب تلقی شوند. توسعه دهندگان اپلیکیشنها، قبل از استفاده از پایگاههای داده نیازی به دانستن عملکرد داخلی و تغییرات آنها ندارند. به بیان ساده، با به کارگیری پایگاههای داده NoSQL، توسعه دهندگان این امکان را دارند که روی آنچه کار کنند که در برنامههای کاربردی مورد نیاز است. در این صورت، دیگر لزومی به استفاده اجباری از پایگاه دادههای رابطهای به وجود نمیآید.
پشتیبانی از ساختار دادههای مختلف
بسیاری از اپلیکیشنها به ذخیرهسازی اشیا ساده نیاز دارند. در حالی که ممکن است در برخی دیگر از اپلیکیشنها ذخیرهسازی ساختار بسیار پیچیده و مرتبط به هم لازم باشد. در پایگاه دادههای NoSQL، طیف وسیعی از ساختمان دادههای مختلف پشتیبانی میشوند. میتوان مقادیر باینری ساده، فهرستها، نقشهها و رشتهها را با سرعت بالا در انبارهای ارزش مقدار مدیریت کرد و همچنین، امکان گروهبندی مقادیر اطلاعاتی مرتبط در خانوادههای ستونی درون کلونهای Bigtable وجود دارد.
علاوه بر این، با استفاده از پایگاه دادههای NoSQL، میتوان ساختارهای سلسله مراتبی والد-فرزند بسیار پیچیده را داخل پایگاه داده اسناد مدیریت کرد و همچنین، امکان توصیف شبکهای از اطلاعات مرتبط با یکدیگر به صورت منعطفپذیر وجود دارد. لازم به ذکر است که در ادامه به طور مفصل به پایگاه داده اسناد پرداخته میشود.
اجرای کد در کنار دادهها
پایگاه دادهٰهای NoSQL در دوران هادوپ (Hadoop) ایجاد شدند. سیستم فایل توزیع شده هادوپ (HDFS) و محیط پردازش دستهای (Map/Reduce)، منجر به تغییر در نحوه ذخیرهسازی، کوئری زدن و پردازش دادهها میشوند. اکنون پرس و جوها یا همان کوئریها و وظایف پردازشی به چندین سرور منتقل میشوند و به این ترتیب، سطوح بالایی از موازیسازی (Parallelization) هم برای سربارهای کاری کوئری و هم برای دریافت ارائه خواهد شد.
امکان محاسبه تجمعات در کنار دادهها به یک امر عادی تبدیل شده است و دیگر به وجود سیستم انبار داده جداگانهای نیاز نیست که در طول شب بهروزرسانی شود. با انباشتگیهای سریع و مدیریت کوئری، تجزیه و تحلیلها برای اجرا در کنار دادهها به پایگاه داده منتقل میشوند. یعنی به منظور دستیابی به تجزیه و تحلیل ترکیبشده محلی، به ارسال دادههای زیادی در اطراف شبکه نیازی نیست.
پایگاه داده مبتنی بر فضای ابری
منظور از پایگاه داده ابری (Cloud) آن دسته از پایگاه دادهها است که برای اجرا در فضای ابری طراحی شدهاند. مشابه سایر اپلیکیشنهای مبتنی بر فضای ابری، پایگاه دادههای ابری نیز به صورت انعطافپذیر، مقیاسپذیر و همراه با امکان دسترسی بالا به آنها ارائه میشوند.
پایگاه دادههای ابری اغلب به تعمیر و رسیدگی کمی نیاز دارند. چرا که بسیاری از آنها از طریق یک مدل SaaS ارائه میشوند. پایگاه داده Microsoft Azure SQL، سرویس پایگاه داده رابطهای آمازون و پایگاه داده Oracle Autonomous همگی پایگاه داده ابری هستند. در ادامه به برخی از مزیتهای استفاده از پایگاه داده ابری اشاره میشود.
مزایای پایگاه داده مبتنی بر فضای ابری
در این بخش برخی از نقاط مثبت پایگاه دادههای مبتنی بر فضای ابری شرح داده شدهاند.
مقیاسپذیری بالا
در مقایسه با چند سال پیش، با استفاده از پایگاه دادههای ابری میتوان مقیاسبندی را به سرعت، با هزینه مقرون به صرفه و کارآمد انجام داد. به طور کلی، مقیاسبندی در امتداد ابعاد مختلف، مستلزم افزایش یا کاهش گره (Node) از یک خوشه (Cluster) برای تغییر فضای ذخیرهسازی، عملیات ورودی-خروجی در ثانیه (IOPS) یا کل محاسبات موجود برای اعمال کوئریها است. البته برای چنین عملیاتی، توزیع مجدد یک نسخه کپی از دادهها و ارسال آنها به نودها ضرورت دارد. با وجود اینکه در گذشته این موضوع یکی از سختترین مشکلات در ساخت پایگاه دادههای مقیاسپذیر و توزیعشده بود، اما در نسل جدید پایگاه دادههای بومی ابری امکان رسیدگی به این مشکلات به طور موثر وجود دارد.
کاهش مسئولیتهای مدیریتی
در صورتی که انعطافپذیری در پایگاه داده پایین باشد، ویژگیها (Feature های) موجود در آن نیز کم هستند. با این وجود امکان مدیریت و رسیدگی به این پایگاه داده تسهیل مییابد. به طور عمده، پایگاه داده میزبان ابری توسط خود آن مدیریت میشود. البته باید توجه کرد که پایگاه داده ابری منجر به حذف کامل نقشهای مدیر پایگاه داده نمیشود، بلکه تنها امکان حذف ویژگیهایی را به وجود میآورد که غیرضروری هستند و معمولاً DBA برای انجام آنها زمان و تلاش زیادی صرف میکند. به این ترتیب، DBA میتواند زمان خود را روی مسائل مهمتر متمرکز کند. از سوی دیگر، شرکتها میتوانند بدون نیاز به DBA اختصاصی یا تمام وقت شروع به کار کنند و از تخصصهایی اجتناب شود که ممکن است باعث محدویتهای تیمی شوند.
بهبود امنیت
در صورتی که پایگاه داده روی سرورهای داخلی اجرا شوند، لازم است اقدامات مربوط به امنیت نیز به عنوان یک فاکتور پراهمیت در نظر گفته شود. در حقیقت، باید این اطمینان حاصل شود که پایگاه داده، هسته بهروزرسانی شده و سایر نرم افزارهای حیاتی را دارد و همچنین، آگاهی در مورد جدیدترین تهدیدات دیجیتال ضروری است. با وجود اینکه اقدامات فوق قابل پیادهسازی هستند، اما در واقعیت اکثر شرکتها یا تمایلی به انجامشان ندارند یا آنها را به صورت ضعیف و ناکارآمد انجام میدهند. به منظور اجتناب از چنین مشکلاتی، میتوان از میان انواع پایگاه داده ، نوع مبتنی بر فضای ابری را انتخاب کرد.
پایگاه داده ستونی
پایگاه دادههای ستونی دیتابیسهایی هستند که در آنها به جای ذخیرهسازی به صورت سطری، دادهها در ستونها ذخیره میشوند. این نوع پایگاه دادهها اغلب در انبار داده (Data Warehouse) به کار میروند. چرا که پایگاه دادههای ستونی برای رسیدگی و مدیریت پرس و جوهای تحلیلی عملکرد بسیار مناسبی دارند. هنگامی که با استفاده از یک پایگاه داده ستونی به جستجو کوئری پرداخته میشود، اساساً دادههایی نادیده گرفته میشوند که در پرس و جو اعمال نخواهند شد؛ به این دلیل که در این پایگاههای داده امکان بازیابی اطلاعات تنها از طریق ستونها وجود دارد. MariaDB ،HBase ،Cassandra ،Google BigQuery و انبار داده Azure SQL از جمله پایگاه دادههای ستونی هستند. در ادامه به برخی از مزیتهای مهم پایگاه داده ستونی پرداخته میشود.
مزیت مهم پایگاه داده ستونی چیست؟
با ذخیرهسازی دادهها بر اساس ستون، بسیاری از پرس و جوها سریعتر اجرا میشوند، چرا که با کمک پایگاه داده ستونی، میتوان به جای جستجوی سطر به سطر، از برخی از فیلدها رد شده و فقط مرتبطترین دادهها را بررسی کرد. به عنوان مثال، در صورتی که لازم باشد موجودی پرداخت شده به همه تأمینکنندگان را جستجو کرد، میتوان مستقیماً به رکورد «موجودی» رجوع و از رکوردهای مربوط به صورتحساب، آدرس و سایر دادههای نامربوط صرف نظر کرد.
در این صورت از کاهش سرعت جلوگیری میشود. بیشتر سازمانها منابع داده (Data Source) بسیار زیادی دارند. از این رو، با افزایش رشد مجموعه داده، اهمیت پایگاه داده ستونی برای حفظ سرعت و چابکی در تجزیه و تحلیل کسب و کار بیشتر از پیش نمایان میشود. برای متخصصان خبره توسعه فناوری و نرم افزار مانند دنیس فوربس، بزرگترین مزیت استفاده از پایگاه داده ستونی، قابلیتهای آن در فشردهسازی مجموعه دادههای بزرگ است.
پایگاه داده ستون گسترده
پایگاه داده ستون گسترده (Wide Column) یا اصطلاحاً Column Family، نوعی از پایگاه دادههای NoSQL است که در آن امکان ذخیرهسازی حجم عظیمی از دادههای قابل جمعآوری وجود دارد و این عمل به بهترین شکل ممکن انجام میشود. در معماری پایگاه داده ستون گسترده از تداوم، ماتریس پراکندگی (Sparse Matrix)، نگاشت چندبعدی (سطر مقدار، ستون مقدار و مهر زمانی) در قالب جدولی استفاده میشود. چنین مواردی به منظور افزایش مقیاسپذیری در سطوح بیش از پتابایت و بالاتر طراحی شدهاند.
انبارهای ستون گسترده از مدل رابطهای پیروی نمیکنند و برای عمل جوین (join) بهینهسازی نشدهاند. از این رو، این پایگاههای داده برای پشتیبانی از اپلیکیشنهای بیگ دیتا بلادرنگ بسیار مناسب هستند. پایگاه دادههایی مانند BigTable ،Apache Cassandra و Scylla نمونههای از دیتابیسهای ستون گسترده به حساب میآیند. برای آشنایی بیشتر با مفاهیم بیگ دیتا و کاربردهای آن میتوان به مقاله زیر رجوع کرد.
- مقاله پیشنهادی: بیگ دیتا چیست و کلان داده چه کاربردی دارد؟ — به زبان ساده
پایگاه داده شیگرا
پایگاه دادههای شیگرا (Object-oriented) به نوعی از پایگاه داده گفته میشود که طراحی آن مبتنی بر برنامه نویسی شیگرا انجام شده است و دنبال آن دادهها و تمام خصیصههای آنها به عنوان یک شی به هم گره خوردهاند. پایگاه دادههای شیگرا توسط سیستمهای مدیریت پایگاه داده شیگرا (OODBMS) مدیریت میشوند.
چنین پایگاه دادههایی با زبانهای برنامه نویسی شیگرا مانند زبان سیپلاسپلاس (++C) و جاوا (Java) به خوبی کار میکنند. مشابه پایگاه دادههای رابطهای، پایگاههای داده شیگرا نیز مطابق با استانداردهای ACID هستند. دیتابیسهایی مانند Wakanda و ObjectStore دو نمونه از پایگاه دادههای شیگرا به حساب میآیند.
مزایای پایگاه داده شیگرا
برخی از مزیتهای پایگاه دادههای شیگرا به شرح زیر است.
- امکان مدلسازی به صورت غنیشده: مدل دادههای شیگرا این امکان را میدهد که «دنیای واقعی» با دقت بیشتری مدلسازی شود. اشیایی که هم وضعیت و هم رفتار را در بر میگیرند، نمایش طبیعی و واقعیتر از اشیا دنیای واقعی هستند. یک شی امکان ذخیرهسازی تمام روابط خود با اشیا دیگر، از جمله روابط چند به چند (Many To Many) را دارد. علاوه بر این، میتوان Objectها را به اشیا پیچیده مختلفی تبدیل کرد که سر و کار داشتن با چنین اشیایی از طریق مدلهای سنتی داده به راحتی انجام نمیشود.
- تعمیمپذیری: با کمک سیستم مدیریت پایگاه داده شیگرا، این امکان وجود دارد که با به کارگیری نوعهای (Types) موجود، دادههای جدید ساخت. یکی از مزیتهای اصلی شیگرایی، قابلیت فاکتور گرفتن آن از ویژگیهای مشترک کلاسهای مختلف و تبدیل آنها به یک ابرکلاس (Super Class) است. چرا که میتوان این ابرکلاس را با زیرکلاسها (Sub Classها) به اشتراک گذاشت و به این طریق، افزونگی را در سیستم تا حد زیادی کاهش داد. علاوه بر این، در پایگاه داده شیگرا، قابلیت استفاده مجدد از کلاسها باعث میشود که اعمالی مانند توسعه و نگهداری از پایگاه داده و اپلیکیشنهای آن به طور سریعتر و آسانتر انجام شوند.
- امکان مدیریت نوعهای مختلفی از دادهها: برخلاف پایگاه دادههای سنتی رایج مثل دیتابیس سلسله مراتبی و رابطهای، این نوع از پایگاه داده امکان ذخیرهسازی انواع دادههای مختلف را دارد. به طوری که در پایگاه داده شیگرا میتوان به راحتی متنها، تصاویر، ویدئو، صوت، اعداد و بسیاری از موارد دیگر را ذخیره کرد.
- دارای زبان کوئرینویسی قابل درک: رایجترین شکل دسترسی به داده در یک سیستم مدیریت پایگاه داده شیگرا، دسترسی ناوبری (Navigational) از شی است. در واقع دسترسی به دادهها در این نوع از پایگاه داده بر خلاف دسترسی انجمنی SQL است. دسترسی ناوبری برای رسیدگی به بخشهای Explosion، کوئریهای بازگشتی و سایر موارد مناسبتر است.
- ارائه پشتیبانی برای تراکنشها در دراز مدت: در حال حاضر، برای حفظ ثبات پایگاه داده در DBMSهای رابطهای فعلی، روی تراکنشهای همروند سریالپذیری اجرا میشود. در پایگاه دادههای شیگرا، به منظور رسیدگی به تراکنشهای دراز مدت پروتکل متفاوتی به کار میرود. لازم به ذکر است که پروتکل مربوطه در بسیاری از کاربردهای پیشرفته پایگاه داده مورد استفاده قرار میگیرد.
- بهبود عملکرد و کارایی: با بررسی برخی از معیارهای موجود، به نظر میرسد که عملکرد پایگاه دادههای شیگرا در مقایسه با DBMSهای رابطهای بهبود قابل توجهی دارند.
پایگاه داده کلید مقدار
یکی از سادهترین نوع از پایگاه دادههای NoSQL، «پایگاه داده کلید مقدار» (Key-value Databases) است. پایگاه دادههای کلید مقدار، دادهها را به صورت گروهی از زوجهای کلید مقدار ذخیره میکنند که هر یک از آنها از دو آیتم داده تشکیل شدهاند. علاوه بر این، گاهی اوقات به پایگاه دادههای کلید مقدار با نام انبار کلید مقدار اشاره میشود. پایگاههای داده کلید مقدار بسیار مقیاسپذیر هستند و با استفاده از آنها امکان مدیریت حجم بالایی از ترافیک وجود دارد. به همین دلیل، پایگاه دادههای کلید مقدار برای فرآیندهایی مانند مدیریت جلسه در وباپلیکیشنها، جلسات کاربران در بازیهای آنلاین چندنفره و عظیم و سبد خرید آنلاین یک انتخاب ایدهآل است.
مزیتهای اصلی پایگاه داده کلید مقدار کدامند؟
شایان ذکر است که انواع پایگاه داده برای اهداف مختلف وجود دارند. به همین دلیل در بیشتر مواقع، تصمیمگیری در مورد انتخاب دیتابیس مناسب از میان انواع پایگاه داده تسهیل مییابد. با وجود اینکه ممکن است پایگاه دادههای کلید مقدار در زمینههای محدودی به کار بروند، اما همچنان بنا به مزیتهای زیر یک پایگاه داده مناسب به حساب میآید. در ادامه به برخی از مزیتهای پراهمیت پایگاه داده کلید مقدار اشاره میشود.
- سادگی استفاده: همانطور که در بالا به آن اشاره شد، پایگاه دادههای کلید مقدار بسیار ساده هستند و بنابراین استفاده از آنها به راحتی امکانپذیر است. در پایگاه داده کلید مقدار، به دلیل به کارگیری دستورات به شکل ساده و همچنین، عدم وجود نوعهای مختلف داده، وظایف برنامه نویسان تسهیل مییابد. به واسطه استفاده از این ویژگی، میتوان از در صورت نیاز دادهها را هر نوعی یا حتی به عنوان چندین نوع فرض کرد.
- سرعت: سرعت پاسخگویی در پایگاه دادههای کلید مقدار بالا است، چرا که در میان انواع پایگاه داده ، نوع کلید مقدار بسیار ساده است. البته باید توجه کرد که سرعت مناسب در این پایگاه داده مشروط است. یعنی، به منظور تسریع عملیات در آن، لازم است بقیه محیط اطراف پایگاه داده کلید مقدار به خوبی ساخته و بهینه شده باشد.
- مقیاسپذیری مناسب: به طور کلی، مقیاسپذیری یکی از مزیتهای کلیدی و محبوب در پایگاه دادههای NoSQL نسبت به پایگاه دادههای رابطهای است. درمیان انواع پایگاه داده ، مقیاسپذیری دیتابیس کلید مقدار به طور ویژه مورد توجه قرار گرفته است. بر خلاف پایگاه دادهای رابطهای که فقط به صورت عمودی مقیاسپذیر هستند، در انبارهای کلید مقدار امکان مقیاسپذیری به صورت افقی نیز به شکل مناسب وجود دارد.
- جابهجایی آسان: با توجه به اینکه در بین انواع پایگاه داده ، این نوع فاقد زبان کوئرینویسی است، میتوان این دیتابیس را به راحتی بین سیستمهای مختلف و بدون نیاز به تغییر معماری جابهجا کرد.
- قابلیت اطمینان: پایگاه داده کلید مقدار به گونهای طراحی شده است که امکان بازیابی دادههای از دست رفته از طریق تنظیمات پیشساخته آن وجود دارد. به این ترتیب، میتوان با استفاده از دادههای کپی شده از این قابلیت بهرهوری کرد.
پایگاه داده سلسله مراتبی
در پایگاههای داده سلسله مراتبی (Hierarchical) از مدل والد-فرزند به منظور ذخیرهسازی دادهها استفاده میشود. پایگاه داده سلسله مراتبی در ابتدا توسط IBM در اوایل دهه 1960 توسعه داده شد. به منظور درک بهتر نمای کلی پایگاه داده سلسله مراتبی، لازم است یک شجرهنامه خانوادگی در نظر گرفته شود. با این دیدگاه، یک شی در بالای این شجرهنامه به چندین شی در زیر آن منشعب میشود.
قالب یک به چند (One To Many) یک فرمت بدون انعطاف است، بنابراین در چنین شرایطی، رکوردهای فرزند نمیتوانند بیش از یک رکورد والد داشته باشند. معمولاً برای پشتیبانی از اپلیکیشنها با کارایی و امکان دسترسی بالا پایگاههای داده سلسله مراتبی به کار میروند. ردیس (Redis) و Amazon DynamoDB دو نمونه از پایگاه دادههای سلسه مراتبی هستند. اکنون در ادامه مزیتهای کلیدی پایگاه داده سلسله مراتبی مورد بررسی قرار میگیرند.
مزیتهای پایگاه داده سلسله مراتبی کدامند؟
ساختارهای سلسله مراتبی شبیه هرم هستند. به طوری که بالاترین سطوح قدرت و اقتدار در راس آنها قرار دارد و زیر هر یک از این سطوح زیرگروههای مختلفی وجود دارد. معمولاً در دولتها، ارتشها و بسیاری از شرکتها از این نوع ساختار سازمانی استفاده میشود. این رویکرد تخصیص موقعیت و سطوح نسبی قدرت مزایایی را به همراه دارد که در ادامه به آنها پرداخته میشود.
- در مدل پایگاه داده سلسله مراتبی، به راحتی امکان اضافه کردن و حذف اطلاعات جدید وجود دارد.
- میتوان به سرعت به دادههای بالای سلسله مراتب دسترسی داشت.
- مدل پایگاه داده سلسله مراتبی، با رسانههای مختلف ذخیره سازی دادههای خطی مانند نوارها (Tapes) به خوبی کار میکند.
- یکپارچگی ارجاع همیشه حفظ میشود، یعنی هر تغییری که در جدول والد ایجاد شود، به طور خودکار در جدول فرزند بهروزرسانی انجام خواهد شد.
- در این نوع پایگاه داده سیستمهایی پشتیبانی میشوند که از طریق یک رابطه یک به چند کار میکنند. به عنوان مثال، یک رئیس جمهوری، مدیران زیادی در سطوح پایینتر خود دارند و به دنبال آن، این مدیران نیز خود کارمندان زیادی در سطحهای پایینتر خود دارند. با این حال، هر کارمند تنها یک مدیر دارد و چنین روابطی نشان دهنده ارتباط یک به چند در پایگاه داده است.
- این مدل پایگاه داده به طور کارآمد عمل میکند و نتایج در آن واضح هستند.
- به دلیل وجود پیوندهای صریح بین ساختارهای جدول، میتوان به راحتی دادهها را بازیابی کرد.
- به واسطه این نوع از پایگاه داده، به اشتراکگذاری دادهها ترویج مییابد.
- به دلیل وجود رابطه والد و فرزند، پایگاه داده سلسه مراتبی از نظر مفهومی ساده است.
پایگاه داده گرافی
پایگاه دادههای گراف نوعی از پایگاه داده NoSQL هستند که بر اساس تئوری گراف ارائه میشوند. نرم افزار سیستمهای مدیریت پایگاه داده گرافگرا (DBMS) برای شناسایی و کار با اتصالات بین نقاط داده طراحی شده است. از این رو، پایگاه دادههای گرافی اغلب برای تجزیه و تحلیل روابط بین نقاط داده ناهمگن، مانند پیشگیری از کلاهبرداری یا برای استخراج دادههای مشتریان از رسانههای اجتماعی کاربرد دارند.
Datastax Enterprise Graph و Neo4J دو نمونه از پایگاه دادههای گرافی به حساب میآیند. در ادامه معرفی انواع پایگاه داده ، به بررسی مزایای مهم پایگاه داده گرافی پرداخته میشود.
مزایای پایگاه داده گرافی کدامند؟
تفکر شیگرا
منظور از وجود تفکر شیگرا در پایگاه داده گرافی این است که برای هر کوئری که نوشته میشود، یک معنای واضح و صریح وجود دارد. برای کار با SQL رابطهای، باید نحوه شکلگیری جداول در عبارت FROM از طریق ضرب دکارتی به طور کامل درک شود. اما بر خلاف SQL رابطهای، در پایگاه داده گرافی هیچ فرض پنهانی وجود ندارد. به همین دلیل در میان انواع پایگاه داده ، سهولت استفاده از این دیتابیس بسیار مورد توجه قرار گرفته است.
اجرای کارآمد
پایگاه داده گرافی برای کوئریهای مرتبط به دادهها، چه با حجم کم و چه با حجم زیاد، عملکرد مناسبی دارد. یک گراف بومی دارای ویژگی «مجاورت بدون شاخص» (Index Free Adjaceny) است و در آن، هر راس فقط اطلاعات رئوس همسایه خود را حفظ میکند. لازم به ذکر است که هیچ شاخص جهانی خاصی در مورد اتصالات راس وجود ندارد. این باعث میشود که با رشد اندازه دادهها، گراف بومی عملکرد ثابتی از خود نشان دهد. چرا که عبور از گرههای همسایه یک راس معین از طریق یالها عملی مستقل از اندازه گراف یا همان نمودار است. علاوه بر این، در این رویکرد به بارگذاری یا دستکاری دادههای نامرتبط به یک پرس و جو نیازی نیست. در شرایطی که دادهها به سرعت و در ابعاد بسیار حجیم رشد میکنند، پایگاه داده گرافی یک راهحل عالی و یک ابزار کمکی برای کوئریهای تحلیلی بیگ دیتا در زمان واقعی هستند.
ارائه راهحلهای مناسب
پایگاه دادههای گرافی به مشکلاتی پاسخ میدهند که در معمولاً در کوئریهای رابطهای غیرعملی هستند. به منظور درک بهتر، میتوان به الگوریتمهای تکرار شونده مانند PageRank، گرادیان کاهشی (Gradient Descent) و دیگر الگوریتم های داده کاوی (Data Mining) و یادگیری ماشین (Machine Learning) اشاره کرد. تحقیقات ثابت کرده است که برخی از زبانهای کوئرینویسی گرافی تورینگ کامل هستند، یعنی امکان نوشتن هر الگوریتمی برای آن وجود دارد. با این حال، بسیاری از زبانهای کوئرینویسی فعلی قدرت بیان محدودی دارند.
به روزرسانی دادهها به صورت بلادرنگ و پشتیبانی همزمان از کوئریها
در پایگاه داده گرافی میتوان بهروزرسانی بیگ دیتا را به طور بلادرنگ انجام داد و در همین حین، از پشتیبانیهای مربوط به کوئریها بهره برد. این موضوع یکی از ضعفهای اساسی در سیستمهای مدیریت کلان داده از جمله Hadoop HDFS است. چرا که این سیستمهای مدیریت کلان داده برای دریاچه داده (Data Lake) طراحی شدهاند. در دریاچه داده، اعمالی مانند اسکنهای متوالی و اضافه کردن دادههای جدید (بدون جستجوی تصادفی) مشخصههای این جریان کاری هستند و این یک انتخاب طراحی معماری برای اطمینان از اسکن سریع است. این طراحی معماری برای اطمینان از سرعت اسکن ورودی و خروجی کل فایل ارائه شده است.
انعطاف پذیری محیط اسکیمای آنلاین
در پایگاه دادههای گرافی، در حین رسیدگی به کوئریها، یک محیط اسکیمای آنلاین انعطافپذیر ارائه میشود. به طوری که در آن، امکان درج یا حذف کردن مداوم راسها یا نوعهای لبههای جدید یا حتی ویژگیهای آنها برای تعمیم یا کوچک کردن مدل داده وجود دارد. مدیریت و رسیدگی به نوعهای داده که دائماً در حال تغییر هستند، بسیار راحت انجام میشود. این در حالی است که در پایگاه داده رابطهای به راحتی نمیتوان با این نیاز عصر مدیریت داده مدرن سازگاری ایجاد کرد.
پایگاه داده سری زمانی
پایگاه داده سری زمانی (Time Series) یک دیتابیس کاربردی به حساب میآید که برای دادههای دارای مهر زمانی (Time Stamped) یا سریهای زمانی بهینهسازی شده است. نمونههایی از این نوع دادهها شامل دادههای شبکه، دادههای حسگر و داده
های مربوط به نظارت بر عملکرد اپلیکیشن محسوب میشوند. Druid ،eXtremeDB و InfluxDB نمونههای از پایگاه دادههای سری زمانی هستند. لازم به ذکر است که همه سنسورهای موجود در اینترنت اشیا (Internet of Things | IoT) نیز جریان ثابتی از دادههای سری زمانی را منتشر میکنند. برای آشنایی بیشتر با مفاهیم مربوط به اینترنت اشیا میتوان به مقاله زیر رجوع کرد.
- مقاله پیشنهادی: اینترنت اشیا چیست ؟ — از صفر تا صد
به این ترتیب برخی از مهمترین انواع پایگاه دادهها در این مقاله معرفی و شرح داده شدند. حال در بخش پایانی این مقاله به معرفی برخی از دورههای شاخص آموزش پایگاه داده در مجموعه فرادرس پرداخته شده است.
معرفی دوره های آموزش پایگاه داده فرادرس
در این بخش پایانی از معرفی انواع پایگاه داده و کاربردهای آن ، به برخی از دورههای آموزشی مرتبط با پایگاه داده پرداخته میشود.
فیلم آموزش پایگاه داده ها
برای یادگیری نحوه کار پایگاه دادهها، لازم است تمام اصول و مفاهیم پایه مرتبط با آن بررسی شوند. دوره آموزش پایگاه داده فرادرس یک نقطه شروع مناسب برای آشنایی با انواع پایگاه داده و کاربردهای آن به حساب میآید. این دوره آموزشی دارای مدت زمان هفت ساعت و ۵۱ دقیقه و مدرس آن دکتر فرشید شیرافکن است. این دوره آموزشی برای افرادی مناسب است که به آموزشهای دیتابیس علاقه دارند.
علاوه بر این، این دوره آموزشی فرادرس برای دانشجویان رشته کامپیوتر به ویژه در مقطع کارشناسی پیشنهاد میشود. چرا که این پایگاه داده یکی از دورس پراهمیت این مقطع تحصیلی است. از جمله سرفصلها و موضوعاتی که در این دوره ارائه میشوند، میتوان به تعاریف مقدماتی سیستم پایگاه داده، ساختار دادهای رابطهای، مدل ER، جبر رابطهای، مفاهیم مربوط به زبان SQL، وابستگی تابعی، نرمالسازی (Normalization) و سایر موارد مهم دیتابیس اشاره کرد.
- برای مشاهده فیلم آموزش پایگاه داده ها + اینجا کلیک کنید.
فیلم آموزش مقدماتی PostgreSQL برای مدیریت پایگاه داده
در این مطلب به چیستی و انواع پایگاه داده پرداخته شده. به منظور یادگیری نحوه کار با بانک اطلاعاتی PostgreSQL، میتوان از دوره آموزش مقدماتی PostgreSQL فرادرس استفاده کرد. طول مدت این دوره نزدیک به سه ساعت و مدرس آن مهندس محمد وفایی مقدم است. این دوره آموزشی سه درس را در برمیگیرد و برخی از سرفصلها و مباحث مهم آن معرفی و آشنایی با پایگاه داده PostgreSQL، نحوه نصب PostgreSQL در لینوکس، ابزارهای اولیه PostgreSQL، نصب PostgreSQL، کوئریها و مدیریت دستورات مربوط به دیتابیس و سایر موارد است.
- برای مشاهده فیلم آموزش مقدماتی PostgreSQL برای مدیریت پایگاه داده + اینجا کلیک کنید.
فیلم آموزش پایگاه داده MySQL
پایگاه داده MySQL، جز آن دسته از پایگاه دادههایی است که اطلاعاتی توسط برنامههای تحت وب ارائه میدهد. در این مقاله به شرح پایگاه داده رابطهای پرداخته شد. همانطور که پیشتر به آن اشاره شد، بانک اطلاعاتی MySQL یک سیستم مدیریت پایگاه داده رابطهای (RDBMS) است و با کمک آن میتوان اعمالی را مانند ذخیرهسازی، جستجو، مرتب کردن و بازیابی دادهها انجام داد. برای یادگیری نحوه کار با این پایگاه داده، استفاده از دوره آموزش پایگاه داده MySQL فرادرس به علاقهمندان و دانشجویان پیشنهاد میشود.
طول مدت این دوره نزدیک به یازده ساعت و مدرس آن سید رضا هاشمیان است. این دوره آموزشی دارای نوزده درس است و برخی سرفصلهای مهم از جمله مروری بر پایگاههای داده، شروع به کار با MySQL، عملگرها و متغیرها در MySQL، کار با توابع SQL در MySQL، کار با Join در MySQL و سایر موارد مهم در آن پوشش داده میشوند.
- برای مشاهده فیلم آموزش پایگاه داده MySQL + اینجا کلیک کنید.
فیلم آموزش مقدماتی زبان برنامه نویسی اوراکل PL/SQL
اوراکل (Oracle) یکی از قدرتمندترین و محبوبترین نرم افزارهای پایگاه داده به حساب میآید. به منظور کار با دیتابیس اوراکل، زبان PL/SQL معرفی شده است. برای یادگیری کار با این بانک اطلاعاتی و زبان PL/SQL، میتوان از دوره آموزش مقدماتی زبان برنامه نویسی اوراکل PL/SQL فرادرس استفاده کرد. طول مدت این دوره آموزشی نزدیک به سیزده ساعت و مدرس آن سید محمدرضا ایزدی شهرکی است. در این دوره آموزشی، برخی سرفصلهای پراهمیت پایگاه داده مانند مفاهیم پایه و مقدماتی بانکهای اطلاعاتی رابطهای، پایگاه داده رابطهای (RDBMS)، اصول پایه PL/SQL، Trigger در اوراکل، مدیریت خطا در PL/SQL و سایر موارد به صورت جامع و در عین حال به زبان ساده شرح داده میشوند.
- برای مشاهده فیلم آموزش پایگاه داده MySQL + اینجا کلیک کنید.
جمعبندی
به طور کلی، سیستم مدیریت پایگاه داده یک بخش کلیدی و پراهمیت در زندگی روزمره بشر است. به این ترتیب، آشنایی با انواع پایگاه داده و ویژگیهای هر یک از آنها یک ضرورت به حساب میآید.
در این مقاله، ابتدا یک تعریف برای پایگاه داده شرح داده شد و در ادامه، انواع پایگاه داده و مزیتهای آنها مورد بررسی قرار گرفتند. با توجه به کاربردهای مختلف انواع پایگاه داده در زمینههای گوناگون، میتوان از این مطلب به عنوان یک راهنما برای تصمیمگیری در زمینه انتخاب دیتابیس مطلوب استفاده کرد.