در این نوشته به بررسی مبانی حافظه در سیستم‌های یادگیری عمیق خواهیم پرداخت. مدل‌سازی حافظه حوزه تحقیقاتی در حال رشدی در زمینه یادگیری عمیق محسوب می‌شود. در سال‌های اخیر تکنیک‌هایی مانند ماشین‌های تورینگ عصبی (NTM) پیشرفت زیادی در تشکیل شالوده ساختارهای حافظه شبیه به انسان در سیستم‌های یادگیری عمیق داشته‌اند. در این نوشته از زاویه‌ای متفاوت به این موضوع می‌پردازیم و تلاش می‌کنیم تا به چنین سؤالات بنیادی که هنگام اندیشه در مورد حافظه در مدل‌های یادگیری عمیق پدید می‌آیند پاسخ دهیم:

  • الف) چه چیزی باعث می‌شود حافظه در سیستم‌های یادگیری عمیق چنین پیچیده شوند؟
  • ب) در مورد معماری حافظه از چه منابعی می‌توان الهام گرفت؟
  • ج) تکنیک‌های اصلی مورد استفاده برای نمایش حافظه‌ها در مدل‌های یادگیری کدام هستند؟

برای ارائه پاسخ‌های مناسب به دو سؤال نخست می‌بایست به نظریه‌های زیست‌شناختی و همچنین روان‌شناختی حافظه نگاهی داشته باشیم. بدین ترتیب به دو مکتب تفکر می‌رسیم که بر روی دانش ما از حافظه تأثیر گذارده‌اند: علوم اعصاب و روانشناسی شناختی. ما با پیگیری همین روند تفکر قصد داریم این نوشته را در سه بخش اصلی ارائه کنیم. بخش نخست به توضیح نظریه علوم اعصاب در خصوص حافظه می‌پردازد. بخش دوم از منظر روانشناسی شناختی به حافظه نگاه می‌کند و بخش نهایی بر روی چگونگی الهام گیری یادگیری عمیق از این نظام‌های فکری برای بهره‌گیری از حافظه در شبکه‌های عصبی متمرکز شده است. بنابراین ابتدا از جایی شروع می‌کنیم که حافظه‌ها ایجاد شدند: مغز انسان.

نظریه علوم اعصاب در خصوص حافظه

درک چگونگی ایجاد و در پاره‌ای موارد تخریب حافظه و همچنین تفاوت‌های بین حافظه‌های بلندمدت و کوتاه‌مدت زمینه مهمی از تحقیقات علوم اعصاب در طی دهه اخیر بوده است. یکی از موضوعات نمادین که این سطح از تحقیقات را موجب شده به بیماری به نام هنری مولیسون (H.M) مربوط است.

هنری گوستاو مولیسون (اچ.ام.) در سن 9 سالگی دچار تصادفی شد که باعث گردید تا سال‌ها دچار تشنج‌های دوره‌ای شود. در سال 1952 وی در سن 25 سالگی تحت یک جراحی قرار گرفت تا نشانه‌های تشنج در وی رفع شوند. این رویه در ابتدا موفقیت‌آمیز به نظر می‌رسید تا این که پزشکان دریافتند که به طور تصادفی بخشی از هیپوکامپ اچ.ام. را بریده‌اند و در نتیجه وی نمی‌توانست خاطرات جدید را به حافظه‌اش بسپارد.

ایده زندگی بدون خاطرات جدید همانند این است که همواره در زمان حاضر زندگی کنید. چنین وضعیتی معادل این نیست که حافظه خوبی دارید یا نه؛ بلکه طوری زندگی می‌کنید که هیچ‌گاه نمی‌توانید خود را به هیچ رویدادی در گذشته یا آینده ارتباط دهید. بیمار اچ.ام. روز خود را به نحوی سپری می‌کرد که تنها چند دقیقه اطلاعات را در حافظه خود نگه می‌داشت و بارها با افراد تکراری ملاقات کرده و سؤالات تکراری را به طور مرتب از آن‌ها می‌پرسید. مورد بیمار اچ.ام انگیزه‌ای برای محققان علوم اعصاب ایجاد کرد تا شیوه ایجاد حافظه، ذخیره‌سازی و فراخوانی آن را درک کنند.

اجزای درگیر حافظه در مغز

نظریه علوم اعصاب مدرن در مورد حافظه شامل سه حوزه عمده مغز است: تالاموس، پیش پیشانی و کورتکس و هیپوکامپ. تالاموس را می‌توان به عنوان یک مسیریاب تصور کرد که اطلاعات حواسی (بینایی، لامسه، صحبت کردن) را پردازش کرده و این اطلاعات را جهت ارزیابی به لوب‌های حواسی (sensory lobes) مغز ارسال می‌کند. اطلاعات ارزیابی شده در نهایت به قشر پیش پیشانی می‌رسند. در آنجا اطلاعات به شکل حافظه‌های کوتاه‌مدت وارد هوشیاری ما می‌شوند. این اطلاعات به هیپوکامپ نیز ارسال می‌شوند. در آنجا اطلاعات به بخش‌های مختلف تقسیم می‌شوند تا در کورتکس‌های مختلف به صورت حافظه‌های بلندمدت ذخیره شوند. یکی از بزرگ‌ترین چالش‌های علوم اعصاب امروزه آن است که درک کنند چگونه بخش‌های پراکنده حافظه می‌توانند به صورت یک تجربه منسجم از حافظه گرد هم آیند. این مسئله در علوم اعصاب به نام «مسئله اتصال» نامیده می‌شوند.

مسئله اتصال

مسئله اتصال به عنوان یکی از معمایی‌ترین جنبه‌های نظریه حافظه در علوم اعصاب، مفهوم یادآوری حافظه از روی اطلاعات حواسی را به چالش می‌کشد. برای مثال تجربه رفتن به یک کنسرت به همراه یار عزیزی را تصور کنید. خاطرات این رویداد تجزیه می‌شوند و در مناطق مختلف مغز ذخیره می‌شوند. با این حال تنها یک تجربه مانند گوش دادن به یک ملودی که در آن کنسرت شنیده بودید یا مشاهده همسرتان در حال رقص کافی است تا کل خاطره آن کنسرت در ذهن شما زنده شود. این وضعیت چگونه ممکن است؟

یک نظریه که مسئله اتصال را حل می‌کند، بدین گونه است که بخش‌های مختلف حافظه به وسیله نوسان‌های الکترومغناطیسی که به طور مداوم از طریق مغز ارسال می‌شوند به هم ارتباط می‌یابند. این نوسان‌ها یک لینک زمانی (و نه مکانی) بین بخش‌های حافظه ‌ایجاد می‌کنند که به آن‌ها امکان می‌دهد تا به صورت یک خاطره منسجم گرد هم جمع شوند.

نظریه حافظه در علوم اعصاب پایه‌ای برای درک اجزای اصلی یک معماری حافظه هوشمند را به ما ارائه می‌کند. با این حال حافظه انسان تنها یک محصول فرعی از اجزای مغز نیست؛ بلکه به طور عمیقی تحت تأثیر شرایط زمینه‌ای نیز قرار دارد. این مسئله در بخش بعدی بیشتر توضیح داده شده است.

نظریه حافظه در روانشناسی شناختی

مسئله اتصال در نظریه حافظه در علوم اعصاب توضیح می‌دهد که چگونه بخش‌های پراکنده حافظه می‌توانند به صورت خاطرات منسجمی گرد هم جمع شوند. مشخص شده است که برای توضیح مسئله اتصال باید فراتر از معماری مغز حرکت کنیم و همه انواع اجزای چارچوب روان‌شناختی که تأثیر عمیقی بر یادآوری خاطرات دارند را نیز بررسی نماییم. یکی از اصلی‌ترین نظریات در این زمینه روانشناسی شناختی است که تلاش می‌کند ماهیت ارتباطی حافظه را توضیح دهد. این مفهوم تأثیر تداعی نام دارد.

حافظه ارتباطی و تأثیر تداعی

همانند همه نظریات خوب روانشناسی شناختی سعی می‌کنیم تأثیر تداعی را نیز از طریق آزمایش‌ها توضیح دهیم. نخستین چیزی که با شنیدن واژه «شام» به ذهنتان می‌رسد چیست؟ آیا نوشیدنی است یا دسر؟ شاید یک قرار ملاقات جمعه شب به ذهنتان می‌آید. همان‌طور که می‌بینید چیزی به سادگی یک کلمه می‌تواند مجموعه پیچیده‌ای از احساسات و حتی واژه‌های مرتبط دیگر را به ذهن فرا بخواند. ما در این وضعیت به طور مؤثری اقدام به یادآوری خاطرات می‌کنیم.

یکی از نتایج قابل توجه آزمایش‌های قبلی این است که متوجه شوید تا چه حد سریع می‌توانید این کلمات یا خاطرات مرتبط را بازیابی کنید. دلیل وقوع این حالت آن است که خاطرات مرتبط بخشی از آن چیزی است که دنیل کانمن برنده جایزه نوبل اقتصاد آن را سیستم 1 می‌نامد. این فرایند به سرعت رخ می‌دهد و یک سری از احساسات و پاسخ‌های فیزیکی مرتبط تولید می‌شوند. در روانشناسی، این نوع از پدیده‌ها به نام انسجام ارتباطی (Associatively Coherent) نامیده می‌شوند.

روش اکتشاف دسترسی‌پذیری (Availability Heuristic)

جزء مهم دیگر نظریه حافظه در زمینه روانشناسی شناختی به چگونگی یادآوری فراوانی رویدادها مرتبط است. برای نمونه اگر از شما بپرسند: «در طی ده سال اخیر به چه تعداد کنسرت رفته‌اید؟» شما اگر حس خوبی نسبت به کنسرت داشته باشید و یا اخیراً به کنسرتی رفته باشید به احتمالاً بالا تقریبی بالاتر از عدد واقعی ارائه می‌کنید. در غیر این صورت اگر از کنسرت آخر خود لذت نبرده باشید، این عدد ممکن است بسیار پایین‌تر از عدد واقعی باشد. این فرایند شناختی به نام اکتشاف دسترسی‌پذیری نامیده می‌شود و توضیح می‌دهد که خاطرات ما چگونه به مقدار زیادی تحت تأثیر وجود سریع یک پاسخ وابسته هستند.

تا به اینجا ایده‌ای از طرز تفکر در مورد حافظه در چارچوب مغز (علوم اعصاب) و شرایط اجتماعی (روانشناسی شناختی) کسب کرده‌ایم. حال سؤال این است که چگونه می‌توانیم از این نظریه‌ها در الگوریتم‌های یادگیری عمیق استفاده کنیم؟

حافظه و یادگیری عمیق

از دیدگاه نظریات علوم اعصاب و روانشناسی شناختی، می‌دانیم که هر نوع سیستم حافظه مصنوعی مجموعه معینی از خصوصیات دارد که آن را شبیه حافظه انسان می‌کند.

  • الف. حافظه به پارتیشن‌هایی تقسیم می‌شود که زمینه‌های مختلف دانش را توصیف می‌کند.
  • ب. بخش‌های گسسته به صورت ساختارهای اطلاعاتی منسجمی گرد هم می‌آیند.
  • ج. داده‌ها بر پایه موضوع بازیابی می‌شوند و نه بر اساس اطلاعاتی با ارتباط مستقیم و یا ارجاع به داده‌های بیرونی.

هیچ نظامی در علوم رایانه بیش از یادگیری عمیق از سیستم‌های حافظه شبیه انسان بهره نبرده است. یادگیری عمیق از روزهای نخست این تلاش را داشته است که سیستم‌هایی را مدل‌سازی کند که بخشی از خصوصیات کلیدی حافظه انسان را داشته باشند.

یادگیری عمیق و حافظه ضمنی

جهت درک ارتباط‌های معنایی حافظه در یادگیری عمیق، می‌بایست بین مفاهیم دانش ضمنی و تصریحی تمایز قائل شویم. دانش ضمنی معمولاً ناهشیار است و در نتیجه توضیح آن دشوار است. می‌توانیم نمونه‌هایی از دانش ضمنی را در زمینه‌هایی مانند تحلیل گفتار و بینایی به صورت بازشناسی میمون دریک تصویر یا آهنگ و لحن یک جمله بیان شده مثال بزنیم. دانش تصریحی برخلاف این مدل به آسانی به صورت توصیفی مدل‌سازی می‌شود. برای نمونه درک این که میمون نوعی حیوان است یا این که صفت‌های خاصی گستاخانه هستند نمونه‌هایی کلاسیک از دانش تصریحی هستند. می‌دانیم که الگوریتم‌های یادگیری عمیق پیشرفت فراوانی در نمایش دانش ضمنی داشته‌اند؛ اما هنوز در مدل‌سازی و به خاطر سپاری دانش تصریحی کار زیادی دارند.

چه چیزی باعث شده است که یادگیری دانش تصریحی از سوی الگوریتم‌های یادگیری عمیق تا این حد دشوار باشد؟ اگر به معماری سنتی شبکه‌های عصبی با میلیون‌ها گره به هم مرتبط دقت کنید متوجه می‌شوید که فقدان معادلی برای سیستم کارآمد حافظه که بتواند بخش‌های گسسته‌ای از دانش و رابطه آن‌ها با هم را طوری ذخیره سازد که به آسانی از لایه‌های مختلف شبکه قابل دسترسی باشند، مشکلی اساسی محسوب می‌شود. اخیراً تکنیک‌های جدیدی در حوزه یادگیری عمیق برای حل این مشکل توسعه یافته‌اند.

ماشین‌های تورینگ عصبی

تکامل سریع الگوریتم‌های یادگیری سریع نیاز به سیستم‌های حافظه‌ای دارد که بتوانند خصوصیاتی شبیه به حافظه انسان هنگام پردازش دانش تصریحی از خود بروز دهند. یکی از تکنیک‌های رایج در مدل‌سازی حافظه به نام ماشین‌های تورینگ عصبی (NTM) شناخته می‌شود که در سال 2015 از سوی DeepMind معرفی شده‌اند.

NTM با بسط شبکه‌های عصبی عمیق با سلول‌های حافظه‌ای که بتوانند بردارهای کاملی را ذخیره کنند، ساخته شده است. یکی از بزرگ‌ترین نوآوری‌های NTM این است که از روش‌های اکتشافی برای خواندن و نوشتن اطلاعات استفاده می‌کند. برای نمونه NTM سازوکاری را پیاده‌سازی می‌کند که می‌تواند بردارها را بر مبنای الگوهای ورودی بازیابی نماید. این فرایند شبیه روش یادآوری خاطرات در مغز انسان بر مبنای تجربیات موضوعی است. به علاوه NTM سازوکارهایی برای افزایش حضور سلول‌های حافظه بر مبنای این که چه مقدار یادآوری می‌شوند دارد.

NTM تنها تکنیکی نیست که قابلیت‌های حافظه را در سیستم‌های یادگیری عمیق مهیا ساخته است؛ اما قطعاً یکی از رایج‌ترین آن‌ها است. تقلید از کارکردهای زیست‌شناختی و روان‌شناختی حافظه انسان کار ساده‌ای نیست و به یکی از مهم‌ترین زمینه‌های تحقیقاتی در حوزه یادگیری عمیق تبدیل شده است.

اگر به این نوشته علاقه‌مند بودید، موارد زیر نیز احتمالاً مورد توجه شما قرار خواهند گرفت:

==

میثم لطفی (+)

«میثم لطفی» دانش‌آموخته ریاضیات و شیفته فناوری به خصوص در حوزه رایانه است. وی در حال حاضر علاوه بر پیگیری علاقه‌مندی‌هایش در رشته‌های برنامه‌نویسی، کپی‌رایتینگ و محتوای چندرسانه‌ای، در زمینه نگارش مقالاتی با محوریت نرم‌افزار نیز با مجله فرادرس همکاری دارد.

بر اساس رای 5 نفر

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *