ریاضی , هوش مصنوعی 468 بازدید

«نظریه بازی» (Game Theory)، مطالعه مدل‌های ریاضیاتی مربوط به تعاملات استراتژیک، بین تصمیم‌گیرندگان منطقی است و کاربردهای متعددی در زمینه‌ها و علوم گوناگون دارد. پرسشی که برای برخی افراد مطرح می‌شود، مفهوم دقیق و به زبان ساده «نظریه بازی»، کاربردها، چگونگی پیاده‌سازی و ارتباط آن با علوم دیگر به ویژه هوش مصنوعی است. دکتر «سید مصطفی کلامی هریس»، در پادکستی که در ادامه آمده، به این پرسش به طور مشروح پاسخ داده است. نسخه متنی این پادکست نیز در همین مطلب قرار دارد. البته، منبع اصلی همچنان فایل صوتی محسوب می‌شود.

پادکست پیرامون نظریه بازی

ذخیره کردن این فایل صوتی: لینک دانلود

نسخه نوشتاری

یکی از دوستان سوالی را مطرح کردند مبنی بر اینکه «نظریه بازی‌ها» (Game Theory) چیست، آیا به «هوش مصنوعی» (Artificial Intelligence) ارتباط دارد، ساختارش به چه شکل است و چگونه می‌توان آن را پیاده‌سازی کرد؟ نظریه بازی‌ها، در واقع یک مبحث ریاضی با عنوان انگلیسی Game Theory است. نظریه بازی از جمله مباحثی است که در حال حاضر در حوزه‌ها مختلف کاربرد دارد؛ از زمینه‌های کاربرد نظریه بازی، به طور خاص می‌توان به اقتصاد و علوم سیاسی اشاره کرد.

یکی از اثرگذارترین چهره‌ها در حوزه نظریه بازی‌ها، «جان نش» (John Forbes Nash) ریاضیدان معاصر بوده است که در سال 2015 از دنیا رفت؛ فیلم «ذهن زیبا» (A Beautiful Mind) مربوط به بررسی زندگی ایشان است. البته فیلم را خیلی زیاد داستانی کرده‌اند و برخی مواقع یک مقدار از واقعیت فاصله گرفته‌اند، ولی تماشای این فیلم را به همه و به ویژه، علاقه‌مندان به ریاضی، توصیه می‌کنم. البته بسیاری از افراد نیز احتمالا این فیلم را دیده‌اند. نکته جالب توجه آن است که جان نش در سال 2015 برای دریافت «جایزه آبل» (Abel Prize) به نروژ رفته بود و هنگامی که از آنجا بازگشت، در آمریکا و در مسیر بازگشت به خانه، در تاکسی فرودگاه تصادف می‌کند و از دنیا می‌رورد. آقای نش، واقعا تلاش‌های ارزشمندی را انجام داده‌اند و در سال ۱۹۹۴، به دلیل تلاش‌هایی که در بحث کاربرد نظریه بازی‌ها در اقتصاد انجام داده بودند، به همراه دو نفر دیگر (جان هارسانی و راینهارد سیلتن) جایزه نوبل اقتصاد را دریافت کردند.

اما نظریه بازی‌ها چیست؟ اصلا اسم این بحث روی آن هست: بازی. خیلی از مسائلی که ما در دنیای واقعی و به ویژه در اقتصاد داریم واقعا یک بازی محسوب می‌شوند و می‌توان به دید یک بازی به آن‌ها نگاه کرد. مثلا اینکه دو نفر در حال مذاکره یا رقابت هستند و یا، دو یا چند شرکت برای اینکه بازاری را تصاحب کنند در حال رقابت هستند. همه این موارد می‌توانند به صورت کلی به شکل یک بازی بیان شوند. البته منظور از بازی در اینجا دنبال تفریح بودن نیست. نه؛ بازی در اینجا یک مفهوم کلی‌تر دارد و موضوع از این قرار است که هر کس یک بازیکن به حساب می‌آید. یک بازیگر در این بازی، یک سری اعمالی (Actions) را می‌تواند انجام بدهد، یک سری تصمیمات را می‌تواند بگیرد و خوب طبعا یک سری نتایج و عواید هم خواهد داشت. این عواید می‌تواند سود و زیان باشد. نکته جالب توجه این است که تعیین این موضوع که چگونه و چه استراتژی را انتخاب کنیم که در نهایت به نتیجه بهتری برسیم، نیاز به این دارد که ما، بازی، محیط و بازیکن یا بازیکنان مقابل را بشناسیم و بدانیم که چه کاری انجام دهیم تا بیشترین سود ممکن را به دست بیاوریم.

واقعیت این است که همه به سهم خودشان در یک محیط رقابتی اقتصادی، دنبال این هستند که بیشترین سود را به دست بیاورند، اما همین موضوع شاید به نوعی بلای جانشان شده و موجب شود که اتفاقا نتیجه بدتری بگیرند. برخی مواقع نیز هست که یک چیزی که می‌توانست ایده‌آل باشد، به دلیل اینکه همه دنبال منافع هستند، هیچ کس به این چیز ایده‌آل نمی‌رسد. یکی از مثال‌های جالب این موضوع، «معمای زندانی» یا همان «Prisoner’s Dilemma» است. بر اساس این معمای خیلی جالب، دو نفر سارق (یا دو نفر متهم به سرقت) را دستگیر کرده‌اند. پلیس به طور جداگانه به هر یک از این زندانی‌ها پیشنهادهایی را می‌دهد و می‌گوید شما دو راه (دو گزینه) دارید، یا اینکه همکاری کرده و اعتراف می‌کنید که در سرقت اخیر به همراه دوستتان (دیگر زندانی) شرکت کرده‌اید، یا اینکه اعتراف نمی‌کنید. بنابراین، در اینجا چهار حالت وجود دارد، زیرا هر زندانی، دو عمل (Action) می‌تواند انجام بدهد، یعنی یا همکاری می‌کند و یا با پلیس همکاری نمی‌کند.

حالا به این افراد گفته می‌شود که اگر هر دو شما اعتراف کنید به عنوان مثال هر دو یک سال به زندان می‌روید، اگر هیچ کدام اعتراف نکنید و سرقت را بر عهده نگیرید هر دو آزاد می‌شوید و اگر یکی اعتراف کند و دیگری اعتراف نکند، کسی که همکاری کرده در مجازات خود تخفیف می‌گیرد و مثلا به جای یک سال، شش ماه به زندان می‌رود و کسی که همکاری نکردن و مشارکت در سرقت را کتمان کرده به خاطر دروغ گفتن سه سال به زندان می‌رود. مساله حالا جالب می‌شود، زیرا هر زندانی به صورت حسی بررسی می‌کند و می‌بیند که مستقل از اینکه طرف مقابل (دوستش که در واقع زندانی دیگر است) چه عملی انجام دهد، به صلاح خودش است که اعتراف کند. با توجه به اینکه اعتراف کردن همیشه به نفع فرد است (ولی در حالتی که اعتراف نکند ممکن است ضرر زیادی کند چون دوست او اگر اعتراف کند، جرم فردی که اعتراف نکرده بیشتر می‌شود)، می‌توان گفت که افراد همیشه اعتراف می‌کنند.

اصطلاحا، این بازی (معمای دو زندانی) که در مورد آن صحبت کردیم، به یک نقطه تعادلی همگرا می‌شود که ما آن را با عنوان «تعادل نش» (Nash Equilibrium) می‌شناسیم. تعادل نش نتیجه مطالعاتی است که جان نش در این حوزه داشته و بنابراین، این اسم روی آن گذاشته شده است. مثالی که بیان شد، یک بازی است و در پاسخ به چرایی اینکه چرا چنین چیزی اتفاق می‌افتد یک تحلیل وجود دارد. باید گفت دلیلی که ما را قادر می‌سازد این بازی را تحلیل و پیش‌بینی کنیم و یا به عنوان یک بازیگر در این بازی، استراتژی مناسب‌تری را اتخاذ کنیم، علم «نظریه بازی‌ها» است. نظریه بازی، کاربردهای بسیار زیادی در زمینه‌های گوناگون، از رقابت‌های اقتصادی گرفته تا رقابت بین کشورها، رقابت در فضای سیاسی چه در سیاست داخلی و چه در سیاست خارجی، دارد و همه جا این نظریه را می‌توان مطرح کرد و کاربردهای خیلی جالبی را پیدا کرده است.

در پاسخ به این پرسش که آیا نظریه بازی‌ها ارتباطی با هوش مصنوعی دارد، باید گفت: بله؛ یک زمانی هست حل بسته برای یک بازی نمی‌توانید پیدا بکنید یا بازی نایقینی دارد، یا بازی تصادفی (Stochastic) است. بازی در شرایط گفته شده با روش‌های عادی قابل تحلیل و انجام نیست و در اینجا است که بازی می‌تواند به عنوان یک مساله هوش مصنوعی مطرح بشود که با نظریه بازی قابل حل است. اینچنین نیست که نظریه بازی‌ها یک بخش از هوش مصنوعی باشد یا هوش مصنوعی بخشی از نظریه بازی‌ها، نه؛ این دو هیچ ارتباطی به هم ندارند، اما برخی مواقع می‌توانند هم‌پوشانی داشته باشند و از هوش مصنوعی برای حل یک بازی و تحلیل یک بازی استفاده بشود.

در رابطه با چگونگی پیاده‌سازی نظریه بازی، باید گفت واقعیت این است که در اینجا پیاده‌سازی در کار نیست و در واقع بحث تحلیل است. شما می‌توانید یک بازی را شبیه‌سازی و یک استراتژی اتخاذ شده در یک بازی را اصطلاحا Verify و Validate کنید، ببینید درست است یا نه؟ این در واقع شبیه‌سازی مساله به صورت عددی است؛ اما برخی مواقع، موضوع پیچیده‌تر از این حرف‌ها است و باید در واقع تحلیل ریاضی انجام شود و پیاده‌سازی اغلب در قالب یک سری از مسائل در واقع ریاضی است که پیچیده هستند و بعضا برای حل عددی آن‌ها است که باید دنبال پیاده‌سازی باشیم. برای دوستانی که رشته آن‌ها مهندسی کنترل است، این مورد را نیز بیان کنم که بحث «کنترل بهینه» (Optimal Control) ارتباط‌های خیلی نزدیکی را با بحث نظریه بازی می‌تواند داشته باشد. یعنی خود حل یک بازی و یک استراتژی بهینه، می‌تواند در قالب یک مساله کنترل بهینه بیان شود. از طرف دیگر، دوستانی که در شاخه هوش‌مصنوعی فعال هستند، می‌دانند که «یادگیری تقویتی» (Reinforcement Learning) نیز می‌تواند همین نقش را داشته باشد و در واقع اکنون ما این را می‌دانیم که یادگیری تقویتی می‌تواند یکی از روش‌های کنترل بهینه می‌تواند محسوب شود. ترکیب کردن این موارد می‌تواند یک مبحث «میان رشته‌ای» (Interdisciplinary) محسوب و از آن‌ها (چه روش‌های کنترلی و چه روش‌های هوشمند) برای حل و تحلیل یک بازی استفاده شود. من سعی کردم به صورت خلاصه به این موضوعات بپردازم، ولی واقعا مباحث خیلی گسترده‌ای هستند. دوره‌ها و منابع زیادی برای بحث نظریه بازی‌ها وجود دارد که علاقه‌مندان می‌توانند به آن‌ها مراجعه کرده و بیشتر مطالعه کنند.

برای دانلود و شنیدن دیگر پادکست‌های دکتر سید مصطفی کلامی هریس در مجله فرادرس، روی این لینک [+] کلیک کنید.

اگر نوشته بالا برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

telegram
twitter

الهام حصارکی

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

بر اساس رای 2 نفر

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *