نظریه بازی چیست؟ — پادکست پرسش و پاسخ

«نظریه بازی» (Game Theory)، مطالعه مدلهای ریاضیاتی مربوط به تعاملات استراتژیک، بین تصمیمگیرندگان منطقی است و کاربردهای متعددی در زمینهها و علوم گوناگون دارد. پرسشی که برای برخی افراد مطرح میشود، مفهوم دقیق و به زبان ساده «نظریه بازی»، کاربردها، چگونگی پیادهسازی و ارتباط آن با علوم دیگر به ویژه هوش مصنوعی است. دکتر «سید مصطفی کلامی هریس»، در پادکستی که در ادامه آمده، به این پرسش به طور مشروح پاسخ داده است. نسخه متنی این پادکست نیز در همین مطلب قرار دارد. البته، منبع اصلی همچنان فایل صوتی محسوب میشود.
پادکست پیرامون نظریه بازی
ذخیره کردن این فایل صوتی: لینک دانلود
نسخه نوشتاری
یکی از دوستان سوالی را مطرح کردند مبنی بر اینکه «نظریه بازیها» (Game Theory) چیست، آیا به «هوش مصنوعی» (Artificial Intelligence) ارتباط دارد، ساختارش به چه شکل است و چگونه میتوان آن را پیادهسازی کرد؟ نظریه بازیها، در واقع یک مبحث ریاضی با عنوان انگلیسی Game Theory است. نظریه بازی از جمله مباحثی است که در حال حاضر در حوزهها مختلف کاربرد دارد؛ از زمینههای کاربرد نظریه بازی، به طور خاص میتوان به اقتصاد و علوم سیاسی اشاره کرد.
یکی از اثرگذارترین چهرهها در حوزه نظریه بازیها، «جان نش» (John Forbes Nash) ریاضیدان معاصر بوده است که در سال 2015 از دنیا رفت؛ فیلم «ذهن زیبا» (A Beautiful Mind) مربوط به بررسی زندگی ایشان است. البته فیلم را خیلی زیاد داستانی کردهاند و برخی مواقع یک مقدار از واقعیت فاصله گرفتهاند، ولی تماشای این فیلم را به همه و به ویژه، علاقهمندان به ریاضی، توصیه میکنم. البته بسیاری از افراد نیز احتمالا این فیلم را دیدهاند. نکته جالب توجه آن است که جان نش در سال 2015 برای دریافت «جایزه آبل» (Abel Prize) به نروژ رفته بود و هنگامی که از آنجا بازگشت، در آمریکا و در مسیر بازگشت به خانه، در تاکسی فرودگاه تصادف میکند و از دنیا میرورد. آقای نش، واقعا تلاشهای ارزشمندی را انجام دادهاند و در سال ۱۹۹۴، به دلیل تلاشهایی که در بحث کاربرد نظریه بازیها در اقتصاد انجام داده بودند، به همراه دو نفر دیگر (جان هارسانی و راینهارد سیلتن) جایزه نوبل اقتصاد را دریافت کردند.
اما نظریه بازیها چیست؟ اصلا اسم این بحث روی آن هست: بازی. خیلی از مسائلی که ما در دنیای واقعی و به ویژه در اقتصاد داریم واقعا یک بازی محسوب میشوند و میتوان به دید یک بازی به آنها نگاه کرد. مثلا اینکه دو نفر در حال مذاکره یا رقابت هستند و یا، دو یا چند شرکت برای اینکه بازاری را تصاحب کنند در حال رقابت هستند. همه این موارد میتوانند به صورت کلی به شکل یک بازی بیان شوند. البته منظور از بازی در اینجا دنبال تفریح بودن نیست. نه؛ بازی در اینجا یک مفهوم کلیتر دارد و موضوع از این قرار است که هر کس یک بازیکن به حساب میآید. یک بازیگر در این بازی، یک سری اعمالی (Actions) را میتواند انجام بدهد، یک سری تصمیمات را میتواند بگیرد و خوب طبعا یک سری نتایج و عواید هم خواهد داشت. این عواید میتواند سود و زیان باشد. نکته جالب توجه این است که تعیین این موضوع که چگونه و چه استراتژی را انتخاب کنیم که در نهایت به نتیجه بهتری برسیم، نیاز به این دارد که ما، بازی، محیط و بازیکن یا بازیکنان مقابل را بشناسیم و بدانیم که چه کاری انجام دهیم تا بیشترین سود ممکن را به دست بیاوریم.
واقعیت این است که همه به سهم خودشان در یک محیط رقابتی اقتصادی، دنبال این هستند که بیشترین سود را به دست بیاورند، اما همین موضوع شاید به نوعی بلای جانشان شده و موجب شود که اتفاقا نتیجه بدتری بگیرند. برخی مواقع نیز هست که یک چیزی که میتوانست ایدهآل باشد، به دلیل اینکه همه دنبال منافع هستند، هیچ کس به این چیز ایدهآل نمیرسد. یکی از مثالهای جالب این موضوع، «معمای زندانی» یا همان «Prisoner's Dilemma» است. بر اساس این معمای خیلی جالب، دو نفر سارق (یا دو نفر متهم به سرقت) را دستگیر کردهاند. پلیس به طور جداگانه به هر یک از این زندانیها پیشنهادهایی را میدهد و میگوید شما دو راه (دو گزینه) دارید، یا اینکه همکاری کرده و اعتراف میکنید که در سرقت اخیر به همراه دوستتان (دیگر زندانی) شرکت کردهاید، یا اینکه اعتراف نمیکنید. بنابراین، در اینجا چهار حالت وجود دارد، زیرا هر زندانی، دو عمل (Action) میتواند انجام بدهد، یعنی یا همکاری میکند و یا با پلیس همکاری نمیکند.
حالا به این افراد گفته میشود که اگر هر دو شما اعتراف کنید به عنوان مثال هر دو یک سال به زندان میروید، اگر هیچ کدام اعتراف نکنید و سرقت را بر عهده نگیرید هر دو آزاد میشوید و اگر یکی اعتراف کند و دیگری اعتراف نکند، کسی که همکاری کرده در مجازات خود تخفیف میگیرد و مثلا به جای یک سال، شش ماه به زندان میرود و کسی که همکاری نکردن و مشارکت در سرقت را کتمان کرده به خاطر دروغ گفتن سه سال به زندان میرود. مساله حالا جالب میشود، زیرا هر زندانی به صورت حسی بررسی میکند و میبیند که مستقل از اینکه طرف مقابل (دوستش که در واقع زندانی دیگر است) چه عملی انجام دهد، به صلاح خودش است که اعتراف کند. با توجه به اینکه اعتراف کردن همیشه به نفع فرد است (ولی در حالتی که اعتراف نکند ممکن است ضرر زیادی کند چون دوست او اگر اعتراف کند، جرم فردی که اعتراف نکرده بیشتر میشود)، میتوان گفت که افراد همیشه اعتراف میکنند.
اصطلاحا، این بازی (معمای دو زندانی) که در مورد آن صحبت کردیم، به یک نقطه تعادلی همگرا میشود که ما آن را با عنوان «تعادل نش» (Nash Equilibrium) میشناسیم. تعادل نش نتیجه مطالعاتی است که جان نش در این حوزه داشته و بنابراین، این اسم روی آن گذاشته شده است. مثالی که بیان شد، یک بازی است و در پاسخ به چرایی اینکه چرا چنین چیزی اتفاق میافتد یک تحلیل وجود دارد. باید گفت دلیلی که ما را قادر میسازد این بازی را تحلیل و پیشبینی کنیم و یا به عنوان یک بازیگر در این بازی، استراتژی مناسبتری را اتخاذ کنیم، علم «نظریه بازیها» است. نظریه بازی، کاربردهای بسیار زیادی در زمینههای گوناگون، از رقابتهای اقتصادی گرفته تا رقابت بین کشورها، رقابت در فضای سیاسی چه در سیاست داخلی و چه در سیاست خارجی، دارد و همه جا این نظریه را میتوان مطرح کرد و کاربردهای خیلی جالبی را پیدا کرده است.
در پاسخ به این پرسش که آیا نظریه بازیها ارتباطی با هوش مصنوعی دارد، باید گفت: بله؛ یک زمانی هست حل بسته برای یک بازی نمیتوانید پیدا بکنید یا بازی نایقینی دارد، یا بازی تصادفی (Stochastic) است. بازی در شرایط گفته شده با روشهای عادی قابل تحلیل و انجام نیست و در اینجا است که بازی میتواند به عنوان یک مساله هوش مصنوعی مطرح بشود که با نظریه بازی قابل حل است. اینچنین نیست که نظریه بازیها یک بخش از هوش مصنوعی باشد یا هوش مصنوعی بخشی از نظریه بازیها، نه؛ این دو هیچ ارتباطی به هم ندارند، اما برخی مواقع میتوانند همپوشانی داشته باشند و از هوش مصنوعی برای حل یک بازی و تحلیل یک بازی استفاده بشود.
در رابطه با چگونگی پیادهسازی نظریه بازی، باید گفت واقعیت این است که در اینجا پیادهسازی در کار نیست و در واقع بحث تحلیل است. شما میتوانید یک بازی را شبیهسازی و یک استراتژی اتخاذ شده در یک بازی را اصطلاحا Verify و Validate کنید، ببینید درست است یا نه؟ این در واقع شبیهسازی مساله به صورت عددی است؛ اما برخی مواقع، موضوع پیچیدهتر از این حرفها است و باید در واقع تحلیل ریاضی انجام شود و پیادهسازی اغلب در قالب یک سری از مسائل در واقع ریاضی است که پیچیده هستند و بعضا برای حل عددی آنها است که باید دنبال پیادهسازی باشیم. برای دوستانی که رشته آنها مهندسی کنترل است، این مورد را نیز بیان کنم که بحث «کنترل بهینه» (Optimal Control) ارتباطهای خیلی نزدیکی را با بحث نظریه بازی میتواند داشته باشد.
یعنی خود حل یک بازی و یک استراتژی بهینه، میتواند در قالب یک مساله کنترل بهینه بیان شود. از طرف دیگر، دوستانی که در شاخه هوشمصنوعی فعال هستند، میدانند که «یادگیری تقویتی» (Reinforcement Learning) نیز میتواند همین نقش را داشته باشد و در واقع اکنون ما این را میدانیم که یادگیری تقویتی میتواند یکی از روشهای کنترل بهینه میتواند محسوب شود. ترکیب کردن این موارد میتواند یک مبحث «میان رشتهای» (Interdisciplinary) محسوب و از آنها (چه روشهای کنترلی و چه روشهای هوشمند) برای حل و تحلیل یک بازی استفاده شود. من سعی کردم به صورت خلاصه به این موضوعات بپردازم، ولی واقعا مباحث خیلی گستردهای هستند. دورهها و منابع زیادی برای بحث نظریه بازیها وجود دارد که علاقهمندان میتوانند به آنها مراجعه کرده و بیشتر مطالعه کنند.
برای دانلود و شنیدن دیگر پادکستهای دکتر سید مصطفی کلامی هریس در مجله فرادرس، روی این لینک [+] کلیک کنید.
اگر نوشته بالا برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای هوش مصنوعی
- آموزش نظریه بازیها (Game theory)
- مجموعه آموزشهای متلب MATLAB
- آموزش پیادهسازی تئوری بازیها در متلب (MATLAB)
- آموزش نظریه بازیها (Game theory)
- پدیده هیسترزیس در اقتصاد — ثابت ماندن نرخ بالای بیکاری
^^