نظریه بازی ها چیست؟ – توضیح به زبان ساده با مثال


نظریه بازی ها یا Game Theory نوعی تحلیل ریاضیاتی برای داشتن یک تصمیمگیری بهینه است. در این نظریه هر گونه عمل و عکسالعمل بین دو بازیکن (یا تعداد بیشتر) که شامل قوانین خاصی است، در قالب کلمه «بازی» بیان میشود. نظریه بازی ها یکی از مباحث مهم برای دانشجویان رشتههای مختلفی از جمله اقتصاد، مهندسی صنایع، ریاضیات، مهندسی و علوم کامپیوتر محسوب میشود. همچنین موضوعات مختلف این نظریه در تحلیل مسائل اقتصادی، سیاسی، علوم اجتماعی و علوم زیستی بکار میروند. کاربرد این نظریه در اقتصاد به حدی شگفتانگیز است که فیلم سینمایی معروف «ذهن زیبا» بر همین اساس ساخته شده است. در این مطلب از مجله فرادرس یاد میگیریم نظریه بازی ها چیست و چه مفاهیمی در آن مطرح میشود.
ابتدا بهتر است برخی از اصطلاحات مهم و پرکاربرد در نظریه بازی ها را بشناسیم. بنابراین بخشهای ابتدایی این نوشته به معرفی و تعریف مفاهیمی مانند بازی، تعادل نش، کارایی پارتو و پارادوکس نیوکامب اختصاص داده شده است. در ادامه، صورت مسئله چند بازی معروف مانند بازی هماهنگی، بازی جوجه، دو راهی زندانی، بازی شکار گوزن و بازی دیکتاتور توضیح داده میشود. همچنین نشان میدهیم که نظریهپردازان بازی، چطور این بازیها را مدلسازی کرده و به زبان ریاضیات به طرح مسئله میپردازند. در هر بخش رویکردها یا روشهای مختلف استدلال و تحلیل مسائل در نظریه بازی ها را توضیح خواهیم داد. این نوشته با برشمردن کاربردهای گیم تئوری به پایان میرسد.
نظریه بازی ها چیست؟
نظریه بازی ها به مطالعه بازیها و بررسی علت و چگونگی داشتن یک تصمیمگیری بهینه در موقعیتهای مختلف یک بازی میپردازد. نظریه بازی در حقیقت «علم استراتژی» محسوب میشود و به ما کمک میکند تا بتوانیم بهترین تصمیمگیری ممکن را در موقعیتهای استراتژیک و در شرایطی که بازیکنها در حال رقابتی وابسته به هم هستند، داشته باشیم. نظریهپردازان بازی تلاش میکنند تا بازیها را به گونهای مدلسازی کنند که بتوانیم بهراحتی آنها را درک و تحلیل کنیم. با اینکه بازیهای زیادی وجود دارند که دارای ویژگیهای مشترکی هستند یا در آنها الگوی یکسانی تکرار میشود، اما بازیهای پیچیدهتری نیز وجود دارند که درک آنها مشکل است.
در نیمه دوم قرن بیستم پیشرفت نظریه بازی ها در حدی بوده است که کاربرد آن منجر به دریافت چندین جایزه نوبل برای اقتصاددانان شد. همچنین استفاده از این نظریه در زمینه زیستشناسی، علوم کامپیوتر و علوم سیاسی نیز پیشرفتهای زیاد و جالبی را به همراه داشته است. برای شروع، ابتدا بازی را تعریف میکنیم. پس از یادگیری تعریف بازی، بهتر متوجه خواهید شد که نظریه بازی ها چیست.

تعریف بازی
برای اینکه بهتر متوجه شویم نظریه بازی ها چیست، ابتدا باید تعریف دقیق و علمی بازی در ریاضیات را مشخص کنیم. بازی در ریاضی به معنای وقوع یک سری موقعیت استراتژیک است که در آن شرکتکنندههای مختلفی وجود دارند و نتیجه تصمیماتی که هر کدام از شرکتکنندهها میگیرد، همزمان به تصمیمات آن فرد و تصمیمات سایر شرکتکنندگان بستگی دارد. با توجه به این تعریف، برای مثال سودوکو یک بازی محسوب نمیشود، چون آنچه که شما در حین حل جدول سودوکو انجام میدهید، از آنچه که هر شخص دیگری برای حل سودوکو انجام میدهد، کاملا مستقل است.

در مقابل، شطرنج را میتوانیم یک بازی بدانیم. در بازی شطرنج اینکه شما پیروز شوید یا نه کاملا به حرکت هر مهره توسط شما و حرکتهای شخص دیگری که در مقابل شما است، بستگی دارد. به همین شکل، برد یا باخت شخص مقابل شما نیز به حرکتهای خودش و حرکتهای شما بستگی دارد. نکته مهم در مورد بازی شطرنج این است که نحوه بازی شما کاملا به بازی طرف مقابل بستگی دارد. پس در این بازی تصمیمات دو شرکتکننده به هم وابسته است. اما در بازی سودوکو نحوه حل جدول توسط شما به تصمیمات شخص یا اشخاص دیگری بستگی ندارد. برای اینکه با اصول تصمیمگیری بهینه بیشتر آشنا شوید، پیشنهاد میکنیم به مطلب زیر از مجله فرادرس مراجعه کنید:
چگونه نظریه بازی ها را با فرادرس بهتر یاد بگیریم؟
تا اینجا آموختیم که تعریف بازی در نظریه بازی ها چیست. اما پیش از شروع یادگیری مهمترین اصطلاحات و مفاهیم این شاخه مهم از علم ریاضیات و علوم کامپیوتر، در این بخش قصد داریم مجموعه دورههای آموزشی که در همین زمینه در مجموعه فرادرس تهیه شده است را به شما معرفی کنیم. مشاهده این فیلمهای آموزشی به شما کمک میکند تا با بهرهگیری از مزایای آموزش ویدئویی کاملا به این مباحث و کاربردهای آن مسلط شوید. همچنین با روشهای پیادهسازی نظریه بازی ها در محیطهای نرمافزاری مانند متلب آشنا خواهید شد:

- فیلم آموزش نظریه بازی ها یا گیم تئوری Game Theory فرادرس
- فیلم آموزش پیاده سازی نظریه بازی یا گیم تئوری Game Theory در متلب MATLAB فرادرس
- فیلم آموزش نظریه بازی ها یا گیم تئوری و کاربرد آن در اقتصاد فرادرس
تعادل نش (Nash Equilibrium)
مجموعه استراتژیهایی که با در پیش گرفتن آنها هیچ یک از شرکتکنندهها نمیتوانند پاداش خود را با تغییر استراتژی بهتر کنند، «تعادل نش» نامیده میشود. برقراری تعادل نش به این معنا است که اگر به هر کدام از بازیکنان استراتژی بازیکنان مقابل گفته شود، باز هم انتخاب منطقی و بر پایه عقلانیت برای هر بازیکن همان استراتژی قبلی است. با این وجود یک سری محدودیتهای عملی در مورد تعادل نش وجود دارد که باعث شده است شرایطی برای برقراری تعادل نش بهصورت زیر در نظر گرفته شود:
- تمام بازیکنان فقط به بیشتر کردن پاداش مورد انتظار خود علاقهمند هستند و در همین راستا استراتژی خود را انتخاب میکنند.
- تمام بازیکنان استراتژیهای خود را بهخوبی اجرا میکنند.
- تمام بازیکنان برای تعیین راهحل بازی به اندازه کافی باهوش هستند.
- هر بازیکن استراتژی تعادل برنامهریزی شده سایر بازیکنان را میداند (یا نتیجهگیری میکند).
- هر بازیکن میداند یا نتیجهگیری میکند که تغییر استراتژی یک بازیکن، موجب تغییر استراتژی سایر بازیکنان نخواهد شد.
- تمام موارد بیان شده برای کلیه بازیکنان بازی برقرار است، یعنی هر بازیکن میداند که سایر بازیکنان نیز این شرایط را دارند.

البته تمام این شرایط عملا در هر بازی برقرار نیستند. برای مثال، در بازی معمای زندانی (در بخشهای بعد صورت مسئله این معما کاملا توضیح داده شده است) ممکن است یک زندانی در صورت اعتراف کردن با قصاص روبرو شود. چنین شرایطی موجب میشود این زندانی کمتر در تصمیمگیری خود به دوراهی نزدیک شود. همچنین ممکن است در یک بازی نوعی، یک بازیکن هوش کافی در زمینه بکارگیری بهترین استراتژی را نداشته باشد یا بازیکنی عمدا یا تصادفا استراتژی خود را کامل اجرا نکند. همچنین اغلب بازیکنان به درست یا غلط معتقداند که سایر بازیکنان یک استراتژی کاملا اخلاقی را در پیش نمیگیرند. این نکته یکی از مهمترین نگرانیهای نظریه بازی ها است، بهویژه در موضوعاتی نظیر جنگ هستهای.
در حالت کلی هر بازی ممکن است چندین تعادل نش داشته باشد، اما مسئله دوراهی زندانی که در بخشهای بعد به آن خواهیم پرداخت، فقط یک تعادل نش دارد. از تعادل نش در بررسی و تحلیل سناریوهای رقابتی زیاد استفاده میشود. مثال ملموس این موقعیت در جنگها است. با توجه به توضیحات بالا بیشتر بازیها عملا با تعادل نش بهخوبی مدلسازی نمیشوند. اما این مبحث برای توضیح روند مسائل اقتصادی و تکامل در زیستشناسی سودمند است. در بخشهای بعد و در قالب حل مثال نشان میدهیم نحوه پیدا کردن تعادل نش در یک بازی چگونه است و در نتیجه، بهتر متوجه خواهید شد که مفهوم این اصطلاح در نظریه بازی ها چیست.
مثال تعادل نش در بازی هماهنگی یا Coordination Game
در بازی هماهنگی زمانی بازیکنان بیشترین سود را خواهند داشت که انتخابهای خود را با هم هماهنگ کنند. در حقیقت در این بازی دو بازیکن داریم که هر دو از هماهنگ شدن سود میبرند، اما ممکن است هر کدام بخواهند ترجیحات خود را نیز داشته باشند. برای مثال، دو دوست تصمیم میگیرند که یک بعد از ظهر را در کنار هم با دیدن فیلم یا برگزاری مهمانی سپری کنند. قطعا در این موقعیت هر دو دوست تمایل دارند که به فعالیت مشترکی مشغول شوند، اما ممکن است ترجیح هر کدام با دیگری در مورد این دو انتخاب متفاوت باشد.

برای اینکه درک بهتری از چنین موقعیتی داشته باشیم، ترجیح دو بازیکن این بازی را با فاکتورهای عددی نشان داده و در نتیجه کلیه ترکیبات ممکن را در قالب ماتریسی به شکل بالا خواهیم داشت. این ماتریس، ماتریس پاداش یا Payoff Matrix نامیده میشود که در آن استراتژیهای اولین بازیکن، عدد سمت چپ و استراتژیهای دومین بازیکن، عدد سمت راست است. در این مثال در هر دو حالت (پارتی، پارتی) و (فیلم، فیلم) تعادل نش برقرار است. اما در حالتهای یا ترجیح هر کدام از دو بازیکن به یکی از دو فعالیت موردنظر است، به همین دلیل از اعداد و برای نشان دادن ترجیح یک فعالیت بر دیگری استفاده شده است. در این دو حالت تعادل نش نداریم.
نحوه پیدا کردن تعادل نش
در حالت کلی پیدا کردن تعادل نش خالص که در آن هیچگونه تصادفی رخ نداده باشد، آسان است. کافی است تمام حالتهای ممکن و مقادیر پاداش متناظر با آنها را با هم مقایسه کنیم. برای نمونه، فرض کنید ماتریش پاداش در یک بازی به شکل زیر داده شده است. در این بازی هر بازیکن سه استراتژی برای انتخاب دارد و برای مثال، اولین بازیکن پاداشی به اندازه سلول متناظر دریافت میکند. بنابراین هدف این بازیکن این است که پاداش خود را به بیشترین مقدار ممکن برساند، در حالی که هدف بازیکن دوم این است که پاداش بازیکن اول حداقل مقدار ممکن شود:

تعادل نش در این بازی زمانی رخ میدهد که هیچ بازیکنی انگیزهای برای تغییر استراتژی خود نداشته باشد، حتی اگر رقبای خود را بشناسد. این بدان معنا است که سلول نمایشدهنده تعادل نش، سلولی است که در ردیف خود حداقل مقدار و در ستون خود بیشترین مقدار پاداش را داشته باشد. این تنها حالتی است که هیچ بازیکنی استراتژی خود را تغییر نمیدهد. بر این اساس، در این بازی تنها حالتی که در آن تعادل نش رخ میدهد زمانی است که بازیکن اول استراتژی و بازیکن دوم استراتژی را انتخاب کند، چون هیچ کدام از بازیکنان نمیخواهد از پاداش دور شود.
کارایی پارتو (Pareto Efficiency)
گفتیم یکی از کاربردهای عملی مفاهیم نظریه بازی ها در تحلیل مسائل اقتصادی و بازار است. «کارایی پارتو» در بازار زمانی رخ میدهد که هیچ گونه تخصیص منابعی برای بهتر کردن وضعیت یک شخص بدون اینکه همزمان وضعیت شخص دیگری بدتر شود، ممکن نیست اتفاق بیفتد. برای نمونه، در بازاری شامل دو شخص که هر دو علاقه تمامنشدنی به شکلات دارند، یکی از این دو نفر که تمام شکلاتها در اختیار اوست، در وضعیت کارایی پارتو محسوب میشود (حتی اگر این وضعیت به نوعی انحصار این محصول باشد). اگر این شخص حتی یک عدد شکلات به دیگری بدهد، در این صورت دچار زیان خواهد شد.
برای درک دقیقتر مفهوم کارایی پارتو در نظریه بازی ها، فرض کنید ده بار شکلات وارد بازار شده است. در این صورت اگر تمام این ده بار شکلات به یک نفر داده شود، کارایی پارتو داریم. همچنین اگر پنج بار به یک نفر و پنج بار دیگر به یک نفر دیگر داده شود یا هر نوع اختصاص دیگری، در تمام این موارد کارایی پارتو برقرار است. در حقیقت تمام اختصاصهای اولیه بازار کارایی پارتو محسوب میشوند، چون در تمام این حالتها دو نفر به شکلات علاقه دارند و هیچ شکلاتی از یکی گرفته نشده است تا به دیگری داده شود. بنابراین در این مرحله سود و زیانی طبق تعریف کارایی پارتو نداریم.

با اینکه در حالت کلی این نوع توزیع منابع از نظر جامعه عادلانه و بهینه نیست، اما کارایی پارتو یکی از سودمندترین مدلهای نظریه بازی ها در زمینه اقتصاد است و تعیین میکند که آیا یک سیستم یا بازار در وضعیت کارایی و سود قرار دارد یا خیر. تعریف دقیقتر کارای پارتو به این شکل است: فرض کنید مقداری تخصیص منابع داریم که از تخصیص منابع دیگری به نام بهتر است. در این صورت اگر وضعیت هر شخص نسبت به قبل بهتر شود، بدون اینکه وضعیت شخص دیگری بدتر شود، میگوییم نوعی پیشرفت پارتو برای محسوب میشود یا پارتوی غالب بر است. پس در این مثال وضعیت کارایی پارتو ندارد.
دقت کنید کارایی پارتو باید یک مفهوم مطلق باشد، یعنی اگر تخصیص دیگری وجود دارد که از تخصیص جاری بهتر است، تخصیص جاری نمیتواند کارایی پارتو محسوب شود. به مثال زیر در این زمینه توجه کنید تا بهتر بیاموزید معنای کارایی پارتو در نظریه بازی ها چیست. همچنین در بخش معمای زندانی خواهیم دید که در این بازی نتایج حاصل از تحلیل کارایی پارتو و تعادل نش با هم متفاوت است.
مثال بررسی کارایی پارتو در بازار
فرض کنید در بازاری با دو شخص و ، ده بار شکلات و ده عدد کلوچه وارد میشود. شخص هر دو محصول را دوست دارد، اما علاقهاش به شکلات دو برابر کلوچه است. از طرفی شخص نیز هر دو محصول را دوست دارد، اما از کلوچه دو برابر شکلات لذت میبرد. میخواهیم ببینیم توزیع کارایی پارتو برای این دو منبع در این بازار چگونه است. بنظر میرسد توزیع این دو محصول به شیوهای که کارایی پارتو برقرار باشد، در یکی از دو حالت زیر اتفاق میافتد:
- شخص هیچ کلوچهای نداشته باشد.
- شخص هیچ شکلاتی نداشته باشد.
برای چک کردن درستی این دو وضعیت طبق تعریف کارایی پارتو، باید ببینیم آیا توزیع دیگری میتوانیم در نظر بگیریم که طبق آن با سود یک نفر، نفر دیگر ضرر نکند. همچنین باید این نکته را هم در نظر بگیریم که هر شخصی که بخشی از منابع را از دست بدهد، ضرر میکند، فارغ از اینکه آن محصول موردعلاقه او بوده است یا نه. پس مسئله سود اقتصادی و تجاری در اینجا مطرح است. همچنین میدانیم تمام حالتهای اختصاص اولیه نیز کارایی پارتو محسوب میشوند. جمعبندی این توضیحات سه حالت زیر را به عنوان کارایی پارتو به ما میدهد:
- شخص تمام شکلاتها و کلوچهها را دارد (طبق دومین شرایط بالا).
- شخص تمام شکلاتها و کلوچهها را دارد (طبق اولین شرط بالا).
- شخص تمام شکلاتها و شخص تمام کلوچهها را دارد (طبق هر دو شرط بالا).
پارادوکس لیبرالیسم (Sen's Liberal Paradox)
یکی از مهمترین مباحثی که در زمینه کارایی پارتو طرح میشود، پارادوکس لیبرالیسم است. در سال ۱۹۷۰ میلادی، اقتصاددانی به نام « آمارتیا سن» (Amartya Sen) مقالهای منتشر کرد و در آن به پارادوکسی به نام پارادوکس لیبرالیسم اشاره کرد. این پارادوکس بیان میکند هیچ سیستم اجتماعی نمیتواند همزمان در سه وضعیت پایبندی به آزادی، کارایی پارتو و توانایی عملکرد قرار داشته باشد.

تا اینجا احتمالا متوجه شدهاید که اهمیت تصمیمگیری بهینه در نظریه بازی ها چیست. یکی از بهترین نرمافزارهای مدلسازی و بهینهسازی با هدف بهدست آوردن مناسبترین روش تصمیمگیری، نرمافزار گمز است. در ادامه لینک فیلم آموزش نرم افزار گمز GAMS فرادرس برای شما قرار داده شده است:
پارادوکس نیوکامب (Newcomb's Problem)
در این بخش یاد میگیریم تعریف پارادوکس نیوکامب در نظریه بازی ها چیست و چه نوع تحلیلی در زمینه بررسی بازیها به ما ارائه میدهد. پارادوکس نیوکامب مسئلهای است که در آن تصمیمات اخلاقی در مقایسه با تصمیمات غیراخلاقی منجر به نتایج بدتری میشوند. در این مسئله عاملی وجود دارد که بسته به چگونگی پیشبینی خودش در مورد حرکت یا تصمیم شما در بازی، به شما پاداش خواهد داد. بنابراین انتظار داریم چنین عاملی دارای هوش فوقالعادهای بوده و برای مثال یک ربات باشد.
حالا فرض کنید ربات مسئله نیوکامب را امگا نامگذاری کردهایم و این ربات در مقابل شما با دو جعبه به شکل زیر ظاهر میشود که در هر کدام مقادیری پول قرار داده شده است. اگر امگا پیشبینی کند که شما فقط جعبه را باز خواهید کرد، در این جعبه دلار و در جعبه نیز دلار پول قرار میدهد. اما اگر پیشبینی امگا این باشد که شما هر دو جعبه را باز میکنید، در این صورت در جعبه هیچ پولی و در جعبه همان دلار را قرار میدهد.

ضمنا شما میدانید که امگا کاملا رفتار شما را بهدرستی پیشبینی خواهد کرد. این فرض اگرچه ممکن است ایدهآل و واقعی بنظر نرسد، اما بررسی حالتهایی که پیشبینی ربات کامل و دقیق نیست نیز در نظریه بازی ها انجام شده است. ما در این نوشته با فرض درست و کامل بودن پیشبینی رباتها پیش میرویم. پس از اینکه مسئله به شما توضیح داده شد، سوال اصلی این است که آیا باید فقط جعبه را باز کنید یا هر دو جعبه را؟
به روشهای زیر میتوانیم پاسخ این سوال را استدلال کنیم:
- اگر در جعبه پول باشد، در این صورت باز کردن هر دو جعبه شما را به پول بیشتری میرساند.
- اگر در جعبه پول نباشد، در این صورت باز هم باز کردن هر دو جعبه شما را به بیشترین پول ممکن میرساند.
پس طبق دو حالت بالا، بهترین تصمیم این است که هر دو جعبه را باز کنیم. با باز کردن هر دو جعبه و در نظر گرفتن این فرض که حتی در جعبه پولی نباشد، باز هم شما دلار از دریافت میکنید. بهتر است این استدلالها را در قالب ماتریس پاداش نشان دهیم. در نظریه بازی ها، ماتریس پاداش به مجموعهای از حالتهای مختلف و ممکن و پاداشهای متناظر با هر کدام گفته میشود. ماتریس پاداش برای پارادوکس نیوکامب به شکل زیر است:

عناصر قطری در این ماتریس (بالا سمت چپ و پایین سمت راست)، مواردی را نشان میدهند که در آنها امگا حرکت شما را بهدرستی پیشبینی کرده است. عناصر غیرقطری این ماتریس (پایین سمت چپ و بالا سمت راست) نماینده دو موردی هستند که امگا بهدرستی پیشبینی خود را انجام نداده است. اما با توجه به اینکه گفتیم فرض ما بر این است که امگا پیشبینی اشتباه ندارد، پس ماتریس تصمیم واقعی برای این مسئله بهصورت زیر خواهد بود:

اگر بخواهیم به این مسئله نگاه کلیتری داشته باشیم، میتوانیم آن را به دو حالت پیشبینی درست امگا با احتمال و پیشبینی نادرست با احتمال تعمیم دهیم:

بازی جوجه (The Game of Chicken)
در بازی جوجه دو شرکتکننده با نامهای Bluebert و Redbert داریم که با بیشترین سرعت ممکن در حال رانندگی به سمت هم هستند. بنابراین هر کدام از این دو شخص قبل از برخورد با هم باید تصمیم بگیرد که آیا با همین سرعت به سمت دیگری حرکت کند یا منحرف شده و از تصادف جلوگیری کند. پس نتایج ممکن برای این تصمیمگیری به شکل زیر خواهد بود:
Bluebert | Redbert | نتیجه |
مستقیم برود. | مستقیم برود. | تصادف میکنند. |
مستقیم برود. | منحرف شود. | برد Bluebert و باخت Redbert |
منحرف شود. | مستقیم برود. | برد Redbert و باخت Bluebert |
منحرف شود. | منحرف شود. | هر دو به هم نگاه میکنند. |
اما برای درک و تحلیل بهتر این بازی، میتوانیم این نتایج را به کمک ریاضیات در قالب ماتریسی به شکل زیر نمایش دهیم:

در بخشهای قبل توضیح دادیم که این ماتریس در نظریه بازی ها ماتریس پاداش نامیده میشود. ردیفهای این ماتریس نشان دهنده تصمیمات Bluebert و ستونهای آن نماینده تصمیمات یا حرکت Redbert است. بنابراین اگر برای مثال Bluebert منحرف شود، ما به کمک این ماتریس میدانیم که بسته به تصمیمی که Redbert میگیرد، نتیجه یکی از دو سلول بالایی در ماتریس خواهد بود. به همین شکل، اگر Bluebert مستقیم برود، با توجه به تصمیمی که Redbert میگیرد، یکی از دو حالت در ردیف پایین ماتریس بالا اتفاق خواهد افتاد.
در مرحله بعدی یک قدم جلوتر میرویم و از اعداد برای نمایش نتایج ممکن در ماتریس بالا استفاده میکنیم، به این صورت که برای هر کدام از حالتهای زیر یکی از اعداد یا یا را در نظر میگیریم:
- هر دو ، اگر هر دو منحرف شوند و به هم نگاه کنند.
- هر دو ، اگر هر دو مستقیم بروند و با هم تصادف کنند.
- برنده و بازنده ، اگر یکی مستقیم برود (برنده) و دیگری منحرف شود (بازنده).

فایده در نظر گرفتن ماتریس بازدهای به شکل بالا برای این بازی این است که حالا میتوانیم راحتتر به تحلیل این بازی و آنچه که در آن اتفاق میافتد، بپردازیم و در نتیجه، بهتر میتوانیم آن را بازی کنیم. برای مثال، تحلیلهایی مانند بهترین پاسخ یا تعادل نش که در بخشهای بعد آنها را توضیح خواهیم داد.
بهترین پاسخ در بازی جوجه
اولین سوالی که در مورد بازی جوجه ذهن ما را مشغول میکند، این است که بهترین پاسخ با توجه به نظریه بازی ها چیست. فرض کنید ما Bluebert هستیم و میدانیم Redbert چه حرکتی انجام خواهد داد. در این صورت چه واکنشی نشان میدهیم؟ قطعا اگر بدانیم Redbert منحرف خواهد شد، بلافاصله کافی است با نگاه کردن به ستون سمت چپ در ماتریس بازده به این نتیجه برسیم که باید مستقیم برویم تا برنده شویم. اگر ما هم منحرف شویم، میگیریم و تصادف رخ میدهد، در حالی که اگر مستقیم برویم، دریافت خواهیم کرد.
در مقابل، اگر بدانیم Redbert مستقیم میرود، با نگاه کردن به ستون سمت راست از ماترس بازده، بهترین حرکت برای ما این است که ما هم مستقیم برویم. چون اگر ما منحرف شویم، میگیریم و بازنده میشویم. در حالی که اگر مستقیم برویم، با اینکه میگیریم و تصادف میکنیم، اما برندهای وجود ندارد.
تعادل نش در بازی جوجه
اگر فیلم سینمایی ذهن زیبا را دیده باشید، به خاطر میآورید که این فیلم بر اساس زندگینامه ریاضیدان معروفی به نام «جان فوربز نش» (John Forbes Nash) ساخته شد. تعادل نش نیز بر مبنای خدمات این ریاضیدان نامگذاری شده است. تعادل نش زمانی رخ میدهد که تمام بازیکنها بهتر پاسخ را دادهاند. با توجه به این تعریف، فکر میکنید کدام موقعیت در بازی جوجه تعادل نش ایجاد میکند؟
در موقعیتی که یک بازیکن منحرف میشود و دیگری مستقیم میرود، تعادل نش داریم. چون در این حالت هیچکدام از دو بازیکن نمیتوانند خروجی خود را با تغییر عمل خود بهتر کنند. به عبارت دیگر، در این شرایط هر دو بازیکن بهترین پاسخ را دادهاند. اما وقتی که هر دو شرکتکننده مستقیم بروند تعادل نش ایجاد نمیشود، چون در این موقعیت حداقل یکی از دو بازیکن به این فکر کرده است که بهتر است منحرف شود تا تصادف نکند. همچنین موقعیتی که در آن هر دو بازیکن منحرف شدهاند نیز تعادل نش محسوب نمیشود. در این شرایط هم حداقل یکی از دو بازیکن ترجیح میداده است که مستقیم برود. پس در هیچکدام از این دو موقعیت بهترین پاسخ برای هر دو بازیکن را نداشتهایم.
معمای زندانی یا دو راهی زندانی (Prisoner's Dilemma)
دوراهی زندانی یکی از معروفترین مسائل در نظریه بازی ها است که در آن دو شرکتکننده بازی در موقعیت بدی قرار میگیرند، چون هر کدام فکر میکند دیگری همکاری نمیکند. در این بازی، پلیس دو مجرم به نام آلیس و باب را دستگیر کرده است و آنها را در دو اتاق مجزا بازجویی میکند. بنابراین هر کدام از بازجویی دیگری اطلاعی نخواهد داشت و به همین دلیل، دو مجرم پیش از شروع بازجویی تصمیم میگیرند که با هم هماهنگی زیر را انجام دهند:
- اگر آلیس علیه باب صحبت کند، آلیس آزاد میشود و باب سه سال در زندان خواهد بود.
- اگر باب علیه آلیس صحبت کند، باب آزاد میشود و آلیس سه سال در زندان خواهد بود.
- اگر هیچکدام علیه دیگری صحبت نکند، هر دو یک سال در زندان خواهند بود.
- اگر هر دو علیه هم صحبت کنند، هر دو نفر دو سال در زندان خواهند بود.
نمایش ماتریسی این موقعیتها در قالب ماتریس پاداش به شکل زیر خواهد شد. برای مثال عدمهمکاری آلیس و همکاری باب معادل است با سلول سمت راست و بالا در ماتریس زیر که طبق اولین شرط از چهار شرط بالا با سه سال زندان برای باب و آزادی یا برد آلیس همراه است. این دو عدد در این ماتریس به شکل نمایش داده میشوند، یعنی ترتیب بهصورت (آلیس، باب) است.

در این معما هر کدام از دو بازیکن دو انتخاب دارند، همکاری یا عدمهمکاری. در نتیجه چهار ترکیب مختلف خواهیم داشت که هر کدام یک خروجی (پاداش یا پیآف) را مطابق شکل بالا تولید میکند. در بخشهای بعد رویکردهای مختلف تحلیل این مسئله را با هم بررسی خواهیم کرد. دوراهی زندانی یکی از پرکاربردترین مباحث نظریه بازی ها در مدلسازی و درک مسائل مهمی در دنیای واقعی از جمله جنگ هستهای، نظریه «تکامل نوعدوستی متقابل» (Evolution of Reciprocal Altruism) و «تراژدی منابع مشترک» (Tragedy of the Commons) است.
تعادل نش و کارایی پارتو در معمای زندانی
برای اینکه بهتر متوجه شویم خروجی چنین معمایی طبق نظریه بازی ها چیست، در این قسمت از دو مفهوم به نام کارایی پارتو و تعادل نش استفاده میکنیم. ابتدا باید راهی را پیدا کنیم که به ما نشان دهد هر بازیکن در این معما چگونه تصمیمگیری میکند. اصولا در نظریه بازی فرض میکنیم هر بازیکن عکسالعملی را انتخاب میکند که همراه با بالاترین پاداش باشد، البته با این فرض که عمل بازیکن مقابل انجام شده باشد.
بر همین اساس، در دوراهی زندانی هم هر کدام از دو نفر آلیس و باب باید تصمیم خود را بدون ارتباط با دیگری بگیرد. بنابراین استدلالهای باب به شکل زیر خواهد بود:
- اگر آلیس تصمیم بگیرد همکاری کند، من یک سال در زندان سپری خواهم کرد، اگر من هم همکاری کنم. اما اگر من همکاری نکنم، در زندان نخواهم بود. پس بهتر است همکاری نکنم.
- اگر آلیس تصمیم بگیرد همکاری نکند، من سه سال در زندان خواهم بود، اگر من هم همکاری کنم. اما اگر من همکاری نکنم، دو سال در زندان هستم. پس بهتر است همکاری نکنم.

متقابلا استدلال آلیس هم به همین شکل است. پس در این معما در نهایت هر کدام از دو بازیکن به این نتیجه میرسند که همکاری نکنند. این بهترین پاسخ بر مبنای تفکر عقلانیت است و موجب برقراری تعادل نش خواهد شد. پس بر اساس تعادل نش، بهترین استراتژی همکاری نکردن هر دو زندانی است. اما چنین استدلالی لزوما بهترین خروجی ممکن را نمیدهد، چون عدمهمکاری دو بازیکن مجموع پاداشهای آنها را در بیشترین حالت ممکن قرار نخواهد داد. بنابراین در معمای زندانی، تعادل نش کارایی پارتو بالایی ندارد، بلکه اگر هر دو بازیکن همکاری کنند، در این صورت خروجی کارایی پارتو در بهترین حالت ممکن است.

تصویر بالا ماتریس پاداش این معما را با در نظر گرفتن تعادل نش و کارایی پارتو نشان میدهد. در صورتی کارایی پارتو را خواهیم داشت که هر دو بازیکن همکاری کنند و هر دو یک سال زندان بروند.
ابرعقلانیت و پارادوکس نیوکامب در معمای زندانی
در بخش قبل اشاره کردیم که بهترین استراتژی در مسئله دوراهی زندانی طبق نظریه بازی ها چیست و به این نتیجه رسیدیم که بهترین پاسخ، همکاری هر دو زندانی است. به همین دلیل اغلب نظریهپردازان تلاش کردند تا در مورد همکاری بازیکنها مطمئن شوند. یکی از آنها، دانشمندی به نام «داگلاس هافستادر» (Douglas Hofstadter) بود که نظریه فوقعقلانی بودن یا Superrationality را مطرح کرد. در تفکر ابرعقلانیت، فرد هم منافع خود را در نظر میگیرد و هم منافع جمع را.
با در نظر گرفتن این نظریه در معمای زندانی، فرض میشود که هر بازیکن در مقابل یک کپی دقیق از خودش بازی میکند. بنابراین امکان ندارد که هر بازیکن در حالی که دیگری همکاری نمیکند، همکاری کند و تنها انتخاب ممکن، انتخاب بین همکاری کردن یا همکاری نکردن هر دو بازیکن است. واضح است که در این شرایط همکاری کردن هر دو بازیکن، بهترین پاسخ است. بنابراین با انتخاب ابرعقلانیت، ماتریس معمای زندانی که در ابتدای این بخش معرفی شد، به ماتریس زیر کاهش خواهد یافت:

این نوع استدلال کردن پایه و اساس «نظریه تصمیمگیری بیزمان» (Timeless Decision Theory) است. در این نوع نگرش، بهجای اینکه یک فعالیت را با این فرض که فعالیت بقیه بازیکنها چه هست، انتخاب کنیم، فرض میشود که بقیه بازیکنها باید همان تصمیمی را بگیرند که ما میگیریم و بر این اساس تصمیمگیری ما انجام میشود. همچنین میتوانیم با در نظر گرفتن پارادوکس نیوکامب نیز به این مسئله نگاه کنیم.
در مسئله نیوکامب یا Newcomb's Problem رباتی که میتواند فعالیتهای شما را پیشبینی کند، به شما دو جعبه میدهد که بسته به اینکه این ربات چه پیشبینیای در مورد فعالیت شما دارد، داخل این جعبهها مقادیری پول قرار خواهد گرفت. بنابراین اگر ربات بتواند فعالیتهای شما را کاملا پیشبینی کند، وضعیت کاملا مشابه است با حالتی که شما در مقابل یک کپی از خودتان در حال انجام بازی هستید. این فرضیات مسئله دوراهی زندانی را دقیقا در موقعیت تفکر ابرعقلانیت قرار میدهد و نتیجه نهایی، ماتریس پاداش بالا خواهد شد.
معمای زندانی تکراری و استراتژی Tit-for-Tat
در معمای زندانی استاندارد، بازیکنها فقط یک مرتبه در مقابل یکدیگر بازی میکنند. با این وجود نمود این بازی در زندگی واقعی به این صورت است که بازیکنها در مقابل هم چند بار بازی میکنند. در این حالت هر بازیکن این نکته مهم را باید در نظر بگیرد که آنچه بازیکن دیگر در دورهای بعدی بازی انجام میدهد، بر پایه بازی است که در این دور انجام داده است. چنین وضعیتی «معمای زندانی تکراری» (Iterated Prisoner's Dilemma یا IPD) نامیده میشود.
اگر هر دو بازیکن دقیقا دور بازی کنند، راهحل منطقی برای تحلیل و درک بهتر مسئله دوراهی زندانی تکرار شده این است که از «تفکر K-level» استفاده کنیم. برای مثال، امین دور را در نظر بگیرید. بازیکن اول استدلال میکند که چون هیچ دور دیگری از بازی باقی نمانده است، پس دلیلی برای همکاری وجود ندارد. در نتیجه همکاری نمیکند. به همین شکل، بازیکن دوم هم استدلال میکند که باید همکاری نکند. این در حالی است که در دور ام نیز هر دو بازیکن میدانند که در دور ام هر دو همکاری نخواهند کرد، پس دلیلی برای همکاری در این دور نیز وجود ندارد. چنین تفکری موجب میشود که هر دو بازیکن هیچگاه همکاری نکنند.

اما همانطور که پیشتر گفتیم، این راهحل منطقی برای هر دو بازیکن از اینکه همیشه همکاری کنند، بدتر است. بنابراین بهتر است در شرایطی که اطلاعات کمی در مورد شرایط بازی در آینده داریم، هر دو عامل یا بازیکن همکاری کنند. در مسئله دوراهی زندانی تکراری یافتن بهترین استراتژی بسیار سخت است. بهویژه اینکه موفقیت یک استراتژی به اینکه بقیه بازیکنها چه روندی را در پیش گرفتهاند، بستگی دارد. بهترین راه برای موفقیت در چنین مسئلهای این است که برنامهنویسی کرده و رباتهایی را بسازیم که میتوانند نماینده بازیکنانی با استراتژیهای مشخص و در حال بازی در مقابل هم در یک مسابقه باشند. برای مثال، دو استراتژی بسیار ساده عبارتاند از:
- ربات همکاری: همیشه همکاری میکند.
- ربات عدمهمکاری: هیچ وقت همکاری نمیکند.
از آنجا که ربات عدمهمکاری هیچگاه همکاری نمیکند، صرفنظر از اینکه شما چه انجام دهید، پس زمانی که در مقابل این ربات بازی میکنید، بهترین انتخاب این است که هیچگاه همکاری نکنید. البته اگر در مقابل این ربات بازی میکنید، میتوانید استراتژی ربات منطقی را نیز پیش ببرید:
- ربات منطقی: در مقابل ربات عدمهمکاری همکاری نمیکند، اما در بقیه حالتها همکاری میکند.
اما چنین روندی متاسفانه منجر میشود به یک راهبرد متقابل:
- ربات ترول: با هر کسی که با ربات عدمهمکاری همکاری میکند، همکاری میکند و با هر کسی که با ربات عدمهمکاری همکاری نکند، همکاری نمیکند.
اما استراتژی که در زمینه دوراهی زندانی تکرار شده بیشترین مطالعات را به خود اختصاص داده است، استراتژی Tit-for-Tat است. بر این اساس داریم:
- ربات TitForTat: در اولین دوری که بازی میکند، همکاری میکند.
در علوم زیستی تکاملی از راهبرد Tit-for-Tat برای توضیح نظریه نوعدوستی متقابل در گونههای مختلف استفاده میشود. علیرغم اینکه هر ژن خودخواه است و در نتیجه، همیشه پاداش بالاتری برای عدمهمکاری خواهد داشت، در مجموع برای کلیه ارگانیسمها بهتر این است که به هم کمک کنند و از برقراری تعادل نامطلوب در عدمهمکاری همیشگی با هم اجتناب کنند. در مسابقات دوراهی زندانی تکراری نیز هر ربات با نرخی متناسب با میزان پاداشی که دریافت کرده است، عمل خود را تکرار میکند. چنین وضعیتی شبیه قانونی است که در زیستشناسی وجود دارد، هر حیوان اگر از حیوان دیگری تغذیه کند، احتمال تولیدمثل و بقای بیشتری در مقایسه با حالت عکس دارد. حتی احتمال تولیدمثل و بقای این حیوان از حیوانی که انرژی خود را صرف مبارزه با حیوان دیگری میکند نیز بیشتر است.
یادگیری مباحث تحقیق در عملیات با فرادرس
نظریه بازی ها یکی از مباحث مطرح شده در درس دانشگاهی تحقیق در عملیات یا OR است. بنابراین اگر میخواهید به تمام موضوعات تحقیق در عملیات مسلط شوید که شامل گیم تئوری و استراتژیهای تصمیمگیری نیز میشود، پیشنهاد میکنیم فیلمهای آموزشی فرادرس در این زمینه را مشاهده کنید که در ادامه لینک آنها برای شما قرار داده شده است:

- فیلم آموزش تحقیق در عملیات – برنامه ریزی خطی فرادرس
- فیلم آموزش تحقیق در عملیات ۱ – مرور و تست کنکور ارشد و دکتری فرادرس
- فیلم آموزش تحقیق در عملیات ۲ – مرور و تست کنکور ارشد و دکتری فرادرس
بازی دیکتاتور (Dictator Game)
بازی دیکتاتور یکی از بازیهای مهم در زمینه تحلیل مسائل اقتصادی و رفتارشناسی در انسانها است. در این قسمت میخواهیم ببینیم تعریف این بازی در نظریه بازی ها چیست و چگونه تحلیل میشود. بازی دیکتاتور یکی از مشتقات بازی اوتیماتوم محسوب میشود. به همین دلیل بهتر است ابتدا با بازی اولتیماتوم آشنا شویم. در بازی اولتیماتوم یک بازیکن (پیشنهاددهنده) فقط یک مرتبه یک پیشنهاد به بازیکن دیگر (پاسخدهنده) میدهد. پاسخدهنده این امکان را دارد که پیشنهاد او را بپذیرد یا نه، اما قبول نکردن این پیشنهاد برای هر دو بازیکن بهایی برابر با دارد.
در بازی دیکتاتور بازیکن اول که دیکتاتور نام دارد، تعیین میکند پول دریافت شده بهعنوان جایزه بازی چگونه بین سایر شرکتکنندگان و بازیکن دوم که پذیرنده پیشنهاد دیکتاتور است، تقسیم شود. محدوده تصمیمگیری دیکتاتور برای تعیین میزان جایزه نقدی دلخواه است، او میتواند هیچ مقداری از جایزه را ندهد و یا همه آن را ببخشد. همچنین پذیرنده روی نتیجه بازی تاثیری ندارد، به این معنا که نقش او در این بازی کاملا منفعل است. در بازی دیکتاتور اولیه، هم دیکتاتور و هم پذیرنده بهصورت تصادفی انتخاب میشوند. اما متوجه شدند که با توجه به فاصله اجتماعی بین این دو شخص، ممکن است نتایج متفاوتی رقم بخورد. در حقیقت اختلاف سطح این دو بازیکن روی میزان پاداشی که دیکتاتور برای پذیرنده تعیین میکند، میتواند اثرگذار باشد.
نکته جالبی که در مطالعات روی این بازی مشاهده شده است این است که اگر فاصله اجتماعی بین این دو بازیکن زیاد باشد، دیکتاتور تمایل دارد قسمتی کمتری از جایزه را به پذیرنده ببخشد، در حالی که اگر این اختلاف کم باشد، دیکتاتور بیشتر جایزه را با او تقسیم خواهد کرد. به این ترتیب زمانی که بازیکنان را مشغول به کار در یک مجموعه در نظر بگیریم، طوری که اغلب هم را بشناسند، در این صورت فاصله اجتماعی آنها به علت شناختشان از هم کمتر است. در اینجا فاکتورهایی مانند نوعدوستی و رفتار اجتماعی اغلب در تعیین خروجی بهینه بازی دیکتاتور در سازمان تاثیرگذار هستند.
کاربردهای نظریه بازی ها چیست؟
گفتیم نظریه بازی ها علم مطالعه استراتژیهای مختلف است که بر مبنای چگونگی توزیع احتمال بررسی شده و روی آنها تصمیمگیری انجام میشود. در این نظریه یاد میگیریم منطقیترین عکسالعملهای ممکن که ما را به بهترین نتیجه در بازی برسانند، چیست. بازیهای مختلفی در محدوده نظریه بازی قرار میگیرند و همانطور که اشاره کردیم، نکته مهم در تعریف بازی در این نظریه این است که خروجی یا نتیجه بازی برای هر بازیکن به استراتژیهای در پیش گرفته شده توسط تمام بازیکنان بستگی دارد.
در ادامه این بخش بهطور مختصر توضیح میدهیم سه مورد از مهمترین کاربردهای نظریه بازی ها چیست. اما باید توجه کنید که کاربردهای این نظریه فقط به این سه مورد محدود نمیشود. برای نمونه، در زمینه توسعه علوم اجتماعی، علوم رفتاری و روانشناسی نیز از این نظریه بسیار استفاده میشود. کاربرد مهم دیگر گیم تئوری در مناسبات سیاسی و نحوه برگزاری مذاکرات است. همچنین نظریه بازی یکی از موضوعات موردعلاقه فلاسفه است و پیوند نزدیکی با فلسفه دارد.

کاربرد نظریه بازی ها در اقتصاد
مهمترین کاربرد نظریه بازی در علوم اقتصاد است. برای مثال، تحلیل و بررسی رفتار مصرفکنندهها، بازار، شرکتها، چگونگی تخصیص منابع و شبکهسازی. در حقیقت اغلب تعاملات اقتصادی را میتوان توسط نظریه بازی مدلسازی کرد. برای مثال، شباهت زیادی بین بازی معمای زندانی و موقعیتی که در آن انحصارطلبان در بازار قیمتگذاری انجام میدهند، وجود دارد. اگر شرکتها با هم همکاری کنند، آنها میتوانند قیمتگذاری را با توافق هم انجام دهند. در این صورت با قیمتگذاری بالا و توافق روی آن، تمام شرکتها سود بالایی خواهند داشت. اما اگر شرکتی همکاری نکرده و به شکل انحصاری عمل کند، با کاهش قیمت پیشنهادی در مقایسه با سایر شرکتها، قطعا این شرکت سود بیشتری خواهد داشت.
کاربرد نظریه بازی ها در زمینه هوش مصنوعی (AI)
یکی از تفاوتهای انسان و ماشین در توانایی تصمیمگیری مستقل انسانها با توجه به شرایط محیطی است. این در حالی است که اغلب برنامههای کامپیوتری برای اینکه موفق به هر نوع تصمیمگیری شوند، نیاز است از قبل و با توجه به لیستی از تصمیمات ممکن در موقعیتهای مختلف، تنظیم و طراحی شوند. به این ترتیب اگر در بررسی این شرایط تمام جزئیات بهدرستی در نظر گرفته نشوند و یا شرایط به نحوی تغییر کند، کامپیوترها قادر به تصمیمگیری نیستند، چون برای چنین موقعیتهایی برنامهای برای آنها تنظیم نشده است.
اما این امکان وجود دارد که با توجه به مطالعات انجام شده در زمینه نظریه بازی ها، در آینده هوش مصنوعی قادر به تصمیمگیریهای جدید و بدون نیاز به برنامهنویسی توسط سازندگان باشد. این شرایط در صورتی عملی خواهد شد که برنامههای کامپیوتری با توانایی ایجاد ماتریس پاداش تنظیم شوند و در ایجاد چنین ماتریسی نیز کلیه عوامل محیطی و تجارب مشاهده شده لحاظ شوند.
کاربرد نظریه بازی ها در علوم زیستی
با اینکه دنیای جانوران و موجودات زنده شاید رعبآور و بیرحم بنظر برسد، اما نکته جالب این است که از دید نظریه بازی ها، همکاری بین گونههای مختلف در اغلب موارد منجر به بقا و پاداش بیشتر شده است. برای نمونه، یک نوع پرنده خاص وجود دارد که برای تغدیه از ماده خاصی وارد دهان کروکویلها میشود. ورود این پرنده به دهان کروکودیل هم برای این گونه و هم برای کروکودیل دارای فواید بسیاری است.
از طرفی، کروکودیل میتواند در صورت گرسنه بودن این پرنده را به عنوان غذا مصرف کند، اما چنین کاری نمیکند. علت این انتخاب کروکودیل اطلاع از اهمیت و پاداش این انتخاب است که طی فرآیند تکاملی هم برای کروکودیل و هم برای پرنده مشخص شده است. در حقیقت این دو جانور یاد گرفتهاند که با هم همکاری کنند و به نقطه تعادل نش رسیدهاند.
بازی شکار گوزن (Stag Hunt)
در آخرین بخش این نوشته از مجله فرادرس میخواهیم ببینیم مفهوم و روش تحلیل بازی شکار گوزن در نظریه بازی ها چیست. بازی شکار گوزن را میتوانیم مثالی از نظریه بازی ها در نظر بگیریم که در آن دو تعادل نش داریم. در این بازی دو شکارچی به نام آلیس و باب به انتظار شکار گوزن نشستهاند که در صورت موفقیت، پاداش خوبی برای آنها خواهد داشت. همچنین خرگوشهایی نیز در اطراف شکارچیان حضور دارند که در صورت شکار توسط آلیس و باب، بهعنوان غذا مصرف خواهند شد. نکتهای که وجود دارد این است که اگر شکارچیان مشغول به شکار خرگوشها شوند، گوزنی که در این محیط در حال پرسهزنی است، خواهد ترسید و در نتیجه احتمال دیده شدن و شکار آن کم میشود.

با توجه به اینکه برای هر دو شکارچی احتمال شکار خرگوش وجود دارد، میتوانیم حالتهای زیر را در زمینه منافع یا پاداشهای بازیکنان این بازی در نظر بگیریم:
- اگر آلیس خرگوش را شکار کند، غذای روزانه خود را بهدست خواهد آورد، در حالی که باب گرسنه میماند (آلیس پیروز میشود و باب شکست میخورد).
- بهطور مشابه، اگر باب خرگوش را شکار کند، غذای روزانه خود را بهدست خواهد آورد، در حالی که آلیس گرسنه میماند (باب پیروز میشود و آلیس شکست میخورد).
- اگر هر دو با هم یک گوزن را شکار کنند، در این صورت پس از تقسیم غذا هر کدام تا دو روز غذا خواهند داشت (همکاری متقابل).
- اگر هر کدام یک خرگوش شکار کنند، هر دو فقط غذای روزانه خود را بهدست خواهند آورد (عدمهمکاری متقابل).
تفاوت مهم این بازی با معمای زندانی در این است که در این بازی دو تعادل نش داریم. این دو تعادل عبارتاند از:
- زمانی که هر دو شکارچی همکاری نکنند (شکار دو خرگوش).
- زمانی که هر دو شکارچی همکاری کنند (شکار گوزن).