نظریه بازی ها چیست؟ – توضیح به زبان ساده با مثال

۳۰۶ بازدید
آخرین به‌روزرسانی: ۱۳ اسفند ۱۴۰۳
زمان مطالعه: ۲۵ دقیقه
دانلود PDF مقاله
نظریه بازی ها چیست؟ – توضیح به زبان ساده با مثالنظریه بازی ها چیست؟ – توضیح به زبان ساده با مثال

نظریه بازی ها یا Game Theory نوعی تحلیل ریاضیاتی برای داشتن یک تصمیم‌گیری بهینه است. در این نظریه هر گونه عمل و عکس‌العمل بین دو بازیکن (یا تعداد بیشتر) که شامل قوانین خاصی است، در قالب کلمه «بازی» بیان می‌شود. نظریه بازی ها یکی از مباحث مهم برای دانشجویان رشته‌های مختلفی از جمله اقتصاد، مهندسی صنایع، ریاضیات، مهندسی و علوم کامپیوتر محسوب می‌شود. همچنین موضوعات مختلف این نظریه در تحلیل مسائل اقتصادی، سیاسی، علوم اجتماعی و علوم زیستی بکار می‌روند. کاربرد این نظریه در اقتصاد به حدی شگفت‌انگیز است که فیلم سینمایی معروف «ذهن زیبا» بر همین اساس ساخته شده است. در این مطلب از مجله فرادرس یاد می‌گیریم نظریه بازی ها چیست و چه مفاهیمی در آن مطرح می‌شود.

997696

ابتدا بهتر است برخی از اصطلاحات مهم و پرکاربرد در نظریه بازی ها را بشناسیم. بنابراین بخش‌های ابتدایی این نوشته به معرفی و تعریف مفاهیمی مانند بازی، تعادل نش، کارایی پارتو و پارادوکس نیوکامب اختصاص داده شده است. در ادامه، صورت مسئله چند بازی معروف مانند بازی هماهنگی، بازی جوجه، دو راهی زندانی، بازی شکار گوزن و بازی دیکتاتور توضیح داده می‌شود. همچنین نشان می‌دهیم که نظریه‌پردازان بازی، چطور این بازی‌ها را مدل‌سازی ‌کرده و به زبان ریاضیات به طرح مسئله می‌پردازند. در هر بخش رویکردها یا روش‌های مختلف استدلال و تحلیل مسائل در نظریه بازی ها را توضیح خواهیم داد. این نوشته با برشمردن کاربردهای گیم تئوری به پایان می‌رسد.

نظریه بازی ها چیست؟

نظریه بازی ها به مطالعه بازی‌ها و بررسی علت و چگونگی داشتن یک تصمیم‌گیری بهینه در موقعیت‌های مختلف یک بازی می‌پردازد. نظریه بازی در حقیقت «علم استراتژی» محسوب می‌شود و به ما کمک می‌کند تا بتوانیم بهترین تصمیم‌گیری ممکن را در موقعیت‌های استراتژیک و در شرایطی که بازیکن‌ها در حال رقابتی وابسته به هم هستند، داشته باشیم. نظریه‌پردازان بازی تلاش می‌کنند تا باز‌ی‌ها را به گونه‌ای مدل‌سازی کنند که بتوانیم به‌راحتی آن‌ها را درک و تحلیل کنیم. با اینکه بازی‌های زیادی وجود دارند که دارای ویژگی‌های مشترکی هستند یا در آن‌ها الگوی یکسانی تکرار می‌شود، اما بازی‌های پیچیده‌تری نیز وجود دارند که درک آن‌ها مشکل است.

در نیمه دوم قرن بیستم پیشرفت نظریه بازی ها در حدی بوده است که کاربرد آن منجر به دریافت چندین جایزه نوبل برای اقتصاددانان شد. همچنین استفاده از این نظریه در زمینه زیست‌شناسی، علوم کامپیوتر و علوم سیاسی نیز پیشرفت‌های زیاد و جالبی را به همراه داشته است. برای شروع، ابتدا بازی را تعریف می‌کنیم. پس از یادگیری تعریف بازی، بهتر متوجه خواهید شد که نظریه بازی ها چیست.

نمودار موضوعات در نظریه بازی ها

تعریف بازی

برای اینکه بهتر متوجه شویم نظریه بازی ها چیست، ابتدا باید تعریف دقیق و علمی بازی در ریاضیات را مشخص کنیم. بازی در ریاضی به معنای وقوع یک سری موقعیت استراتژیک است که در آن شرکت‌کنند‌ه‌های مختلفی وجود دارند و نتیجه تصمیماتی که هر کدام از شرکت‌کننده‌ها می‌گیرد، همزمان به تصمیمات آن فرد و تصمیمات سایر شرکت‌کنندگان بستگی دارد. با توجه به این تعریف، برای مثال سودوکو یک بازی محسوب نمی‌شود، چون آنچه که شما در حین حل جدول سودوکو انجام می‌دهید، از آنچه که هر شخص دیگری برای حل سودوکو انجام می‌دهد، کاملا مستقل است.

تصویری رنگارنگ از مهره‌های شطرنج

در مقابل، شطرنج را می‌توانیم یک بازی بدانیم. در بازی شطرنج اینکه شما پیروز شوید یا نه کاملا به حرکت هر مهره توسط شما و حرکت‌های شخص دیگری که در مقابل شما است، بستگی دارد. به همین شکل، برد یا باخت شخص مقابل شما نیز به حرکت‌های خودش و حرکت‌های شما بستگی دارد. نکته مهم در مورد بازی شطرنج این است که نحوه بازی شما کاملا به بازی طرف مقابل بستگی دارد. پس در این بازی تصمیمات دو شرکت‌کننده به هم وابسته است. اما در بازی سودوکو نحوه حل جدول توسط شما به تصمیمات شخص یا اشخاص دیگری بستگی ندارد. برای اینکه با اصول تصمیم‌گیری بهینه بیشتر آشنا شوید، پیشنهاد می‌کنیم به مطلب زیر از مجله فرادرس مراجعه کنید:

چگونه نظریه بازی ها را با فرادرس بهتر یاد بگیریم؟

تا اینجا آموختیم که تعریف بازی در نظریه بازی ها چیست. اما پیش از شروع یادگیری مهم‌ترین اصطلاحات و مفاهیم این شاخه مهم از علم ریاضیات و علوم کامپیوتر، در این بخش قصد داریم مجموعه دوره‌های آموزشی که در همین زمینه در مجموعه فرادرس تهیه شده است را به شما معرفی کنیم. مشاهده این فیلم‌های آموزشی به شما کمک می‌کند تا با بهره‌گیری از مزایای آموزش ویدئویی کاملا به این مباحث و کاربردهای آن مسلط شوید. همچنین با روش‌های پیاده‌سازی نظریه بازی‌ ها در محیط‌های نرم‌افزاری مانند متلب آشنا خواهید شد:

مجموعه آموزش نظریه بازی ها – مبانی و کاربردی در فرادرس
برای مشاهده مجموعه فیلم آموزش نظریه بازی ها – مبانی و کاربردی فرادرس، روی تصویر کلیک کنید.
  1. فیلم آموزش نظریه بازی ها یا گیم تئوری Game Theory فرادرس
  2. فیلم آموزش پیاده سازی نظریه بازی یا گیم تئوری Game Theory در متلب MATLAB فرادرس
  3. فیلم آموزش نظریه بازی ها یا گیم تئوری و کاربرد آن در اقتصاد فرادرس

تعادل نش (Nash Equilibrium)

مجموعه‌ استراتژی‌هایی که با در پیش گرفتن آن‌ها هیچ یک از شرکت‌کننده‌ها نمی‌توانند پاداش خود را با تغییر استراتژی بهتر کنند، «تعادل نش» نامیده می‌شود. برقراری تعادل نش به این معنا است که اگر به هر کدام از بازیکنان استراتژی بازیکنان مقابل گفته شود، باز هم انتخاب منطقی و بر پایه عقلانیت برای هر بازیکن همان استراتژی قبلی است. با این وجود یک سری محدودیت‌های عملی در مورد تعادل نش وجود دارد که باعث شده است شرایطی برای برقراری تعادل نش به‌صورت زیر در نظر گرفته شود:

  • تمام بازیکنان فقط به بیشتر کردن پاداش مورد انتظار خود علاقه‌مند هستند و در همین راستا استراتژی خود را انتخاب می‌کنند.
  • تمام بازیکنان استراتژی‌های خود را به‌خوبی اجرا می‌کنند.
  • تمام بازیکنان برای تعیین راه‌حل بازی به ‌اندازه کافی باهوش هستند.
  • هر بازیکن استراتژی تعادل برنامه‌ریزی شده سایر بازیکنان را می‌داند (یا نتیجه‌گیری می‌کند).
  • هر بازیکن می‌داند یا نتیجه‌گیری می‌کند که تغییر استراتژی یک بازیکن، موجب تغییر استراتژی سایر بازیکنان نخواهد شد.
  • تمام موارد بیان شده برای کلیه بازیکنان بازی برقرار است، یعنی هر بازیکن می‌داند که سایر بازیکنان نیز این شرایط را دارند.
تصویری از جان فوربز نشریاضیدان معروف و بخشی از فیلم ذهن زیبا در مورد او
جان فوربز نش، ریاضیدان آمریکایی و برنده جایزه نوبل اقتصاد

البته تمام این شرایط عملا در هر بازی برقرار نیستند. برای مثال، در بازی معمای زندانی (در بخش‌های بعد صورت مسئله این معما کاملا توضیح داده شده است) ممکن است یک زندانی در صورت اعتراف کردن با قصاص روبرو شود. چنین شرایطی موجب می‌شود این زندانی کمتر در تصمیم‌گیری خود به دوراهی نزدیک شود. همچنین ممکن است در یک بازی نوعی، یک بازیکن هوش کافی در زمینه بکارگیری بهترین استراتژی را نداشته باشد یا بازیکنی عمدا یا تصادفا استراتژی خود را کامل اجرا نکند. همچنین اغلب بازیکنان به درست یا غلط معتقد‌اند که سایر بازیکنان یک استراتژی کاملا اخلاقی را در پیش نمی‌گیرند. این نکته یکی از مهم‌ترین نگرانی‌های نظریه بازی‌ ها است، به‌ویژه در موضوعاتی نظیر جنگ هسته‌ای.

در حالت کلی هر بازی ممکن است چندین تعادل نش داشته باشد، اما مسئله دوراهی زندانی که در بخش‌های بعد به آن خواهیم پرداخت، فقط یک تعادل نش دارد. از تعادل نش در بررسی و تحلیل سناریوهای رقابتی زیاد استفاده می‌شود. مثال ملموس این موقعیت در جنگ‌ها است. با توجه به توضیحات بالا بیشتر بازی‌ها عملا با تعادل نش به‌خوبی مدل‌سازی نمی‌شوند. اما این مبحث برای توضیح روند مسائل اقتصادی و تکامل در زیست‌شناسی سودمند است. در بخش‌های بعد و در قالب حل مثال نشان می‌دهیم نحوه پیدا کردن تعادل نش در یک بازی چگونه است و در نتیجه، بهتر متوجه خواهید شد که مفهوم این اصطلاح در نظریه بازی ها چیست.

مثال تعادل نش در بازی هماهنگی یا Coordination Game

در بازی هماهنگی زمانی بازیکنان بیشترین سود را خواهند داشت که انتخاب‌های خود را با هم هماهنگ کنند. در حقیقت در این بازی دو بازیکن داریم که هر دو از هماهنگ شدن سود می‌برند، اما ممکن است هر کدام بخواهند ترجیحات خود را نیز داشته باشند. برای مثال، دو دوست تصمیم می‌گیرند که یک بعد از ظهر را در کنار هم با دیدن فیلم یا برگزاری مهمانی سپری کنند. قطعا در این موقعیت هر دو دوست تمایل دارند که به فعالیت مشترکی مشغول شوند، اما ممکن است ترجیح هر کدام با دیگری در مورد این دو انتخاب متفاوت باشد.

ماتریسی از حالت‌های مهمانی و فیلم دیدن
ماتریس پاداش بازی هماهنگی

برای اینکه درک بهتری از چنین موقعیتی داشته باشیم، ترجیح دو بازیکن این بازی را با فاکتورهای عددی نشان داده و در نتیجه کلیه ترکیبات ممکن را در قالب ماتریسی به شکل بالا خواهیم داشت. این ماتریس، ماتریس پاداش یا Payoff Matrix نامیده می‌شود که در آن استراتژی‌های اولین بازیکن، عدد سمت چپ و استراتژی‌های دومین بازیکن، عدد سمت راست است. در این مثال در هر دو حالت (پارتی، پارتی) و (فیلم، فیلم) تعادل نش برقرار است. اما در حالت‌های (2,1)(2,1) یا (1,2)(1,2) ترجیح هر کدام از دو بازیکن به یکی از دو فعالیت موردنظر است، به همین دلیل از اعداد 22 و 11 برای نشان دادن ترجیح یک فعالیت بر دیگری استفاده شده است. در این دو حالت تعادل نش نداریم. 

نحوه پیدا کردن تعادل نش

در حالت کلی پیدا کردن تعادل نش خالص که در آن هیچ‌گونه تصادفی رخ نداده باشد، آسان است. کافی است تمام حالت‌های ممکن و مقادیر پاداش متناظر با آن‌ها را با هم مقایسه کنیم. برای نمونه، فرض کنید ماتریش پاداش در یک بازی به شکل زیر داده شده است. در این بازی هر بازیکن سه استراتژی برای انتخاب دارد و برای مثال، اولین بازیکن پاداشی به اندازه سلول متناظر دریافت می‌کند. بنابراین هدف این بازیکن این است که پاداش خود را به بیشترین مقدار ممکن برساند، در حالی که هدف بازیکن دوم این است که پاداش بازیکن اول حداقل مقدار ممکن شود:

ماتریسی از اعداد

تعادل نش در این بازی زمانی رخ می‌دهد که هیچ بازیکنی انگیزه‌ای برای تغییر استراتژی خود نداشته باشد، حتی اگر رقبای خود را بشناسد. این بدان معنا است که سلول نمایش‌دهنده تعادل نش، سلولی است که در ردیف خود حداقل مقدار و در ستون خود بیشترین مقدار پاداش را داشته باشد. این تنها حالتی است که هیچ بازیکنی استراتژی خود را تغییر نمی‌دهد. بر این اساس، در این بازی تنها حالتی که در آن تعادل نش رخ می‌دهد زمانی است که بازیکن اول استراتژی 22 و بازیکن دوم استراتژی 33 را انتخاب کند، چون هیچ کدام از بازیکنان نمی‌خواهد از پاداش 11 دور شود.

کارایی پارتو (Pareto Efficiency)

گفتیم یکی از کاربردهای عملی مفاهیم نظریه بازی ها در تحلیل مسائل اقتصادی و بازار است. «کارایی پارتو» در بازار زمانی رخ می‌دهد که هیچ گونه تخصیص منابعی برای بهتر کردن وضعیت یک شخص بدون اینکه همزمان وضعیت شخص دیگری بدتر شود، ممکن نیست اتفاق بیفتد. برای نمونه، در بازاری شامل دو شخص که هر دو علاقه تمام‌نشدنی به شکلات دارند، یکی از این دو نفر که تمام شکلات‌ها در اختیار اوست، در وضعیت کارایی پارتو محسوب می‌شود (حتی اگر این وضعیت به نوعی انحصار این محصول باشد). اگر این شخص حتی یک عدد شکلات به دیگری بدهد، در این صورت دچار زیان خواهد شد.

برای درک دقیق‌تر مفهوم کارایی پارتو در نظریه بازی ها، فرض کنید ده بار شکلات وارد بازار شده است. در این صورت اگر تمام این ده بار شکلات به یک نفر داده شود، کارایی پارتو داریم. همچنین اگر پنج بار به یک نفر و پنج بار دیگر به یک نفر دیگر داده شود یا هر نوع اختصاص دیگری، در تمام این موارد کارایی پارتو برقرار است. در حقیقت تمام اختصاص‌های اولیه بازار کارایی پارتو محسوب می‌شوند، چون در تمام این حالت‌ها دو نفر به شکلات علاقه دارند و هیچ شکلاتی از یکی گرفته نشده است تا به دیگری داده شود. بنابراین در این مرحله سود و زیانی طبق تعریف کارایی پارتو نداریم.

تصویری از دو شخص در حال تصمیم‌گیری - نظریه بازی ها چیست؟

با اینکه در حالت کلی این نوع توزیع منابع از نظر جامعه عادلانه و بهینه نیست، اما کارایی پارتو یکی از سودمندترین مدل‌های نظریه بازی ها در زمینه اقتصاد است و تعیین می‌کند که آیا یک سیستم یا بازار در وضعیت کارایی و سود قرار دارد یا خیر. تعریف دقیق‌تر کارای پارتو به این شکل است: فرض کنید مقداری تخصیص منابع AA^{'} داریم که از تخصیص منابع دیگری به نام AA بهتر است. در این صورت اگر وضعیت هر شخص نسبت به قبل بهتر شود، بدون اینکه وضعیت شخص دیگری بدتر شود، می‌گوییم AA^{'} نوعی پیشرفت پارتو برای AA محسوب می‌شود یا AA^{'} پارتوی غالب بر AA است. پس در این مثال وضعیت  AA کارایی پارتو ندارد.

دقت کنید کارایی پارتو باید یک مفهوم مطلق باشد، یعنی اگر تخصیص دیگری وجود دارد که از تخصیص جاری بهتر است، تخصیص جاری نمی‌تواند کارایی پارتو محسوب شود. به مثال زیر در این زمینه توجه کنید تا بهتر بیاموزید معنای کارایی پارتو در نظریه بازی ها چیست. همچنین در بخش معمای زندانی خواهیم دید که در این بازی نتایج حاصل از تحلیل کارایی پارتو و تعادل نش با هم متفاوت است.

مثال بررسی کارایی پارتو در بازار

فرض کنید در بازاری با دو شخص AA و BB، ده بار شکلات و ده عدد کلوچه وارد می‌شود. شخص AA هر دو محصول را دوست دارد، اما علاقه‌اش به شکلات دو برابر کلوچه است. از طرفی شخص BB نیز هر دو محصول را دوست دارد، اما از کلوچه دو برابر شکلات لذت می‌برد. می‌خواهیم ببینیم توزیع کارایی پارتو برای این دو منبع در این بازار چگونه است. بنظر می‌رسد توزیع این دو محصول به شیوه‌ای که کارایی پارتو برقرار باشد، در یکی از دو حالت زیر اتفاق می‌افتد:

  1. شخص AA هیچ کلوچه‌ای نداشته باشد.
  2. شخص BB هیچ شکلاتی نداشته باشد.

برای چک کردن درستی این دو وضعیت طبق تعریف کارایی پارتو، باید ببینیم آیا توزیع دیگری می‌توانیم در نظر بگیریم که طبق آن با سود یک نفر، نفر دیگر ضرر نکند. همچنین باید این نکته را هم در نظر بگیریم که هر شخصی که بخشی از منابع را از دست بدهد، ضرر می‌کند، فارغ از اینکه آن محصول مورد‌علاقه او بوده است یا نه. پس مسئله سود اقتصادی و تجاری در اینجا مطرح است. همچنین می‌دانیم تمام حالت‌های اختصاص اولیه نیز کارایی پارتو محسوب می‌شوند. جمع‌بندی این توضیحات سه حالت زیر را به عنوان کارایی پارتو به ما می‌دهد:

  • شخص AA تمام شکلات‌ها و کلوچه‌ها را دارد (طبق دومین شرایط بالا).
  • شخص BB تمام شکلات‌ها و کلوچه‌ها را دارد (طبق اولین شرط بالا).
  • شخص AA تمام شکلات‌ها و شخص BB تمام کلوچه‌ها را دارد (طبق هر دو شرط بالا).

پارادوکس لیبرالیسم (Sen's Liberal Paradox)

یکی از مهم‌ترین مباحثی که در زمینه کارایی پارتو طرح می‌شود، پارادوکس لیبرالیسم است. در سال ۱۹۷۰ میلادی، اقتصاددانی به نام « آمارتیا سن» (Amartya Sen) مقاله‌ای منتشر کرد و در آن به پارادوکسی به نام پارادوکس لیبرالیسم اشاره کرد. این پارادوکس بیان می‌کند هیچ سیستم اجتماعی نمی‌تواند همزمان در سه وضعیت پایبندی به آزادی، کارایی پارتو و توانایی عملکرد قرار داشته باشد.

تصویر رنگی از اقتصادددان معروف آمارتیا سن
آمارتیا سن، نظریه‌پرداز پارادوکس لیبرالیسم

تا اینجا احتمالا متوجه شده‌اید که اهمیت تصمیم‌گیری بهینه در نظریه بازی ها چیست. یکی از بهترین نرم‌افزارهای مدل‌سازی و بهینه‌سازی با هدف به‌دست آوردن مناسب‌ترین روش تصمیم‌گیری، نرم‌افزار گمز است. در ادامه لینک فیلم آموزش نرم افزار گمز GAMS فرادرس برای شما قرار داده شده است:

پارادوکس نیوکامب (Newcomb's Problem)

در این بخش یاد می‌گیریم تعریف پارادوکس نیوکامب در نظریه بازی ها چیست و چه نوع تحلیلی در زمینه بررسی بازی‌ها به ما ارائه می‌دهد. پارادوکس نیوکامب مسئله‌ای است که در آن تصمیمات اخلاقی در مقایسه با تصمیمات غیراخلاقی منجر به نتایج بدتری می‌شوند. در این مسئله عاملی وجود دارد که بسته به چگونگی پیش‌بینی خودش در مورد حرکت یا تصمیم شما در بازی، به شما پاداش خواهد داد. بنابراین انتظار داریم چنین عاملی دارای هوش فوق‌العاده‌ای بوده و برای مثال یک ربات باشد.

حالا فرض کنید ربات مسئله نیوکامب را امگا نام‌گذاری کرده‌ایم و این ربات در مقابل شما با دو جعبه به شکل زیر ظاهر می‌شود که در هر کدام مقادیری پول قرار داده شده است. اگر امگا پیش‌بینی کند که شما فقط جعبه AA را باز خواهید کرد، در این جعبه 1,000,0001,000,000 دلار و در جعبه BB نیز 1,0001,000 دلار پول قرار می‌دهد. اما اگر پیش‌بینی امگا این باشد که شما هر دو جعبه را باز می‌کنید، در این صورت در جعبه AA هیچ پولی و در جعبه BB همان 1,0001,000 دلار را قرار می‌‌دهد.

تصویری از دو جعبه قهوه‌ای رنگ

ضمنا شما می‌دانید که امگا کاملا رفتار شما را به‌درستی پیش‌بینی خواهد کرد. این فرض اگرچه ممکن است ایده‌آل و واقعی بنظر نرسد، اما بررسی حالت‌هایی که پیش‌بینی ربات کامل و دقیق نیست نیز در نظریه‌ بازی ها انجام شده است. ما در این نوشته با فرض درست و کامل بودن پیش‌بینی ربات‌ها پیش می‌رویم. پس از اینکه مسئله به شما توضیح داده شد، سوال اصلی این است که آیا باید فقط جعبه AA را باز کنید یا هر دو جعبه را؟

به روش‌های زیر می‌توانیم پاسخ این سوال را استدلال کنیم:

  1. اگر در جعبه AA پول باشد، در این صورت باز کردن هر دو جعبه شما را به پول بیشتری می‌رساند.
  2. اگر در جعبه AA پول نباشد، در این صورت باز هم باز کردن هر دو جعبه شما را به بیشترین پول ممکن می‌رساند.

پس طبق دو حالت بالا، بهترین تصمیم این است که هر دو جعبه را باز کنیم. با باز کردن هر دو جعبه و در نظر گرفتن این فرض که حتی در جعبه AA پولی نباشد، باز هم شما 1,0001,000 دلار از BB دریافت می‌کنید. بهتر است این استدلال‌ها را در قالب ماتریس پاداش نشان دهیم. در نظریه بازی ها، ماتریس پاداش به مجموعه‌‌ای از حالت‌های مختلف و ممکن و پاداش‌های متناظر با هر کدام گفته می‌شود. ماتریس پاداش برای پارادوکس نیوکامب به شکل زیر است:

تصویری از ماتریسی شامل A و B
ماتریس پاداش در پارادوکس نیوکامب

عناصر قطری در این ماتریس (بالا سمت چپ و پایین سمت راست)، مواردی را نشان می‌دهند که در آن‌ها امگا حرکت شما را به‌درستی پیش‌بینی کرده است. عناصر غیرقطری این ماتریس (پایین سمت چپ و بالا سمت راست) نماینده دو موردی هستند که امگا به‌درستی پیش‌بینی خود را انجام نداده است. اما با توجه به اینکه گفتیم فرض ما بر این است که امگا پیش‌بینی اشتباه ندارد، پس ماتریس تصمیم واقعی برای این مسئله به‌صورت زیر خواهد بود:

بخشی از ماتریسی شامل A و B
ماتریس تصمیم واقعی در پارادوکس نیوکامب

اگر بخواهیم به این مسئله نگاه کلی‌تری داشته باشیم، می‌توانیم آن را به دو حالت پیش‌بینی درست امگا با احتمال pp و پیش‌بینی نادرست با احتمال 1p1-p تعمیم دهیم:

نمودار دو حالتی

بازی جوجه (The Game of Chicken)

در بازی جوجه دو شرکت‌کننده با نام‌های Bluebert و Redbert داریم که با بیشترین سرعت ممکن در حال رانندگی به سمت هم هستند. بنابراین هر کدام از این دو شخص قبل از برخورد با هم باید تصمیم بگیرد که آیا با همین سرعت به سمت دیگری حرکت کند یا منحرف شده و از تصادف جلوگیری کند. پس نتایج ممکن برای این تصمیم‌گیری به شکل زیر خواهد بود:

BluebertRedbertنتیجه
مستقیم برود.مستقیم برود.تصادف می‌کنند.
مستقیم برود.منحرف شود.برد Bluebert و باخت Redbert
منحرف شود.مستقیم برود.برد Redbert و باخت Bluebert
منحرف شود.منحرف شود.هر دو به هم نگاه می‌کنند.

اما برای درک و تحلیل بهتر این بازی، می‌توانیم این نتایج را به کمک ریاضیات در قالب ماتریسی به شکل زیر نمایش دهیم:

مارتیسی با خانه‌هایی شامل صورتک‌های آبی و قرمز خندان و غمگین
ماتریش پاداش در بازی جوجه

در بخش‌های قبل توضیح دادیم که این ماتریس در نظریه بازی ها ماتریس پاداش نامیده می‌شود. ردیف‌های این ماتریس نشان دهنده تصمیمات Bluebert و ستون‌های آن نماینده تصمیمات یا حرکت Redbert است. بنابراین اگر برای مثال Bluebert منحرف شود، ما به کمک این ماتریس می‌دانیم که بسته به تصمیمی که Redbert می‌گیرد، نتیجه یکی از دو سلول بالایی در ماتریس خواهد بود. به همین شکل، اگر Bluebert مستقیم برود، با توجه به تصمیمی که Redbert می‌گیرد، یکی از دو حالت در ردیف پایین ماتریس بالا اتفاق خواهد افتاد.

در مرحله بعدی یک قدم جلوتر می‌رویم و از اعداد برای نمایش نتایج ممکن در ماتریس بالا استفاده می‌کنیم، به این صورت که برای هر کدام از حالت‌های زیر یکی از اعداد 00 یا 11 یا 5-5 را در نظر می‌گیریم:

  • هر دو 00، اگر هر دو منحرف شوند و به هم نگاه کنند.
  • هر دو 5-5، اگر هر دو مستقیم بروند و با هم تصادف کنند.
  • برنده 11 و بازنده 1-1، اگر یکی مستقیم برود (برنده) و دیگری منحرف شود (بازنده).
ماترسی با حالت‌های حرکت مستقیم و انحراف
ماتریش پاداش در بازی جوجه

فایده در نظر گرفتن ماتریس بازده‌ای به شکل بالا برای این بازی این است که حالا می‌توانیم راحت‌تر به تحلیل این بازی و آنچه که در آن اتفاق می‌افتد، بپردازیم و در نتیجه، بهتر می‌توانیم آن را بازی کنیم. برای مثال، تحلیل‌هایی مانند بهترین پاسخ یا تعادل نش که در بخش‌های بعد آن‌ها را توضیح خواهیم داد.

بهترین پاسخ در بازی جوجه

اولین سوالی که در مورد بازی جوجه ذهن ما را مشغول می‌کند، این است که بهترین پاسخ با توجه به نظریه بازی ها چیست. فرض کنید ما Bluebert هستیم و می‌دانیم Redbert چه حرکتی انجام خواهد داد. در این صورت چه واکنشی نشان می‌دهیم؟ قطعا اگر بدانیم Redbert منحرف خواهد شد، بلافاصله کافی است با نگاه کردن به ستون سمت چپ در ماتریس بازده به این نتیجه برسیم که باید مستقیم برویم تا برنده شویم. اگر ما هم منحرف شویم، 00 می‌گیریم و تصادف رخ می‌دهد، در حالی که اگر مستقیم برویم، 11 دریافت خواهیم کرد.

در مقابل، اگر بدانیم Redbert مستقیم می‌رود، با نگاه کردن به ستون سمت راست از ماترس بازده، بهترین حرکت برای ما این است که ما هم مستقیم برویم. چون اگر ما منحرف شویم، 1-1 می‌گیریم و بازنده می‌شویم. در حالی که اگر مستقیم برویم، با اینکه 5-5 می‌گیریم و تصادف می‌کنیم، اما برنده‌ای وجود ندارد.

تعادل نش در بازی جوجه

اگر فیلم سینمایی ذهن زیبا را دیده باشید، به خاطر می‌آورید که این فیلم بر اساس زندگی‌نامه ریاضیدان معروفی به نام «جان فوربز نش» (John Forbes Nash) ساخته شد. تعادل نش نیز بر مبنای خدمات این ریاضیدان نامگذاری شده است. تعادل نش زمانی رخ می‌دهد که تمام بازیکن‌ها بهتر پاسخ را داده‌اند. با توجه به این تعریف، فکر می‌کنید کدام موقعیت در بازی جوجه تعادل نش ایجاد می‌کند؟

در موقعیتی که یک بازیکن منحرف می‌شود و دیگری مستقیم می‌رود، تعادل نش داریم. چون در این حالت هیچ‌کدام از دو بازیکن نمی‌توانند خروجی خود را با تغییر عمل خود بهتر کنند. به عبارت دیگر، در این شرایط هر دو بازیکن بهترین پاسخ را داده‌اند. اما وقتی که هر دو شرکت‌کننده مستقیم بروند تعادل نش ایجاد نمی‌شود، چون در این موقعیت حداقل یکی از دو بازیکن به این فکر کرده است که بهتر است منحرف شود تا تصادف نکند. همچنین موقعیتی که در آن هر دو بازیکن منحرف شده‌اند نیز تعادل نش محسوب نمی‌شود. در این شرایط هم حداقل یکی از دو بازیکن ترجیح می‌داده است که مستقیم برود. پس در هیچ‌کدام از این دو موقعیت بهترین پاسخ برای هر دو بازیکن را نداشته‌ایم.

معمای زندانی یا دو راهی زندانی (Prisoner's Dilemma)

دوراهی زندانی یکی از معروف‌ترین مسائل در نظریه بازی ها است که در آن دو شرکت‌کننده بازی در موقعیت بدی قرار می‌گیرند، چون هر کدام فکر می‌کند دیگری همکاری نمی‌کند. در این بازی، پلیس دو مجرم به نام آلیس و باب را دستگیر کرده است و آن‌ها را در دو اتاق مجزا بازجویی می‌کند. بنابراین هر کدام از بازجویی دیگری اطلاعی نخواهد داشت و به همین دلیل، دو مجرم پیش از شروع بازجویی تصمیم می‌گیرند که با هم هماهنگی زیر را انجام دهند:

  • اگر آلیس علیه باب صحبت کند، آلیس آزاد می‌شود و باب سه سال در زندان خواهد بود.
  • اگر باب علیه آلیس صحبت کند، باب آزاد می‌شود و آلیس سه سال در زندان خواهد بود.
  • اگر هیچ‌کدام علیه دیگری صحبت نکند، هر دو یک سال در زندان خواهند بود.
  • اگر هر دو علیه هم صحبت کنند، هر دو نفر دو سال در زندان خواهند بود.

نمایش ماتریسی این موقعیت‌ها در قالب ماتریس پاداش به‌ شکل زیر خواهد شد. برای مثال عدم‌همکاری آلیس و همکاری باب معادل است با سلول سمت راست و بالا در ماتریس زیر که طبق اولین شرط از چهار شرط بالا با سه سال زندان برای باب و آزادی یا برد آلیس همراه است. این دو عدد در این ماتریس به شکل (3,0)(-3,0) نمایش داده می‌شوند، یعنی ترتیب به‌صورت (آلیس، باب) است.

ماتریس مربعی آلیس و باب در زمینه زرد
ماتریس پاداش در مسئله معمای زندانی

در این معما هر کدام از دو بازیکن دو انتخاب دارند، همکاری یا عدم‌همکاری. در نتیجه چهار ترکیب مختلف خواهیم داشت که هر کدام یک خروجی (پاداش یا پی‌آف) را مطابق شکل بالا تولید می‌کند. در بخش‌های بعد رویکردهای مختلف تحلیل این مسئله را با هم بررسی خواهیم کرد. دوراهی زندانی یکی از پرکاربردترین مباحث نظریه بازی ها در مدل‌سازی و درک مسائل مهمی در دنیای واقعی از جمله جنگ هسته‌ای، نظریه «تکامل نوع‌دوستی متقابل» (Evolution of Reciprocal Altruism) و «تراژدی منابع مشترک» (Tragedy of the Commons) است.

تعادل نش و کارایی پارتو در معمای زندانی

برای اینکه بهتر متوجه شویم خروجی چنین معمایی طبق نظریه بازی ها چیست، در این قسمت از دو مفهوم به نام کارایی پارتو و تعادل نش استفاده می‌کنیم. ابتدا باید راهی را پیدا کنیم که به ما نشان دهد هر بازیکن در این معما چگونه تصمیم‌گیری می‌کند. اصولا در نظریه بازی فرض می‌کنیم هر بازیکن عکس‌العملی را انتخاب می‌کند که همراه با بالاترین پاداش باشد، البته با این فرض که عمل بازیکن مقابل انجام شده باشد.

بر همین اساس، در دوراهی زندانی هم هر کدام از دو نفر آلیس و باب باید تصمیم خود را بدون ارتباط با دیگری بگیرد. بنابراین استدلا‌ل‌های باب به شکل زیر خواهد بود:

  • اگر آلیس تصمیم بگیرد همکاری کند، من یک سال در زندان سپری خواهم کرد، اگر من هم همکاری کنم. اما اگر من همکاری نکنم، در زندان نخواهم بود. پس بهتر است همکاری نکنم.
  • اگر آلیس تصمیم بگیرد همکاری نکند، من سه سال در زندان خواهم بود، اگر من هم همکاری کنم. اما اگر من همکاری نکنم، دو سال در زندان هستم. پس بهتر است همکاری نکنم.
دو زندانی در دو سلول مجزا - نظریه بازی ها
دوراهی زندانی

متقابلا استدلال آلیس هم به همین شکل است. پس در این معما در نهایت هر کدام از دو بازیکن به این نتیجه می‌رسند که همکاری نکنند. این بهترین پاسخ بر مبنای تفکر عقلانیت است و موجب برقراری تعادل نش خواهد شد. پس بر اساس تعادل نش، بهترین استراتژی همکاری نکردن هر دو زندانی است. اما چنین استدلالی لزوما بهترین خروجی ممکن را نمی‌دهد، چون عدم‌همکاری دو بازیکن مجموع پاداش‌های آن‌ها را در بیشترین حالت ممکن قرار نخواهد داد. بنابراین در معمای زندانی، تعادل نش کارایی پارتو بالایی ندارد، بلکه اگر هر دو بازیکن همکاری کنند، در این صورت خروجی کارایی پارتو در بهترین حالت ممکن است.

یک ماتریس مربعی با نام‌های آلیس و باب در زمینه زرد
ماتریس پاداش در مسئله معمای زندانی با در نظر گرفتن تعادل نش و کارایی پارتو

تصویر بالا ماتریس پاداش این معما را با در نظر گرفتن تعادل نش و کارایی پارتو نشان می‌دهد. در صورتی کارایی پارتو را خواهیم داشت که هر دو بازیکن همکاری کنند و هر دو یک سال زندان بروند.

ابرعقلانیت و پارادوکس نیوکامب در معمای زندانی

در بخش قبل اشاره کردیم که بهترین استراتژی در مسئله دوراهی زندانی طبق نظریه بازی ها چیست و به این نتیجه رسیدیم که بهترین پاسخ، همکاری هر دو زندانی است. به همین دلیل اغلب نظریه‌پردازان تلاش کردند تا در مورد همکاری بازیکن‌ها مطمئن شوند. یکی از آن‌ها، دانشمندی به نام «داگلاس هافستادر» (Douglas Hofstadter) بود که نظریه‌ فوق‌عقلانی بودن یا Superrationality را مطرح کرد. در تفکر ابرعقلانیت، فرد هم منافع خود را در نظر می‌گیرد و هم منافع جمع را.

با در نظر گرفتن این نظریه در معمای زندانی، فرض می‌شود که هر بازیکن در مقابل یک کپی دقیق از خودش بازی می‌کند. بنابراین امکان ندارد که هر بازیکن در حالی که دیگری همکاری نمی‌کند، همکاری کند و تنها انتخاب ممکن، انتخاب بین همکاری کردن یا همکاری نکردن هر دو بازیکن است. واضح است که در این شرایط همکاری کردن هر دو بازیکن، بهترین پاسخ است. بنابراین با انتخاب ابرعقلانیت، ماتریس معمای زندانی که در ابتدای این بخش معرفی شد، به ماتریس زیر کاهش خواهد یافت:

یک ماتریس مربعی با نام‌های آلیس و باب در زمینه زرد
ماتریس پاداش در مسئله معمای زندانی با در نظر گرفتن ابرعقلانیت و پارادوکس نیوکامب

این نوع استدلال کردن پایه و اساس «نظریه تصمیم‌گیری بی‌زمان» (Timeless Decision Theory) است. در این نوع نگرش، به‌جای اینکه یک فعالیت را با این فرض که فعالیت بقیه بازیکن‌ها چه هست، انتخاب کنیم، فرض می‌شود که بقیه بازیکن‌ها باید همان تصمیمی را بگیرند که ما می‌گیریم و بر این اساس تصمیم‌گیری ما انجام می‌شود. همچنین می‌توانیم با در نظر گرفتن پارادوکس نیوکامب نیز به این مسئله نگاه کنیم.

در مسئله نیوکامب یا Newcomb's Problem رباتی که می‌تواند فعالیت‌های شما را پیش‌بینی کند، به شما دو جعبه می‌دهد که بسته به اینکه این ربات چه پیش‌بینی‌ای در مورد فعالیت شما دارد، داخل این جعبه‌ها مقادیری پول قرار خواهد گرفت. بنابراین اگر ربات بتواند فعالیت‌‌های شما را کاملا پیش‌بینی کند، وضعیت کاملا مشابه است با حالتی که شما در مقابل یک کپی از خودتان در حال انجام بازی هستید. این فرضیات مسئله دوراهی زندانی را دقیقا در موقعیت تفکر ابرعقلانیت قرار می‌دهد و نتیجه نهایی، ماتریس پاداش بالا خواهد شد.

معمای زندانی تکراری و استراتژی Tit-for-Tat

در معمای زندانی استاندارد، بازیکن‌ها فقط یک مرتبه در مقابل یکدیگر بازی می‌کنند. با این وجود نمود این بازی در زندگی واقعی به این صورت است که بازیکن‌ها در مقابل هم چند بار بازی می‌کنند. در این حالت هر بازیکن این نکته مهم را باید در نظر بگیرد که آنچه بازیکن دیگر در دورهای بعدی بازی انجام می‌دهد، بر پایه بازی است که در این دور انجام داده است. چنین وضعیتی «معمای زندانی تکراری» (Iterated Prisoner's Dilemma یا IPD) نامیده می‌شود.

اگر هر دو بازیکن دقیقا NN دور بازی کنند، راه‌حل منطقی برای تحلیل و درک بهتر مسئله دوراهی زندانی تکرار شده این است که از «تفکر K-level» استفاده کنیم. برای مثال، NNامین دور را در نظر بگیرید. بازیکن اول استدلال می‌کند که چون هیچ دور دیگری از بازی باقی نمانده است، پس دلیلی برای همکاری وجود ندارد. در نتیجه همکاری نمی‌کند. به همین شکل، بازیکن دوم هم استدلال می‌کند که باید همکاری نکند. این در حالی است که در دور N1N-1ام نیز هر دو بازیکن می‌دانند که در دور NNام هر دو همکاری نخواهند کرد، پس دلیلی برای همکاری در این دور نیز وجود ندارد. چنین تفکری موجب می‌شود که هر دو بازیکن هیچ‌گاه همکاری نکنند.

تصویر کارتنی از یک علامت سوال و چند مهره شطرنج

اما همان‌طور که پیش‌تر گفتیم، این راه‌حل منطقی برای هر دو بازیکن از اینکه همیشه همکاری کنند، بدتر است. بنابراین بهتر است در شرایطی که اطلاعات کمی در مورد شرایط بازی در آینده داریم، هر دو عامل یا بازیکن همکاری کنند. در مسئله دوراهی زندانی تکراری یافتن بهترین استراتژی بسیار سخت است. به‌ویژه اینکه موفقیت یک استراتژی به اینکه بقیه بازیکن‌ها چه روندی را در پیش گرفته‌اند، بستگی دارد. بهترین راه برای موفقیت در چنین مسئله‌ای این است که برنامه‌نویسی کرده و ربات‌هایی را بسازیم که می‌توانند نماینده بازیکنانی با استراتژی‌های مشخص و در حال بازی در مقابل هم در یک مسابقه باشند. برای مثال، دو استراتژی بسیار ساده عبارت‌اند از:

  • ربات همکاری: همیشه همکاری می‌کند.
  • ربات عدم‌‌همکاری: هیچ وقت همکاری نمی‌کند.

از آن‌جا که ربات عدم‌همکاری هیچ‌گاه همکاری نمی‌کند، صرف‌نظر از اینکه شما چه انجام دهید، پس زمانی که در مقابل این ربات بازی می‌کنید، بهترین انتخاب این است که هیچ‌گاه همکاری نکنید. البته اگر در مقابل این ربات بازی ‌می‌کنید، می‌توانید استراتژی ربات منطقی را نیز پیش ببرید:

  • ربات منطقی: در مقابل ربات عدم‌همکاری همکاری نمی‌کند، اما در بقیه حالت‌ها همکاری می‌کند.

اما چنین روندی متاسفانه منجر می‌شود به یک راهبرد متقابل:

  • ربات ترول: با هر کسی که با ربات عدم‌همکاری همکاری می‌کند، همکاری می‌کند و با هر کسی که با ربات عدم‌همکاری همکاری نکند، همکاری نمی‌کند.

اما استراتژی که در زمینه دوراهی زندانی تکرار شده بیشترین مطالعات را به خود اختصاص داده است، استراتژی Tit-for-Tat است. بر این اساس داریم:

  • ربات TitForTat: در اولین دوری که بازی می‌کند، همکاری می‌کند.

در علوم زیستی تکاملی از راهبرد Tit-for-Tat برای توضیح نظریه نوع‌دوستی متقابل در گونه‌های مختلف استفاده می‌شود. علی‌رغم اینکه هر ژن خودخواه است و در نتیجه، همیشه پاداش بالاتری برای عدم‌همکاری خواهد داشت، در مجموع برای کلیه ارگانیسم‌ها بهتر این است که به هم کمک کنند و از برقراری تعادل نامطلوب در عدم‌همکاری همیشگی با هم اجتناب کنند. در مسابقات دوراهی زندانی تکراری نیز هر ربات با نرخی متناسب با میزان پاداشی که دریافت کرده است، عمل خود را تکرار می‌کند. چنین وضعیتی شبیه قانونی است که در زیست‌شناسی وجود دارد، هر حیوان اگر از حیوان دیگری تغذیه کند، احتمال تولیدمثل و بقای بیشتری در مقایسه با حالت عکس دارد. حتی احتمال تولیدمثل و بقای این حیوان از حیوانی که انرژی خود را صرف مبارزه با حیوان دیگری می‌کند نیز بیشتر است.

یادگیری مباحث تحقیق در عملیات با فرادرس

نظریه بازی ها یکی از مباحث مطرح شده در درس دانشگاهی تحقیق در عملیات یا OR است. بنابراین اگر می‌خواهید به تمام موضوعات تحقیق در عملیات مسلط شوید که شامل گیم تئوری و استراتژی‌های تصمیم‌گیری نیز می‌شود، پیشنهاد می‌کنیم فیلم‌های آموزشی فرادرس در این زمینه را مشاهده کنید که در ادامه لینک آن‌ها برای شما قرار داده شده است:

مجموعه آموزش دروس تحقیق در عملیات (OR) – جامع و کاربردی فرادرس
برای مشاهده مجموعه فیلم آموزش دروس تحقیق در عملیات (OR) – جامع و کاربردی فرادرس، روی تصویر کلیک کنید.
  1. فیلم آموزش تحقیق در عملیات – برنامه ریزی خطی فرادرس
  2. فیلم آموزش تحقیق در عملیات ۱ – مرور و تست کنکور ارشد و دکتری فرادرس
  3. فیلم آموزش تحقیق در عملیات ۲ – مرور و تست کنکور ارشد و دکتری فرادرس

بازی دیکتاتور (Dictator Game)

بازی دیکتاتور یکی از بازی‌های مهم در زمینه تحلیل مسائل اقتصادی و رفتارشناسی در انسان‌ها است. در این قسمت می‌خواهیم ببینیم تعریف این بازی در نظریه بازی ها چیست و چگونه تحلیل می‌شود. بازی دیکتاتور یکی از مشتقات بازی اوتیماتوم محسوب می‌شود. به همین دلیل بهتر است ابتدا با بازی اولتیماتوم آشنا شویم. در بازی اولتیماتوم یک بازیکن (پیشنهاددهنده) فقط یک مرتبه یک پیشنهاد به بازیکن دیگر (پاسخ‌دهنده) می‌دهد. پاسخ‌دهنده این امکان را دارد که پیشنهاد او را بپذیرد یا نه، اما قبول نکردن این پیشنهاد برای هر دو بازیکن بهایی برابر با 00 دارد.

در بازی دیکتاتور بازیکن اول که دیکتاتور نام دارد، تعیین می‌کند پول دریافت شده به‌عنوان جایزه بازی چگونه بین سایر شرکت‌کنندگان و بازیکن دوم که پذیرنده پیشنهاد دیکتاتور است، تقسیم شود. محدوده تصمیم‌گیری دیکتاتور برای تعیین میزان جایزه نقدی دلخواه است، او می‌تواند هیچ مقداری از جایزه را ندهد و یا همه آن‌ را ببخشد. همچنین پذیرنده روی نتیجه بازی تاثیری ندارد، به این معنا که نقش او در این بازی کاملا منفعل است. در بازی دیکتاتور اولیه، هم دیکتاتور و هم پذیرنده به‌صورت تصادفی انتخاب می‌شوند. اما متوجه شدند که با توجه به فاصله اجتماعی بین این دو شخص، ممکن است نتایج متفاوتی رقم بخورد. در حقیقت اختلاف سطح این دو بازیکن روی میزان پاداشی که دیکتاتور برای پذیرنده تعیین می‌کند، می‌تواند اثرگذار باشد.

نکته جالبی که در مطالعات روی این بازی مشاهده شده است این است که اگر فاصله اجتماعی بین این دو بازیکن زیاد باشد، دیکتاتور تمایل دارد قسمتی کمتری از جایزه را به پذیرنده ببخشد، در حالی که اگر این اختلاف کم باشد، دیکتاتور بیشتر جایزه را با او تقسیم خواهد کرد. به این ترتیب زمانی که بازیکنان را مشغول به کار در یک مجموعه در نظر بگیریم، طوری که اغلب هم را بشناسند، در این صورت فاصله اجتماعی آن‌ها به علت شناخت‌شان از هم کمتر است. در اینجا فاکتورهایی مانند نوع‌دوستی و رفتار اجتماعی اغلب در تعیین خروجی بهینه بازی دیکتاتور در سازمان تاثیرگذار هستند.

کاربردهای نظریه بازی ها چیست؟

گفتیم نظریه بازی ها علم مطالعه استراتژی‌های مختلف است که بر مبنای چگونگی توزیع احتمال بررسی شده و روی آن‌ها تصمیم‌گیری انجام می‌شود. در این نظریه یاد می‌گیریم منطقی‌ترین عکس‌العمل‌های ممکن که ما را به بهترین نتیجه در بازی برسانند، چیست. بازی‌های مختلفی در محدوده نظریه بازی قرار می‌گیرند و همان‌طور که اشاره کردیم، نکته مهم در تعریف بازی در این نظریه این است که خروجی یا نتیجه بازی برای هر بازیکن به استراتژی‌های در پیش گرفته شده توسط تمام بازیکنان بستگی دارد.

در ادامه این بخش به‌طور مختصر توضیح می‌دهیم سه مورد از مهم‌ترین کاربردهای نظریه بازی ها چیست. اما باید توجه کنید که کاربردهای این نظریه فقط به این سه مورد محدود نمی‌شود. برای نمونه، در زمینه توسعه علوم اجتماعی، علوم رفتاری و روانشناسی نیز از این نظریه بسیار استفاده می‌شود. کاربرد مهم دیگر گیم تئوری در مناسبات سیاسی و نحوه برگزاری مذاکرات است. همچنین نظریه بازی یکی از موضوعات موردعلاقه فلاسفه است و پیوند نزدیکی با فلسفه دارد.

نموداری از کاربردهای نظریه بازی ها

کاربرد نظریه بازی ها در اقتصاد

مهم‌ترین کاربرد نظریه بازی در علوم اقتصاد است. برای مثال، تحلیل و بررسی رفتار مصرف‌کننده‌ها، بازار، شرکت‌ها، چگونگی تخصیص منابع و شبکه‌سازی. در حقیقت اغلب تعاملات اقتصادی را می‌توان توسط نظریه بازی مدل‌سازی کرد. برای مثال، شباهت زیادی بین بازی معمای زندانی و موقعیتی که در آن انحصارطلبان در بازار قیمت‌گذاری انجام می‌دهند، وجود دارد. اگر شرکت‌ها با هم همکاری کنند، آن‌ها می‌توانند قیمت‌گذاری را با توافق هم انجام دهند. در این صورت با قیمت‌گذاری بالا و توافق روی آن، تمام شرکت‌ها سود بالایی خواهند داشت. اما اگر شرکتی همکاری نکرده و به شکل انحصاری عمل کند، با کاهش قیمت پیشنهادی در مقایسه با سایر شرکت‌ها، قطعا این شرکت سود بیشتری خواهد داشت.

کاربرد نظریه بازی ها در زمینه هوش مصنوعی (AI)

یکی از تفاوت‌های انسان و ماشین در توانایی تصمیم‌گیری مستقل انسان‌ها با توجه به شرایط محیطی است. این در حالی است که اغلب برنامه‌های کامپیوتری برای اینکه موفق به هر نوع تصمیم‌گیری شوند، نیاز است از قبل و با توجه به لیستی از تصمیمات ممکن در موقعیت‌های مختلف، تنظیم و طراحی شوند. به این ترتیب اگر در بررسی این شرایط تمام جزئیات به‌درستی در نظر گرفته نشوند و یا شرایط به نحوی تغییر کند، کامپیوترها قادر به ‌تصمیم‌گیری نیستند، چون برای چنین موقعیت‌هایی برنامه‌ای برای آن‌ها تنظیم نشده است.

اما این امکان وجود دارد که با توجه به مطالعات انجام شده در زمینه نظریه بازی ها، در آینده هوش مصنوعی قادر به تصمیم‌گیری‌های جدید و بدون نیاز به برنامه‌نویسی توسط سازندگان باشد. این شرایط در صورتی عملی خواهد شد که برنامه‌های کامپیوتری با توانایی ایجاد ماتریس پاداش تنظیم شوند و در ایجاد چنین ماتریسی نیز کلیه عوامل محیطی و تجارب مشاهده شده لحاظ شوند.

کاربرد نظریه بازی ها در علوم زیستی

با اینکه دنیای جانوران و موجودات زنده شاید رعب‌آور و بی‌رحم بنظر برسد، اما نکته جالب این است که از دید نظریه بازی ‌ها، همکاری بین گونه‌های مختلف در اغلب موارد منجر به بقا و پاداش بیشتر شده است. برای نمونه، یک نوع پرنده خاص وجود دارد که برای تغدیه از ماده خاصی وارد دهان کروکویل‌ها می‌شود. ورود این پرنده به دهان کروکودیل هم برای این گونه و هم برای کروکودیل دارای فواید بسیاری است.

از طرفی، کروکودیل می‌تواند در صورت گرسنه بودن این پرنده را به عنوان غذا مصرف کند، اما چنین کاری نمی‌کند. علت این انتخاب کروکودیل اطلاع از اهمیت و پاداش این انتخاب است که طی فرآیند تکاملی هم برای کروکودیل و هم برای پرنده مشخص شده است. در حقیقت این دو جانور یاد گرفته‌اند که با هم همکاری کنند و به نقطه تعادل نش رسید‌ه‌اند.

بازی شکار گوزن (Stag Hunt)

در آخرین بخش این نوشته از مجله فرادرس می‌خواهیم ببینیم مفهوم و روش تحلیل بازی شکار گوزن در نظریه بازی ها چیست. بازی شکار گوزن را می‌توانیم مثالی از نظریه بازی ها در نظر بگیریم که در آن دو تعادل نش داریم. در این بازی دو شکارچی به نام آلیس و باب به انتظار شکار گوزن نشسته‌اند که در صورت موفقیت، پاداش خوبی برای آن‌ها خواهد داشت. همچنین خرگوش‌هایی نیز در اطراف شکارچیان حضور دارند که در صورت شکار توسط آلیس و باب، به‌عنوان غذا مصرف خواهند شد. نکته‌ای که وجود دارد این است که اگر شکارچیان مشغول به شکار خرگوش‌ها شوند، گوزنی که در این محیط در حال پرسه‌زنی است، خواهد ترسید و در نتیجه احتمال دیده شدن و شکار آن کم می‌شود.

تصویری از یک ماتریس شامل المان‌هایی به شکل شکار گوزن و خرگوش توسط انسان
ماتریس پاداش در بازی شکار گوزن

با توجه به اینکه برای هر دو شکارچی احتمال شکار خرگوش وجود دارد، می‌توانیم حالت‌های زیر را در زمینه منافع یا پاداش‌های بازیکنان این بازی در نظر بگیریم:

  • اگر آلیس خرگوش را شکار کند، غذای روزانه خود را به‌دست خواهد آورد، در حالی که باب گرسنه می‌ماند (آلیس پیروز می‌شود و باب شکست می‌خورد).
  • به‌طور مشابه، اگر باب خرگوش را شکار کند، غذای روزانه خود را به‌دست خواهد آورد، در حالی که آلیس گرسنه می‌ماند (باب پیروز می‌شود و آلیس شکست می‌خورد).
  • اگر هر دو با هم یک گوزن را شکار کنند، در این صورت پس از تقسیم غذا هر کدام تا دو روز غذا خواهند داشت (همکاری متقابل).
  • اگر هر کدام یک خرگوش شکار کنند، هر دو فقط غذای روزانه خود را به‌دست خواهند آورد (عدم‌همکاری متقابل).

تفاوت مهم این بازی با معمای زندانی در این است که در این بازی دو تعادل نش داریم. این دو تعادل عبارت‌اند از:

  • زمانی که هر دو شکارچی همکاری نکنند (شکار دو خرگوش).
  • زمانی که هر دو شکارچی همکاری کنند (شکار گوزن).
بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
BrilliantOwlcationMindyourdecisionsWikipediaStanford
دانلود PDF مقاله
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *