نظریه بازی ها چیست؟ — به زبان ساده

به منظور اتخاد تصمیمات عقلانی، قدرت منطق انسان میتواند برای پدیدههای غیرتصادفی بهترین ابزار باشد. ولی زمانی که نتیجه انتخاب و انجام یک تصمیم مشخص نبوده یا در یک بازی شانسی، نتایج بازی حریف از قبل مشخص نباشد، استفاده از نظریه بازی ها و قواعد تصمیم (Game Theory) میتواند ابزاری برای دستیابی به استراتژی مناسب محسوب شود. در این بین استفاده از مدلهای ریاضی و بهینهسازی و نظریه آمار و احتمال مبنای انتخاب تصمیمهای درست خواهند بود. نظریه بازی ها و قواعد تصمیم که اولین بار توسط ریاضیدان و دانشمند فقید «جان فن نیمن» (John von Neumann) مورد بررسی قرار گرفت در بسیاری از حوزههای علوم کاربرد دارد. براساس قضایا و تعاریف ارائه شده توسط «جان نیمن» در سال ۱۹۴۴ کتابی با عنوان «نظریه بازی و رفتار اقتصادی» (Theory of Games and Economic Behavior) منتشر شد که مبنایی برای مطالعه و نظریهپردازی در زمینه و حوزه علم نظریه بازی ها و قواعد تصمیم قرار گرفت.
نظریه بازی ها و قواعد تصمیم
در دنیای امروزی شرایط رقابتی زیادی وجود دارد. به مثالهایی در این زمینه توجه کنید: دفاع موشکی، جنگ قیمت فروش اتومبیلهای دست دوم، مقررات انرژی، حسابرسان مالیاتی، نمایش تلویزیونی «بازماندگان»، تروریسم، مذاکرات مدیریت کار، درگیریهای نظامی، مناقصهها ، داوری، تبلیغات، انتخابات و رأیگیری، انتخاب محصولات کشاورزی، حل مناقشات، بازار سهام، بیمه و مخابرات. چیزی که در همه آنها وجود داشته و مشترک است، وجود رقابت برای طرفهای درگیر در این فعالیتها است به طوری که هر طرف انتظار دارد که نتیجه را به نفع خود درآورد. در همه این جنبهها، میتوان از نظریه بازی ها و قواعد تصمیم بهره برد و به بهترین نتیجه رسید. در اینجا به یک مثال ساده میپردازیم تا موضوع رقابت و استراتژی در بازیهای رقابتی بهتر مشخص شود.
احتمالا همگی با بازی «ضربدر و دایره» (Tic Tac To game) آشنایی دارید. البته از آنجایی که در این بازی از علامتهای $$X$$ و $$O$$ استفاده میشود گاهی آن را با X O نیز مورد خطاب قرار میدهند. احتمالا در هنگام این بازی یک استراتژی را بردن انتخاب کردهاید و منتظر هستید تا حریف شما اشتباهی انجام داده تا از آن به بهترین نحو استفاده و بازی را به نفع خود تمام کنید.
این بازی ساده، الزامات مربوط به یک بازی در نظریه بازی ها و قواعد تصمیم را دارد. قواعد بازی، نحوه برنده یا بازنده شدن، امکان تکرار بازی و ثبت امتیازات از ویژگیهایی یک بازی است که در اینجا نیز به چشم میخورد. در این بازی مجموعه قوانینی وجود دارد که بازیکنان مجبور به رعایت آنها هستند. برای مثال میتوان قانونهای این بازی را به صورت زیر مشخص کرد.
- در این بازی در هر خانه بیش از یک علامت نمیتوان قرار داد.
- بازی به صورت نوبتی انجام میشود. به این معنی که در هر بار فقط یک بازیکن امکان ترسیم علامت در داخل جدول را دارد.
- هر بازیکن باید از علامت خاص خود استفاده کند. برای مثال بازیکنی که با علامت X شروع کرده است تا انتهای بازی باید این علامت را در خانههای جدول قرار دهد.
- هرگاه سه خانهای از جدول که روی یک خط راست قرار دارند، با یک علامت پر شده باشد بازی خاتمه یافته و صاحب علامت برنده اعلام میشود.
- …
با توجه به اهمیت نظریه بازیها در مباحث تحقیق در عملیات، «فرادرس» اقدام به انتشار فیلم آموزش نظریه بازی ها (Game theory) در قالب یک آموزش ۱/۵ ساعته کرده که در ادامه متن به آن اشاره شده است.
- برای دیدن فیلم آموزش نظریه بازی ها (Game Theory) + اینجا کلیک کنید.
استراتژی بازی X O نحوه پیروزی را مشخص میکند. به این ترتیب تا حد ممکن نباید به حریفتان اجازه دهید که سه علامت در یک خط راست ایجاد کند. از طرفی باید این کار را با قدرت تمام برای خودتان انجام دهید.
به این ترتیب هنگام بازی از یک استراتژی خاص پیروی میکنید. استراتژی، یک برنامه کلی و کامل است که مشخص میکند چه حرکتی در چه موقعیت یا زمانی ممکن است رخ داده تا نتیجه بازی را به نفع شما برگرداند. در بازیهای ساده و با اطلاعات کامل، با رعایت این استراتژی به طور قطعی بازی را خواهید برد. در صورتی در یک بازی، تمامی قوانین، گزینههای ممکن و سابقه و مراحل قابل مشاهده باشد، آن را «بازی با اطلاعات کامل» (Perfect Information Game) مینامند. بازیهایی مانند تخته نرد، شطرنج و بازی X O از این گروه بازیها در نظریه بازی ها محسوب میشوند.
بازی بدون اطلاعات کامل، مانند «بازی سنگ-کاغذ-قیچی» (stone-paper-scissors game) است که برای آن نمیتوان استراتژی خاصی پیدا کرد. زیرا از نوع یا نحوه بازی حریف اطلاعی نداریم. از طرفی هیچ استراتژی خاصی وجود ندارد که پیروزی را تضمین کند. در بازی «شیر یا خط» (Head and Tail) با یک سکه سالم (سکه نااریب یا سکهای که شانس یا احتمال مشاهده شیر با خط برابر است)، میتوان دو استراتژی اصلی را در نظر گرفت: انتخاب شیر یا انتخاب خط. برای بازی سنگ-کاغذ-قیچی هم سه استراتژی اصلی وجود دارد: آوردن سنگ، کاغذ یا قیچی. ولی هیچ تضمینی وجود ندارد که انتخاب هر یک از این استراتژیها باعث برنده شدن بازیکن شود.
در هر دو مورد نمیتوان به طور مداوم یک استراتژی اصلی مانند شیر و یا سنگ را به کار برد، زیرا حریف به زودی استراتژی برنده را پیدا میکند و بازی را به نفع خود در میآورد. بنابراین سوال اصلی در نظریه بازی ها و قواعد تصمیم این است که استراتژی مناسب چه خواهد بود که توسط حریف نیز قابل شناسایی نبوده و باعث برنده شدن بازیکن شود؟
برای مثال اغلب مردم الگوهای قابل پیشبینی در بازی سنگ-کاغذ-قیچی از خود نشان میدهند که اگر طرف مقابل بتواند آن را تشخیص دهد، از دیدگاه نظریه بازیها میتواند در همه بازیها برنده شود. معمولا وقتی کسی در یک دور از این بازی برنده میشود، همان حرکت قبلی را برای تکرار یا دور بعدی بازی نیز به کار میبرد و اگر بازیکنی در یک مرحله بازنده شود، معمولا به سراغ الگوی بعدی در توالی «سنگ – کاغذ – قیچی» میرود.
به عنوان مثال، اگر در مرحله اول، بازیکن ۱ سنگ و بازیکن ۲ نیز کاغذ را نشان دهد، بازیکن ۲ برنده میشود. در تکرار بعدی، بازیکن ۲ همان حرکت را تکرار کرده زیرا سابقه برنده شدن با نمایش کاغذ را دارد. ولی بازیکن ۱ به علت شکست در مرحله قبلی به سراغ استراتژی دیگری میرود و این بار قیچی را نشان میدهد. در نتیجه او برنده این دور بازی خواهد بود. البته توجه داشته باشید که اگر هر دو بازیکن یک استراتژی را اجرا کنند و مثلا کاغذ را نشان دهند، نتیجه بازی مساوی میشود.
یک روش میتواند استفاده از انتخاب استراتژی براساس احتمال و در نظر گرفتن پدیدههای تصادفی باشد. سعی بر این است که حریف خود را با انتخاب تصادفی انتخاب استراتژی برای هر بازی (مثلا پرتاب سکه و مشاهده شیر برای انجام یک استراتژی و خط برای انجام استراتژی دیگر)، غافلگیر کنیم. همچنین در نظر بگیرید که در بازی سنگ-کاغذ-قیچی، میتوانیم یک تاس را بریزیم و تصمیم بگیریم که در صورت مشاهده عدد 1 یا 2 در نتیجه پرتاب تاس، سنگ و مشاهده ۳ یا ۴، کاغذ و با مشاهده ۵ یا ۶، قیچی را انتخاب کنیم. با انجام این کارها تمایل دارید که استراتژی خود را از حریف پنهان کنید و براساس احتمالات دست به انتخاب یکی از استراتژیهای اصلی بزنید.
اما اگر استراتژیها را در نظریه بازی ها با یکدیگر مخلوط کنیم، آیا انتظار دارید در بلند مدت برنده شوید یا بازنده خواهید بود؟ ترکیب مطلوب استراتژیهایی که باید بازی کنید، چیست؟ چقدر انتظار دارید که برنده شوید؟ این جایی است که محاسبات و به کارگیری ریاضیات مدرن در نظریه بازی ظاهر میشود. از آنجایی که بیشتر بازیها با اطلاعات کامل نیستند و بر حسب شرایط متفاوت و گاه تصادفی، ریسکهای متفاوتی وجود دارد، استفاده از قوانین احتمال و نظریههای آمار و احتمالات نیز مطرح میشود.
بازی هایی مانند پرتاب سکه و شیر یا خط یا بازی سنگ-کاغذ-قیچی از نوع دو نفره، «بازی مجموع صفر» (Zero Sum Game) نامیده میشوند. مجموع صفر به این معنی است که هر پولی که بازیکن ۱ برنده میشود (یا از دست میدهد) دقیقا همان مقدار پولی است که بازیکن ۲ از دست میدهد (یا برنده میشود). به این ترتیب، در چنین بازی هیچ پولی ایجاد نشده و یا از دست نمیرود. بسیاری از بازیهای دو نفره از این نوع هستند.
نظریه بازی و استراتژی
قدرت و حیطه کاربرد نظریه بازی ها و قواعد تصمیم، از تجزیه و تحلیل بازیهای نسبتا ساده گرفته تا بازیها پیچیده و با استراتژیهای تصادفی گسترده است. ممکن است در یک بازی، شرایط رقابتی بسیاری پیچیدهای وجود داشته باشد و مثلا در یک بازی چند نفره، ممکن است بعضی از بازیکنان یک ائتلاف علیه یک بازیکن تشکیل دهند و با یکدیگر برای شکست دادن بازیکن قدرتمند، در آن همکاری کنند. همچنین در بازیهای چند نفره که مجموعهای غیر صفر دارند یا بازی با تعداد نامتناهی استراتژی، تشخیص و انتخاب الگو برنده کار سخت و پیچیدهای است که توسط محاسبات ریاضی و آماری صورت میگیرد. البته امروز استفاده از رایانهها و کمک گرفتن از سرعت پردازش زیاد آنها امکان پیدا کردن پاسخ سریع را برای چنین بازیهای پیچیدهای فراهم آورده است.
تجزیه و تحلیل ریاضی از چنین بازیهای منجر به تعمیم «نتیجه مطلوب بهینه» (Optimal Solution Result) در نظریه بازی ها و قواعد تصمیم شد. همچنین راه حل تعادل گروهی از استراتژی های ترکیبی است که برای هر بازیکن به کار میرود، به طوری که هر بازیکن هیچ دلیلی برای انحراف از این استراتژی ندارد، زیرا تا زمانی که همه بازیکنان دیگر در استراتژی تعادل خود قرار داشته باشند، همه در بازی سود خواهند برد. این نتیجه در نظریه بازی ها بخصوص در مباحث اقتصادی و تجارت بینالملل کاربرد دارد.
دانشمند و ریاضیدان بزرگ «جان فن نیمن» (John von Neumann) ثابت کرد در بازیهای با استراتژیهای تصادفی که در نظریه بازی ها و قواعد تصمیم، مطرح شده، حتما یک استراتژی بهینه برای هر یک از بازیکنان براساس مقدار «مورد انتظار» (Expected Value) برای بُرد و باخت، وجود دارد. از دیگر دانشمند صاحب تفکر در نظریه بازی میتوان از «اسکار مورگنشترن» (Oskar Morgenstern) نام برد که کارهای مشترکی با جان فن نیمن در نظریه بازیها دارد. در نظریه «مارتینگلها» (Martingales) به این موضوع اشاره شده است و بازیها را براساس این مقدار مورد انتظار به سه شکل «بازی عادلانه» (Martingale)، «بازی سودآور» (Submartingale) و «بازی زیان ده» (Supermartingale) طبقهبندی کرده است. همچنین در مورد زمان توقف در چنین بازیهایی که الگو گرفته از بازیهای شانسی هستند بحثها و قضیههایی وجود دارد. به این ترتیب میتوان زمان خروج از یک بازی شانسی را برحسب میزان مجموع دریافتیها مشخص کرد.
همچنین «جان نش» (John Nash) ریاضیدان و اقتصاددان در توسعه نظریه بازی ها نقش مهمی داشته است. او «راهحل تعادلی» (Equilibrium Solution) را در نظریه بازی ها پیشنهاد کرد که مجموعهای از استراتژیهای ترکیبی است و برای هر بازیکن به کار میرود، به طوری که اگر همه بازیکنان در استراتژی تعادل خود قرار داشته باشند، هیچ بازیکنی دلیلی برای انحراف از این استراتژی ترکیبی یا راهحل تعادلی ندارد.
برای شناخت بیشتر در مورد تعادل نش، به ذکر دو مثال میپردازیم.
نظریه بازی و تعادل نش
مثال ۱:
دو دوست که هر دو به موسیقی کلاسیک علاقمند هستید، تصمیم دارند با یکدیگر به کنسرت بروند. متاسفانه اولی به موسیقی به سبک باخ علاقمند بوده و دومی به استراوینسکی و از آنجایی که سبک این دو موسیقیدان کاملا متفاوت است، این دو دوست دچار تضاد در منافع شدهاند. هر دو دوست دارند که با یکدیگر به دیدن کنسرت بروند. جدول زیر استراتژیهای ممکن را نشان میدهد.
استراوینسکی | باخ | |
0 و 0 | 1 و ۲ | باخ |
۲ و ۱ | ۰ و ۰ | استراوینسکی |
همانطور که در جدول میبینید یکی از استراتژیها که به صورت (۰ و ۰) نوشته شده، این است که این دو دوست در هیچ کنسرتی شرکت نکنند. ولی با توجه به تعادل نش، این مسئله تصمیم دارای دو نقطه تعادل به صورت حضور هر دو در کنسرت استراوینسکی یا باخ است. عدد ۱ نشانگر تمایل ضعیف و ۲ نشانگر تمایل شدید برای هر یک از کنسرتها توسط هر یک از دوستان در نظر گرفته شده.
مثال ۲:
یکی از مثالهای زیبا در نظریه بازی ها، معمای دو زندانی یا دو متهم است. به این دو متهم پیشنهاد میشود که اگر هر دو به جرم خود اعتراف کنند، سه سال زندانی خواهند شد ولی اگر علیه دیگری شهادت دهد، آزاد شده و دیگری به چهار سال حبس، محکوم میشود. ولی اگر اعترافی در کار نباشد حداکثر یکسال زندانی خواهند داشت زیرا به جرمی کوچکتر محکوم خواهند شد.
جدول زیر به بررسی وضعیت آنها در انتخاب استراتژی پرداخته است.
اعتراف و شهادت علیه دیگری | عدم اعتراف | زندانی اول /
زندانی دوم |
4 و 0 | 3 و 3 | عدم اعتراف |
1 و 1 | 0 , 4 | اعتراف و شهادت علیه دیگری |
مشخص است بهترین استراتژی همکاری این دو متهم است. البته چون هیچکدام از اقدام دیگری خبر ندارد، بهترین گزینه اعتراف نکردن هر دو است. چون به این ترتیب فقط یکسال محکومیت خواهند داشت. این نقطه یعنی (۱ و ۱) تعادل نش است. ولی اگر هر یک از آنها اعتراف کند دیگری ضرر زیادی خواهد خورد.
این که آیا در یک بازی شانسی یا حتی بازی غیرشانسی، نقطه تعادل نش وجود دارد، مسئله پیچیدهای است که احتیاج به ریاضیات پیشرفته و مدرن دارد. ولی به هر حال در اغلب بازیها بخصوص بازیهای شانسی میتوان نقطه تعادل نش را جستجو و پیدا کرد.
برای آشنایی بیشتر با نظریه بازی ها و قواعد تصمیم میتوانید به دوره آموزش ویدیویی نظریه بازیها (Game Theory) مراجعه کنید. در این آموزش مفاهیمی مانند برنده، بازنده، انواع بازی و مدلسازی بازیها و پیدا کردن استراتژیهای برنده، شرح و توضیح داده شده است. همچنین در این ویدئو برای محاسبه مقدار کمینه برای تابع زیان بازی یا بیشینه برای تابع سود حاصل از بازی، «روش بهینهسازی سیمپلکس» (Simplex Method) یادآوری و به کار گرفته شده است.
- برای دیدن فیلم آموزش نظریه بازی ها (Game Theory) + اینجا کلیک کنید.
اگر مطلب بالا برای شما مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش نظریه بازیها (Game theory)
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- آموزش فرایندهای تصادفی (Stochastic Processes)
- مارتینگل — معرفی و کاربردها
- قضیه بیز در احتمال شرطی و کاربردهای آن
- متغیر تصادفی، تابع احتمال و تابع توزیع احتمال
^^