هوش مصنوعی چیست؟ ــ بخش دوم: مسائل
در قسمت اول از مجموعه مقالات هوش مصنوعی، مقدمه، تاریخچه و مبانی این علم مورد بررسی قرار گرفت. بر اساس مطالب مطرح شده، میتوان نتیجه گرفت که هدف کلی هوش مصنوعی، ساخت فناوری است که به رایانهها و ماشینها قابلیت عملکرد هوشمند و تفکر انسانگونه را میدهد. مساله ساخت یا شبیهسازی هوشمندی، به زیر مسائلی تقسیم میشود؛ این زیرمسائل در بر گیرنده تهدیدها و فرصتهایی هستند که انتظار میرود یک سیستم هوشمند از خود نشان دهد. تهدیدهایی که در ادامه تشریح میشوند، جزو مهمترین مسائل مطرح شده در حوزه هوش مصنوعی هستند.
استدلال، حل مساله
اولین پژوهشگران هوش مصنوعی، الگوریتمهایی را ساخته و توسعه دادند که فرآیند استدلالی که انسانها هنگام حل پازل یا استنتاج منطقی بهکار میبرند را بهصورت گامبهگام تقلید میکرد. در اوایل ۱۹۸۰ و اواخر ۱۹۹۰، پژوهشگران هوش مصنوعی با بهرهگیری از مفاهیم احتمالات و اقتصاد، راهکارهایی جهت شرایطی ارائه کردند که عامل هوشمند با اطلاعات غیر قطعی (عدم قطعیت) و ناقص سر و کار داشت.
این الگوریتمها عدم کفایت خود در حل مسائل بزرگ استدلالی را با وقوع پدیده «انفجار ترکیبی» (combinatorial explosion) نشان دادند. پدیده انفجار ترکیبی، به رشد نمایی زمان مورد نیاز جهت حل مساله، متناسب با بزرگ شدن آن اشاره دارد. به عبارت دیگر، با بزرگتر شدن مساله، الگوریتمهای ارائه شده برای آن کندتر میشوند. مساله اساسی این است که کمتر پیش میآید انسانها از روش گامبهگامی که پژوهشهای اولیه هوش مصنوعی قادر به مدلسازی آن بودند برای استدلال استفاده کنند. انسانها اغلب برای حل مسائل خود از قضاوتهای سریع و شهودی بهره میگیرند.
ارائه دانش
ارائه دانش و مهندسی دانش، در مرکز توجهات پژوهشهای کلاسیک هوش مصنوعی قرار داشتند. در همین حال، برخی از سیستمهای خبره، برای گردآوری دانش صریح کارشناسان در برخی از «دامنههای ضعیف» (دامنههای مشخص و محدودی که وظایف خاصی در آنها تعریف شده) تلاش میکردند. علاوه بر آن، برخی از پروژههای هوش مصنوعی در تلاش برای کسب «دانش خرد جمعی» تعریف شده برای یک انسان معمولی، در یک پایگاه داده حاوی دانش گسترده درباره جهان بودند. اشیا، مشخصهها، دستهها، روابط بین اشیا، موقعیتها، رویدادها، حالات، زمان، علتها و اثرات، دانش درباره دانش (دانستههای ما درباره آنچه دیگر افراد میدانند) و بسیاری از دیگر زمینههای کمتر مورد پژوهش قرار گرفته از جمله مواردی هستند که یک پایگاه دانش خرد جمعی شامل میشود.
«چه چیزی موجود است» در پایگاه شناخت به صورت «مجموعهای از اشیا، روابط، مفاهیم و مشخصههای تعریف شده به صورت رسمی که یک عامل نرمافزاری میتواند آنها را تعریف کند» تبیین میشود. معناشناسی این مسائل به عنوان مفاهیم «منطق توصیفی»، نقشها و اشخاص ثبت شده و معمولا بهصورت کلاسها، مشخصهها و اشخاص به «زبان هستیشناسی وب» پیادهسازی میشوند.
مرسومترین شیوه «هستیشناسی» (ontology)، را هستیشناسی سطح بالا مینامند که مبنای سایر دامنههای دانش (یک زمینه علاقمندی یا موضوع نگرانی) را فراهم میکند. چنین ارائه دانش رسمی در شاخصگذاری و بازیابی محتوا محور، تفسیر صحنه، پشتیبانی تصمیم کلینیکی، کشف دانش (کاوش استنتاجهای جالب توجه و کارا از پایگاه دادههای بزرگ) و دیگر حوزهها قابل استفاده است. برخی از دشوارترین چالشهای موجود در بحث ارائه دانش در ادامه بیان شدهاند.
استدلال پیشفرض و مساله کیفیسازی
بسیاری از چیزهایی که انسانها میدانند، شکل «مفروضات کاری» به خود میگیرد. برای مثال، اگر گفتوگویی درباره یک پرنده انجام شود، انسانها او را به صورت یک حیوان در سایز کف دست تصویر میکنند، که پرواز میکند و آواز میخواند. اما هیچ یک از این ویژگیها درباره همه پرندهها صادق نیست. جان مککارتی، این مساله را در سال ۱۹۶۹ شناسایی و با نام مساله کیفیسازی مطرح کرد. او در تعریف این مساله میگوید: «برای کلیه قوانین خرد جمعی که توجه پژوهشگران هوش مصنوعی را به خود جلب کرده، حجم زیادی از استثناعات وجود دارد. هیچچیز به شکلی که منطق مطلق میطلبد، درست یا غلط نیست». گفتنی است که در حال حاضر، پژوهشگران هوش مصنوعی راهکارهایی برای حل این مساله کشف کردهاند.
وسعت دانش خرد جمعی
مجموعه حقایق ریزی که یک انسان معمولی میداند بسیار گسترده است. پروژههای تحقیقاتی که برای ساخت یک پایگاه دانش کامل از «دانش خرد جمعی» (commonsense knowledge) تلاش میکنند، نیازمند حجم وسیعی از مهندسی هستیشناسی سختگیرانه است (باید به صورت دستی ساخته شود) که در زمان کنونی مفهومی بسیار پیچیده محسوب میشود.
شکل نمادین دانش خرد جمعی
بسیاری از دانستههای انسانها به صورت «حقایق» یا «بیانهایی» قابل ابراز در قالب شفاهی ارائه نمیشوند. برای مثال، یک قهرمان شطرنج از برخی موقعیتهای خاص در این بازی اجتناب میکند زیرا باور دارد که «بیش از اندازه در معرض خطر قرار میگیرد»، یا یک منتقد هنری تنها با نگاه کردن به یک مجسمه میتواند تشخیص بدهد که جعلی است.
این موارد، شهودات یا گرایشهای ناخودآگاه و زیرنمادین مغز انسانها هستند. چنین دانشی، آگاهیها، پشتیبانیها و زمینه لازم برای دانش هوشیار و نمادین را فراهم میکند. همراه با مساله استدلال زیر-نمادین، انتظار میرود «هوش مصنوعی موقعیتی» (situated AI)، «هوش محاسباتی» (computational intelligence) یا «هوش مصنوعی آماری» (statistical AI) راهکارهایی برای ارائه این نوع دانش فراهم کنند.
برنامهریزی
عاملهای هوشمند باید قادر به تعیین اهداف و دستیابی به آنها باشند. این عاملها نیاز به راهی برای بصریسازی آینده (یک ارائه از وضعیت جهان و توانایی پیشبینی درباره اینکه چگونه اقدامات آنها جهان را تغییر میدهد) دارند و نیازمند اتخاذ تصمیماتی هستند که کارایی - یا ارزش - انتخابهای موجود را بیشینه کند.
در مسائل برنامهریزی کلاسیک، عامل میتواند فرض کند که تنها سیستم در حال کار در جهان است. این فرض موجب میشود که عامل بتواند درباره عواقب تصمیماتش قطعیت داشته باشد. اگرچه، در صورتیکه عامل در حقیقت تنها نقشآفرین جهان نباشد، نیازمند آن است که بتواند در شرایط عدم قطعیت استدلال کند. این امر نیاز به عاملهایی را ایجاد میکند که علاوه بر ارزیابی محیط و پیشبینی، بتوانند پیشبینیهای خود را نیز ارزیابی کرده و آنها را بر اساس نتایج ارزیابیها تطبیق دهند. «برنامهریزی چند عامله» (Multi-agent planning)، از تعاون و رقابت عاملهای متعدد برای کسب یک هدف مشخص استفاده میکند. «رفتار ناپایدار» (Emergent behavior) مانند این، در «الگوریتمهای تکاملی» (evolutionary algorithms) و «هوش ازدحامی» (swarm intelligence) مورد استفاده قرار میگیرد.
یادگیری
از زمان ظهور هوش مصنوعی، اصول یادگیری ماشین، مفاهیم پایهای آن را تشکیل داده. یادگیری ماشین در واقع مطالعه الگوریتمهای رایانهای است که از طریق تجربه کردن بهبود پیدا میکنند. یادگیری نظارت نشده توانایی کشف الگو در جریان دادههای ورودی را دارا است. یادگیری نظارت شده دارای دو مبحث دستهبندی و رگرسیون عددی میشود. دستهبندی برای تعیین اینکه یک نمونه متعلق به کدام دسته است مورد استفاده قرار میگیرد. الگوریتمهای دستهبندی پس از مشاهده نمونههای موجود در دستههای گوناگون در رابطه با وضعیت یک نمونه جدید تصمیمگیری میکنند.
در رگرسیون قصد تولید توابعی وجود دارد که رابطه بین ورودیها و خروجیها را تشریح و پیشبینی کنند که چگونه با تغییر ورودیها، خروجیها تغییر میکنند. یادگیرندگان در دستهبندی و رگرسیون بهعنوان «توابع تخمینزنندهای» (function approximators) به نظر میرسند که تلاش میکنند تا یک کارکرد ناشناخته را (احتمالا بهطور ضمنی) بیاموزند. برای مثال، یک دستهبند (Classifier) «هرزنامه» (Spam)، میتواند یادگیرندهای محسوب شود که براساس متن یک ایمیل آن را به یکی از دو دسته هرزنامه یا غیر هرزنامه نگاشت میکند.
نظریه یادگیری محاسباتی میتواند یادگیرندگان را با پیچیدگی محاسباتی بهوسیله پیچیدگیهای نمونه (چه میزان داده مورد نیاز است) یا براساس دیگر مفاهیم بهینهسازی ارزیابی کند. در یادگیری تقویتی، عامل برای داشتن پاسخ خوب پاداش دریافت میکند و برای پاسخهای بد تنبیه میشود. عامل، از این توالی پاداشها و تنبیهها برای شکل دادن یک استراتژی عملکرد در فضای مساله استفاده میکند.
پردازش زبان طبیعی
پردازش زبان طبیعی (NLP) به ماشین توانایی خواندن و درک زبان انسان را میدهد. یک سیستم پردازش زبان طبیعی که به اندازه کافی قدرتمند باشد، قادر به فعالسازی رابط کاربری زبان طبیعی و کسب دانش بهطور مستقیم از منابع نوشته شده توسط انسان مانند متنهای خبری آنلاین منتشر شده توسط خبرگزاریها است. از جمله کاربردهای مستقیم پردازش زبان طبیعی میتوان به بازیابی اطلاعات، کاوش متن، پرسشوپاسخ و ترجمه ماشینی اشاره کرد. بسیاری از رویکردهای کنونی، از تکرار وقوع واژگان در یک متن برای ایجاد یک ارائه نحوی از متن استفاده میکنند. استراتژی «نقطهگذاری کلیدواژهها» (Keyword spotting)، برای جستوجو، بسیار مشهور و توسعهپذیر اما در عین حال گنگ است. در چنین روشی، هنگام جستوجوی کلمه «خودرو» در میان یک مجموعه سند، تنها اسنادی به عنوان خروجی ارائه میشوند که کلمه «خودرو» در آنها وجود داشته باشد و به عنوان مثال، از اسنادی که واژه «سمند» در آنها موجود است صرفنظر میکند.
استراتژیهای «وابستگی لُغوی» (Lexical affinity)، از میزان وقوع کلماتی مانند «تصادف»، برای ارزیابی عواطف یک متن استفاده میکنند. رویکردهای پردازش زبان طبیعی آماری میتوانند انواع استراتژیها را با یکدیگر ترکیب کرده و به صحت قابل قبولی در سطح صفحه یا پاراگراف دست پیدا کنند، اما همچنان دچار فقدان درک معنایی مورد نیاز برای دستهبندی جملات منزوی به شکل مناسب هستند. در کنار دیگر دشواریهای موجود برای رمزنگاری معنایی دانش خرد جمعی، پردازش زبان طبیعی معنایی گاه چندان قابل اعتماد نیست. فراتر از پردازش زبان طبیعی معنایی، هدف نهایی پردازش زبان طبیعی «روایت» تجسم یک درک کامل از استدلال خرد جمعی است.
ادراک
«ادراک ماشینی» (Machine perception)، توانایی استفاده از ورودیهای حسگرها (مانند دوربینها، میکروفونهای طیف مرئی و فروسرخ، سیگنالهای بیسیم، لیدارها، سونارها، رادارها و حسگرهای لمسی) برای استنباط جنبههای گوناگون جهان را دارد. از دیگر کاربردهای ادراک ماشینی میتوان به بازشناسی گفتار، چهره و شی اشاره کرد. بینایی ماشین در واقع توانایی تحلیل ورودیهای بصری است. چنین ورودیهایی معمولا مبهم هستد. یک عابر پیاده غولپیکر که ۱۵ سانتیمتر قد دارد، ممکن است در فاصله بسیار دور به همان میزان پیکسلی دیده شود که یک عابر پیاده در ابعاد طبیعی در فاصله نزدیک دیده میشود، و این نیازمند قضاوت هوش مصنوعی برای محتمل و معقول بودن تفاسیر گوناگون است، برای مثال از «مدل شی» برای ارزیابی عابر پیاده ۱۵ متری که وجود خارجی ندارد استفاده کند.
تحرک و کار دستی
هوش مصنوعی بهطور گستردهای در رباتیک مورد استفاده قرار میگیرد. بازوهای ریاتیک پیشرفته و دیگر رباتهای صنعتی، بهطور گسترده در کارخانجات مدرن، استفاده میشوند و میتوانند از تجربیات خود بیاموزند که چگونه بهشکل موثری در غیاب اصطکاک و لغزش چرخدندهها اجسام را حرکت دهند.
یک ربات متحرک مدرن، هنگامی که یک محیط قابل رویت، ایستا و کوچک را مشاهده میکند، میتواند به سادگی موقعیت خود در محیط و وضعیت محیط را تشخیص داده و آن را نگاشت کند. اگرچه، محیطهای پویایی مانند ورودی ناحیه تنفسی در بدن فرد بیمار (در آندوسکوپی)، چالشهای بزرگتری را بر دارند. برنامهریزی حرکت، فرآیند شکستن یک وظیفه حرکتی به «بدویاتی» مانند حرکت مفاصل یک فرد است. چنین تحرکاتی معمولا شامل سازگاری حرکتی میشوند، فرآیندی که طی آن حرکت نیازمند حفظ ارتباط فیزیکی با یک شی است.
«تناقض مُوراوِک» (Moravec's paradox)، بیان میکند که برنامهریزی رباتها برای مهارتهای حرکتی که انجام آنها برای انسانها بسیار آسان است، کاری پیچیده و دشوار محسوب میشود. این تناقض به افتخار هانس موراوک، تناقض موراوک نامیده میشود. وی در سال ۱۹۸۸ بیان کرد: «ساخت رایانههایی که عملکردی مانند انسانهای بالغ داشته باشند یا بازی دوز (چکرز) را بازی کنند نسبتا آسان است و دادن مهارت یک انسان یک ساله به ربات هنگامی که بحث از ادراک و پویایی باشد، بسیار سخت و یا غیر ممکن است». این امر وابسته به این حقیقت است که برخلاف چکرز، مهارت فیزیکی هدف مستقیم انتخاب طبیعی طی میلیونها سال گذشته بوده است. به عبارت دیگر، کارهایی مانند بازشناسی چهره و صدا و استنباطهایی که انجام آن برای انسان ساده است، برای رایانه دشوار، و انجام کارهایی مانند اثبات نظریات پیچیده که برای انسانها دشواری دارد، برای رایانه امکانپذیر است.
هوش اجتماعی
تناقض موراوک میتواند به اشکال گوناگونی از هوش اجتماعی تعمیم پیدا کند. برای مثال، هماهنگی وسایل نقلیه خودمختار همچنان یکی از مسائل سخت هوش مصنوعی باقیمانده است. «محاسبات عاطفی» (Affective computing)، یک مبحث میانرشتهای است و شامل سیستمهایی میشود که اثر انسانی را تشخیص داده و یا شبیهسازی، پردازش و تفسیر میکنند. موفقیتهای نسبی در رابطه با محاسبات عاطفی حاصل شدهاند که از آن جمله میتوان به تحلیل عواطف (sentiment analysis) متنی، و اخیرا، تحلیل اثر چند مدله اشاره کرد که در آن هوش مصنوعی احساسات بروز یافته در موضوع یک نوار ویدئویی را دستهبندی میکند.
در دراز مدت، داشتن مهارتهای اجتماعی، درک عواطف انسانی و «نظریه بازیها» (game theory) برای عاملهای اجتماعی ارزشمند است. قادر بودن به پیشبینی اقدامات دیگران با استفاده از وضعیت حرکات و عواطف آنها یک عامل را قادر به تصمیمسازی بهتر میکند. برخی از سیستمهای رایانهای، عواطف و حالات انسانی را بهمنظور افزایش حساسیت نسبت به پویایی عواطف تعاملات انسانی یا تسهیل تعاملات انسان-رایانه تقلید میکنند. بهطور مشابه، برخی از دستیارهای مجازی بهگونهای برنامهریزی شدهاند که مکالمه و حتی شوخطبعی داشته باشند. در طراحی چنین عاملهایی این گرایش وجود دارد که برای کاربران سادهلوح یک تصویر غیر واقعی از عامل هوشمند ارائه کنند.
هوش عمومی
پروژههایی مانند پایگاه دانش (۱۹۸۴) Cyc و پروژه ژاپنی نسل پنجم سیستمهای رایانهای (۱۹۸۲-۱۹۹۲)، تلاشهای گستردهای را جهت وسعت بخشیدن به شناخت انسانی فراهم کردند. این پروژههای اولیه، در فرار از محدودیتهای مدلهای منطقی نمادین غیر کمّی شکست خوردند، و میتوان گفت با نگاهی به گذشته تخمین خوبی از سختیهای راه هوش مصنوعی ارائه کردند.
امروزه، گستره وسیعی از پژوهشهای هوش مصنوعی بهجای کاربردهای غیر قابل اجتناب و ضعیف (مانند تشخیص خطای پزشکی یا ناوبری خودرو) در حال انجام است. بسیاری از پژوهشگران پیشبینی میکنند که هوش مصنوعی ضعیف در دامنههای مجزای متفاوت سرانجام در یک ماشین دارای هوش مصنوعی عمومی (AGI) گنجانده شود و با ترکیب بیشتر مهارتهای ضعیف در برخی موارد بتواند حتی از مهارتهای انسانی نیز پیشی بگیرد. بسیاری از کاربردهای پیشرفته هوش مصنوعی نیز دارای اهمیت متقابل دامنهای هستند.
یک مثال سطح بالا از این امر، گوگل دیپ مایند است که در سال ۲۰۱۰ یک «هوش مصنوعی عمومی» را توسعه داد که میتوانست از بازیهای آتاری گوناگون یاد بگیرد. پس از این پروژه، دیپ مایند، سیستمهای متنوعی را تولید کرد که در یادگیری ترتیبی موفق عمل میکردند. علاوه بر «یادگیری انتقالی» (transfer learning)، پیشرفت فرضیههای هوش مصنوعی عمومی میتواند شامل توسعه معماری انعکاسی شود که توانایی مشارکت در نظریه تصمیمگیری فرا استدلالی را فراهم میکند و کشف کند که چگونه میتوان یک پایگاه دانش جامع را از کل وب ساختار نیافته ایجاد کرد.
همواره بحثهایی در رابطه با اینکه برخی از «الگوریتمهای اصلی» به لحاظ مفهومی ساده (در حال حاضر کشف نشدهاند) اما دارای ریاضیات پیچیده، میتوانند منجر به هوش مصنوعی عمومی بشوند جریان داشته است. سرانجام، برخی از رویکردهای ناپایدار، بهدنبال شبیهسازی هوش انسانی هستند و باور دارند که ویژگیهای انسانانگاری مانند مغز مصنوعی یا پرورش کودک شبیهسازی شده ممکن است روزی به نقطه بحرانی برسند که هوش عمومی در آن ظهور میکند.
این در حالیست که ماشین حتی برای حل مسائل سادهتری مانند ترجمه نیز نیازمند خواندن و نوشتن به کمک پردازش زبان طبیعی، دنبال کردن موضوع سخنرانی (استدلال)، دانستن آنکه درباره چه چیزی صحبت میشود (دانش) و بازتولید منظور اصلی نویسنده (هوش اجتماعی) است. مسائلی مانند ترجمه ماشینی «هوش مصنوعی کامل» (AI-complete) محسوب میشوند، زیرا همه این مسائل نیازمند حل همزمان جهت رسیدن به کارایی در سطح انسان هستند.
قسمت سوم این مطلب (هوش مصنوعی ــ قسمت سوم: رویکردها) را مطالعه کنید.
اگر نوشته بالا برای شما مفید بوده است، مطالعه مطالب زیر نیز به شما پیشنهاد میشود: