هوش مصنوعی چیست؟ ــ بخش دوم: مسائل

۲۹ بازدید
آخرین به‌روزرسانی: ۱۹ اردیبهشت ۱۴۰۰
زمان مطالعه: ۹ دقیقه
هوش مصنوعی چیست؟ ــ بخش دوم: مسائل

در قسمت اول از مجموعه مقالات هوش مصنوعی، مقدمه، تاریخچه و مبانی این علم مورد بررسی قرار گرفت. بر اساس مطالب مطرح شده، می‌توان نتیجه گرفت که هدف کلی هوش مصنوعی، ساخت فناوری است که به رایانه‌ها و ماشین‌ها قابلیت عملکرد هوشمند و تفکر انسان‌گونه را می‌دهد. مساله ساخت یا شبیه‌سازی هوشمندی، به زیر مسائلی تقسیم می‌شود؛ این زیرمسائل در بر گیرنده تهدیدها و فرصت‌هایی هستند که انتظار می‌رود یک سیستم هوشمند از خود نشان دهد. تهدیدهایی که در ادامه تشریح می‌شوند، جزو مهم‌ترین مسائل مطرح شده در حوزه هوش مصنوعی هستند.

استدلال، حل مساله

اولین پژوهشگران هوش مصنوعی، الگوریتم‌هایی را ساخته و توسعه دادند که فرآیند استدلالی که انسان‌ها هنگام حل پازل یا استنتاج منطقی به‌کار می‌برند را به‌صورت گام‌به‌گام تقلید می‌کرد. در اوایل ۱۹۸۰ و اواخر ۱۹۹۰، پژوهشگران هوش مصنوعی با بهره‌گیری از مفاهیم احتمالات و اقتصاد، راهکارهایی جهت شرایطی ارائه کردند که عامل هوشمند با اطلاعات غیر قطعی (عدم قطعیت) و ناقص سر و کار داشت.

این الگوریتم‌ها عدم کفایت خود در حل مسائل بزرگ استدلالی را با وقوع پدیده «انفجار ترکیبی» (combinatorial explosion) نشان دادند. پدیده انفجار ترکیبی، به رشد نمایی زمان مورد نیاز جهت حل مساله، متناسب با بزرگ شدن آن اشاره دارد. به عبارت دیگر، با بزرگ‌تر شدن مساله، الگوریتم‌های ارائه شده برای آن کندتر می‌شوند. مساله اساسی این است که کمتر پیش می‌آید انسان‌ها از روش گام‌به‌گامی که پژوهش‌های اولیه هوش مصنوعی قادر به مدل‌سازی آن بودند برای استدلال استفاده کنند. انسان‌ها اغلب برای حل مسائل خود از قضاوت‌های سریع و شهودی بهره می‌گیرند.

ارائه دانش

ارائه دانش و مهندسی دانش، در مرکز توجهات پژوهش‌های کلاسیک هوش مصنوعی قرار داشتند. در همین حال، برخی از سیستم‌های خبره، برای گردآوری دانش صریح کارشناسان در برخی از «دامنه‌های ضعیف» (دامنه‌های مشخص و محدودی که وظایف خاصی در آن‌ها تعریف شده) تلاش می‌کردند. علاوه بر آن، برخی از پروژه‌های هوش مصنوعی در تلاش برای کسب «دانش خرد جمعی» تعریف شده برای یک انسان معمولی، در یک پایگاه داده حاوی دانش گسترده درباره جهان بودند. اشیا، مشخصه‌ها، دسته‌ها، روابط بین اشیا، موقعیت‌ها، رویدادها، حالات، زمان، علت‌ها و اثرات، دانش درباره دانش (دانسته‌های ما درباره آنچه دیگر افراد می‌دانند) و بسیاری از دیگر زمینه‌های کمتر مورد پژوهش قرار گرفته از جمله مواردی هستند که یک پایگاه دانش خرد جمعی شامل می‌شود.

«چه چیزی موجود است» در پایگاه شناخت به صورت «مجموعه‌ای از اشیا، روابط، مفاهیم و مشخصه‌های تعریف شده به صورت رسمی که یک عامل نرم‌افزاری می‌تواند آن‌ها را تعریف کند» تبیین می‌شود. معناشناسی این مسائل به عنوان مفاهیم «منطق توصیفی»، نقش‌ها و اشخاص ثبت شده و معمولا به‌صورت کلاس‌ها، مشخصه‌ها و اشخاص به «زبان هستی‌شناسی وب» پیاده‌سازی می‌شوند.

مرسوم‌ترین شیوه «هستی‌شناسی» (ontology)، را هستی‌شناسی سطح بالا می‌نامند که مبنای سایر دامنه‌های دانش (یک زمینه علاقمندی یا موضوع نگرانی) را فراهم می‌کند. چنین ارائه دانش رسمی در شاخص‌گذاری و بازیابی محتوا محور، تفسیر صحنه، پشتیبانی تصمیم کلینیکی، کشف دانش (کاوش استنتاج‌های جالب توجه و کارا از پایگاه داده‌های بزرگ) و دیگر حوزه‌ها  قابل استفاده است. برخی از دشوارترین چالش‌های موجود در بحث ارائه دانش در ادامه بیان شده‌اند.

استدلال پیش‌فرض و مساله کیفی‌سازی

بسیاری از چیزهایی که انسان‌ها می‌دانند، شکل «مفروضات کاری» به خود می‌گیرد. برای مثال، اگر گفت‌و‌گویی درباره یک پرنده انجام شود، انسان‌ها او را به صورت یک حیوان در سایز کف دست تصویر می‌کنند، که پرواز می‌کند و آواز می‌خواند. اما هیچ یک از این ویژگی‌ها درباره همه پرنده‌ها صادق نیست. جان مک‌کارتی، این مساله را در سال ۱۹۶۹ شناسایی و  با نام مساله کیفی‌سازی مطرح کرد. او در تعریف این مساله می‌گوید: «برای کلیه قوانین خرد جمعی که توجه پژوهشگران هوش مصنوعی را به خود جلب کرده، حجم زیادی از استثناعات وجود دارد. هیچ‌چیز به شکلی که منطق مطلق می‌طلبد، درست یا غلط نیست». گفتنی است که در حال حاضر، پژوهشگران هوش مصنوعی راهکارهایی برای حل این مساله کشف کرده‌اند.

وسعت دانش خرد جمعی

مجموعه حقایق ریزی که یک انسان معمولی می‌داند بسیار گسترده است. پروژه‌های تحقیقاتی که برای ساخت یک پایگاه دانش کامل از «دانش خرد جمعی» (commonsense knowledge) تلاش می‌کنند، نیازمند حجم وسیعی از مهندسی هستی‌شناسی سخت‌گیرانه است (باید به صورت دستی ساخته شود) که در زمان کنونی مفهومی بسیار پیچیده محسوب می‌شود.

شکل نمادین دانش خرد جمعی

بسیاری از دانسته‌های انسان‌ها به صورت «حقایق» یا «بیان‌هایی» قابل ابراز در قالب شفاهی ارائه نمی‌شوند. برای مثال، یک قهرمان شطرنج از برخی موقعیت‌های خاص در این بازی اجتناب می‌کند زیرا باور دارد که «بیش از اندازه در معرض خطر قرار می‌گیرد»، یا یک منتقد هنری تنها با نگاه کردن به یک مجسمه می‌تواند تشخیص بدهد که جعلی است.

این موارد، شهودات یا گرایش‌های ناخودآگاه و زیرنمادین مغز انسان‌ها هستند. چنین دانشی، آگاهی‌ها، پشتیبانی‌ها و زمینه لازم برای دانش هوشیار و نمادین را فراهم می‌کند. همراه با مساله استدلال زیر-نمادین، انتظار می‌رود «هوش مصنوعی موقعیتی» (situated AI)، «هوش محاسباتی» (computational intelligence) یا «هوش مصنوعی آماری» (statistical AI) راهکارهایی برای ارائه این نوع دانش فراهم کنند.

برنامه‌ریزی

عامل‌های هوشمند باید قادر به تعیین اهداف و دستیابی به آن‌ها باشند. این عامل‌ها نیاز به راهی برای بصری‌سازی آینده (یک ارائه از وضعیت جهان و توانایی پیش‌بینی درباره اینکه چگونه اقدامات آن‌ها جهان را تغییر می‌دهد) دارند و نیازمند اتخاذ تصمیماتی هستند که کارایی - یا ارزش - انتخاب‌های موجود را بیشینه کند.

در مسائل برنامه‌ریزی کلاسیک، عامل می‌تواند فرض کند که تنها سیستم در حال کار در جهان است. این فرض موجب می‌شود که عامل بتواند درباره عواقب تصمیماتش قطعیت داشته باشد. اگرچه، در صورتی‌که عامل در حقیقت تنها نقش‌آفرین جهان نباشد، نیازمند آن است که بتواند در شرایط عدم قطعیت استدلال کند. این امر نیاز به عامل‌هایی را ایجاد می‌کند که علاوه بر ارزیابی محیط و پیش‌بینی، بتوانند پیش‌بینی‌های خود را نیز ارزیابی کرده و آن‌ها را بر اساس نتایج ارزیابی‌ها تطبیق دهند. «برنامه‌ریزی چند عامله» (Multi-agent planning)، از تعاون و رقابت عامل‌های متعدد برای کسب یک هدف مشخص استفاده می‌کند. «رفتار ناپایدار» (Emergent behavior) مانند این، در «الگوریتم‌های تکاملی» (evolutionary algorithms) و «هوش ازدحامی» (swarm intelligence) مورد استفاده قرار می‌گیرد.

یادگیری

از زمان ظهور هوش مصنوعی، اصول یادگیری ماشین، مفاهیم پایه‌ای آن را تشکیل داده. یادگیری ماشین در واقع مطالعه الگوریتم‌های رایانه‌ای است که از طریق تجربه کردن بهبود پیدا می‌کنند. یادگیری نظارت نشده توانایی کشف الگو در جریان داده‌های ورودی را دارا است. یادگیری نظارت شده دارای دو مبحث دسته‌بندی و رگرسیون عددی می‌شود. دسته‌بندی برای تعیین اینکه یک نمونه متعلق به کدام دسته است مورد استفاده قرار می‌گیرد. الگوریتم‌های دسته‌‌بندی پس از مشاهده نمونه‌های موجود در دسته‌های گوناگون در رابطه با وضعیت یک نمونه جدید تصمیم‌گیری می‌کنند.

در رگرسیون قصد تولید توابعی وجود دارد که رابطه بین ورودی‌ها و خروجی‌ها را تشریح و پیش‌بینی کنند که چگونه با تغییر ورودی‌ها، خروجی‌ها تغییر می‌کنند. یادگیرندگان در دسته‌بندی و رگرسیون به‌عنوان «توابع تخمین‌زننده‌ای» (function approximators) به نظر می‌رسند که تلاش می‌کنند تا یک کارکرد ناشناخته را (احتمالا به‌طور ضمنی) بیاموزند. برای مثال، یک دسته‌بند (Classifier) «هرزنامه» (Spam)، می‌تواند یادگیرنده‌ای محسوب شود که براساس متن یک ایمیل آن را به یکی از دو دسته هرزنامه یا غیر هرزنامه نگاشت می‌کند.

نظریه یادگیری محاسباتی می‌تواند یادگیرندگان را با پیچیدگی محاسباتی به‌وسیله پیچیدگی‌های نمونه (چه میزان داده مورد نیاز است) یا براساس دیگر مفاهیم بهینه‌سازی ارزیابی کند. در یادگیری تقویتی، عامل برای داشتن پاسخ خوب پاداش دریافت می‌کند و برای پاسخ‌های بد تنبیه می‌شود. عامل، از این توالی پاداش‌ها و تنبیه‌ها برای شکل دادن یک استراتژی عملکرد در فضای مساله استفاده می‌کند.

پردازش زبان طبیعی

پردازش زبان طبیعی (NLP) به ماشین توانایی خواندن و درک زبان انسان را می‌دهد. یک سیستم پردازش زبان طبیعی که به اندازه کافی قدرتمند باشد، قادر به فعال‌سازی رابط کاربری زبان طبیعی و کسب دانش به‌طور مستقیم از منابع نوشته شده توسط انسان مانند متن‌های خبری آنلاین منتشر شده توسط خبرگزاری‌ها است. از جمله کاربردهای مستقیم پردازش زبان طبیعی می‌توان به بازیابی اطلاعات، کاوش متن، پرسش‌و‌پاسخ و ترجمه ماشینی اشاره کرد. بسیاری از رویکردهای کنونی، از تکرار وقوع واژگان در یک متن برای ایجاد یک ارائه نحوی از متن استفاده می‌کنند. استراتژی «نقطه‌گذاری کلیدواژه‌ها» (Keyword spotting)، برای جست‌و‌جو، بسیار مشهور و توسعه‌پذیر اما در عین حال گنگ است. در چنین روشی، هنگام جست‌و‌جوی کلمه «خودرو» در میان یک مجموعه سند، تنها اسنادی به عنوان خروجی ارائه می‌شوند که کلمه «خودرو» در آن‌ها وجود داشته باشد و به عنوان مثال، از اسنادی که واژه «سمند» در آن‌ها موجود است صرف‌نظر می‌کند.

استراتژی‌های «وابستگی لُغوی» (Lexical affinity)، از میزان وقوع کلماتی مانند «تصادف»، برای ارزیابی عواطف یک متن استفاده می‌کنند. رویکردهای پردازش زبان طبیعی آماری می‌توانند انواع استراتژی‌ها را با یکدیگر ترکیب کرده و به صحت قابل قبولی در سطح صفحه یا پاراگراف دست پیدا کنند، اما همچنان دچار فقدان درک معنایی مورد نیاز برای دسته‌بندی جملات منزوی به شکل مناسب هستند. در کنار دیگر دشواری‌های موجود برای رمزنگاری معنایی دانش خرد جمعی، پردازش زبان طبیعی معنایی گاه چندان قابل اعتماد نیست. فراتر از پردازش زبان طبیعی معنایی، هدف نهایی پردازش زبان طبیعی «روایت» تجسم یک درک کامل از استدلال خرد جمعی است.

ادراک

«ادراک ماشینی» (Machine perception)، توانایی استفاده از ورودی‌های حسگرها (مانند دوربین‌ها، میکروفون‌های طیف مرئی و فروسرخ، سیگنال‌های بی‌سیم، لیدارها، سونارها، رادارها و حسگرهای لمسی) برای استنباط جنبه‌های گوناگون جهان را دارد. از دیگر کاربردهای ادراک ماشینی می‌توان به بازشناسی گفتار، چهره و شی اشاره کرد. بینایی ماشین در واقع توانایی تحلیل ورودی‌های بصری است. چنین ورودی‌هایی معمولا مبهم هستد. یک عابر پیاده غول‌پیکر که ۱۵ سانتی‌متر قد دارد، ممکن است در فاصله بسیار دور به همان میزان پیکسلی دیده شود که یک عابر پیاده در ابعاد طبیعی در فاصله نزدیک دیده می‌شود، و این نیازمند قضاوت هوش مصنوعی برای محتمل و معقول بودن تفاسیر گوناگون است، برای مثال از «مدل شی» برای ارزیابی عابر پیاده ۱۵ متری که وجود خارجی ندارد استفاده کند.

تحرک و کار دستی

هوش مصنوعی به‌طور گسترده‌ای در رباتیک مورد استفاده قرار می‌گیرد. بازوهای ریاتیک پیشرفته و دیگر ربات‌های صنعتی، به‌طور گسترده در کارخانجات مدرن، استفاده می‌شوند و می‌توانند از تجربیات خود بیاموزند که چگونه به‌شکل موثری در غیاب اصطکاک و لغزش چرخ‌دنده‌ها اجسام را حرکت دهند.

یک ربات متحرک مدرن، هنگامی که یک محیط قابل رویت، ایستا و کوچک را مشاهده می‌کند، می‌تواند به سادگی موقعیت خود در محیط و وضعیت محیط را تشخیص داده و آن را نگاشت کند. اگرچه، محیط‌های پویایی مانند ورودی ناحیه تنفسی در بدن فرد بیمار (در آندوسکوپی)، چالش‌های بزرگ‌تری را بر دارند. برنامه‌ریزی حرکت، فرآیند شکستن یک وظیفه حرکتی به «بدویاتی» مانند حرکت مفاصل یک فرد است. چنین تحرکاتی معمولا شامل سازگاری حرکتی می‌شوند، فرآیندی که طی آن حرکت نیازمند حفظ ارتباط فیزیکی با یک شی است.

«تناقض مُوراوِک» (Moravec's paradox)، بیان می‌کند که برنامه‌ریزی ربات‌ها برای مهارت‌های حرکتی که انجام آن‌ها برای انسان‌ها بسیار آسان است، کاری پیچیده و دشوار محسوب می‌شود. این تناقض به افتخار هانس موراوک، تناقض موراوک نامیده می‌شود. وی در سال ۱۹۸۸ بیان کرد: «ساخت رایانه‌هایی که عملکردی مانند انسان‌های بالغ داشته باشند یا بازی دوز (چکرز) را بازی کنند نسبتا آسان است و دادن مهارت یک انسان یک ساله به ربات هنگامی که بحث از ادراک و پویایی باشد، بسیار سخت و یا غیر ممکن است». این امر وابسته به این حقیقت است که برخلاف چکرز، مهارت فیزیکی هدف مستقیم انتخاب طبیعی طی میلیون‌ها سال گذشته بوده است. به عبارت دیگر، کارهایی مانند بازشناسی چهره و صدا و استنباط‌هایی که انجام آن برای انسان ساده است، برای رایانه دشوار، و انجام کارهایی مانند اثبات نظریات پیچیده که برای انسان‌ها دشواری دارد، برای رایانه امکان‌پذیر است.

هوش اجتماعی

تناقض موراوک می‌تواند به اشکال گوناگونی از هوش اجتماعی تعمیم پیدا کند. برای مثال، هماهنگی وسایل نقلیه خودمختار همچنان یکی از مسائل سخت هوش مصنوعی باقی‌مانده است. «محاسبات عاطفی» (Affective computing)، یک مبحث میان‌رشته‌ای است و شامل سیستم‌هایی می‌شود که اثر انسانی را تشخیص داده و یا شبیه‌سازی، پردازش و تفسیر می‌کنند. موفقیت‌های نسبی در رابطه با محاسبات عاطفی حاصل شده‌اند که از آن جمله می‌توان به تحلیل عواطف (sentiment analysis) متنی، و اخیرا، تحلیل اثر چند مدله اشاره کرد که در آن هوش مصنوعی احساسات بروز یافته در موضوع یک نوار ویدئویی را دسته‌بندی می‌کند.

در دراز مدت، داشتن مهارت‌های اجتماعی، درک عواطف انسانی و «نظریه بازی‌ها» (game theory) برای عامل‌های اجتماعی ارزشمند است. قادر بودن به پیش‌بینی اقدامات دیگران با استفاده از وضعیت حرکات و عواطف آن‌ها یک عامل را قادر به تصمیم‌سازی بهتر می‌کند. برخی از سیستم‌های رایانه‌ای، عواطف و حالات انسانی را به‌منظور افزایش حساسیت نسبت به پویایی عواطف تعاملات انسانی یا تسهیل تعاملات انسان-رایانه تقلید می‌کنند. به‌طور مشابه، برخی از دستیارهای مجازی به‌گونه‌ای برنامه‌ریزی شده‌اند که مکالمه و حتی شوخ‌طبعی داشته باشند. در طراحی چنین عامل‌هایی این گرایش وجود دارد که برای کاربران ساده‌لوح یک تصویر غیر واقعی از عامل هوشمند ارائه کنند.

هوش عمومی

پروژه‌هایی مانند پایگاه دانش (۱۹۸۴) Cyc و پروژه ژاپنی نسل پنجم سیستم‌های رایانه‌ای (۱۹۸۲-۱۹۹۲)، تلاش‌های گسترده‌ای را جهت وسعت بخشیدن به شناخت انسانی فراهم کردند. این پروژه‌های اولیه، در فرار از محدودیت‌های مدل‌های منطقی نمادین غیر کمّی شکست خوردند، و می‌توان گفت با نگاهی به گذشته تخمین خوبی از سختی‌های راه هوش مصنوعی ارائه کردند.

امروزه، گستره وسیعی از پژوهش‌های هوش مصنوعی به‌جای کاربردهای غیر قابل اجتناب و ضعیف (مانند تشخیص خطای پزشکی یا ناوبری خودرو) در حال انجام است. بسیاری از پژوهشگران پیش‌بینی می‌کنند که هوش مصنوعی ضعیف در دامنه‌های مجزای متفاوت سرانجام در یک ماشین دارای هوش مصنوعی عمومی (AGI) گنجانده شود و با ترکیب بیشتر مهارت‌های ضعیف در برخی موارد بتواند حتی از مهارت‌های انسانی نیز پیشی بگیرد. بسیاری از کاربردهای پیشرفته هوش مصنوعی نیز دارای اهمیت متقابل دامنه‌ای هستند.

یک مثال سطح بالا از این امر، گوگل دیپ مایند است که در سال ۲۰۱۰ یک «هوش مصنوعی عمومی» را توسعه داد که می‌توانست از بازی‌های آتاری گوناگون یاد بگیرد. پس از این پروژه، دیپ مایند، سیستم‌های متنوعی  را تولید کرد که در یادگیری ترتیبی موفق عمل می‌کردند. علاوه بر «یادگیری انتقالی» (transfer learning)، پیشرفت فرضیه‌های هوش مصنوعی عمومی می‌تواند شامل توسعه معماری انعکاسی شود که توانایی مشارکت در نظریه تصمیم‌گیری فرا استدلالی را فراهم می‌کند و کشف کند که چگونه می‌توان یک پایگاه دانش جامع را از کل وب ساختار نیافته ایجاد کرد.

همواره بحث‌هایی در رابطه با اینکه برخی از «الگوریتم‌های اصلی» به لحاظ مفهومی ساده (در حال حاضر کشف نشده‌اند) اما دارای ریاضیات پیچیده، می‌توانند منجر به هوش مصنوعی عمومی بشوند جریان داشته است. سرانجام، برخی از رویکردهای ناپایدار، به‌دنبال شبیه‌سازی هوش انسانی هستند و باور دارند که ویژگی‌های انسان‌انگاری مانند مغز مصنوعی یا پرورش کودک شبیه‌سازی شده ممکن است روزی به نقطه بحرانی برسند که هوش عمومی در آن ظهور می‌کند.

این در حالیست که ماشین حتی برای حل مسائل ساده‌تری مانند ترجمه نیز نیازمند خواندن و نوشتن به کمک پردازش زبان طبیعی، دنبال کردن موضوع سخنرانی (استدلال)، دانستن آنکه درباره چه چیزی صحبت می‌شود (دانش) و بازتولید منظور اصلی نویسنده (هوش اجتماعی) است. مسائلی مانند ترجمه ماشینی «هوش مصنوعی کامل» (AI-complete) محسوب می‌شوند، زیرا همه این مسائل نیازمند حل هم‌زمان جهت رسیدن به کارایی در سطح انسان هستند.

قسمت سوم این مطلب (هوش مصنوعی ــ قسمت سوم: رویکردها) را مطالعه کنید.

اگر نوشته بالا برای شما مفید بوده است، مطالعه مطالب زیر نیز به شما پیشنهاد می‌شود:

بر اساس رای ۷ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
wikipedia
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *