هوش مصنوعی مولد چیست؟ – به زبان ساده
به طور خلاصه، «هوش مصنوعی مولد» (Generative Artificial Intelligence) به مدلهای یادگیری عمیقی گفته میشود که میتوانند متن، تصاویر و سایر محتوای با کیفیت را بر اساس دادههای آموزشی تولید کنند. هوش مصنوعی مولد را «Generative AI» هم خطاب میکنند. در ادامه این مطلب از مجله فرادرس دقیقتر به این پرسش پاسخ داده شده است که هوش مصنوعی مولد چیست و به موضوعهای کلیدی حول این مفهوم پرداختهایم.
مقدمه
حیطه هوش مصنوعی چرخههای هیاهوی بسیاری را تجربه کرده، اما حتی از دیدگاه بدبینان و شکاکان نیز انتشار ChatGPT نقطه عطفی را در این حوزه تثبیت کرده است. چَتبات هوش مصنوعی شرکت OpenAI با قدرت گرفتن از آخرین مدل زبانی گسترده خود میتواند شعر بسراید، لطیفه تعریف کند و تولید سریع مقالههایی را انجام دهد که گویی انسان آنها را ساخته است. تنها در چند کلمه از ChatGPT درخواست خود را مطرح میکنیم و خروجی دریافتی، مثلاً شعرهای عاشقانه با قالب پلتفرمهای نقد و بررسی Yelp یا متنِ ترانه به سبکِ «Nick Cave» خواهد بود.
آخرین باری که هوش مصنوعی مولد یا همان Generative AI به این اندازه مطرح شد و درخشید، مربوط میشود به تحولی که در بینایی ماشین اتفاق افتاد. تصاویر سلفی به پرترههایی به سبک رنسانس تبدیل میشدند و تصاویر صورتهای دارای کهولت سنِ پیش از موعد، صفحات شبکههای اجتماعی را پر کرده بودند. ۵ سال پس از آن، نوبت به پیشرفت بزرگ در «پردازش زبان طبیعی» (NLP) فرا میرسد و قابلیت مدلهای زبانی در سخن گفتن پیرامون هر موضوعی موجب جلب توجه ویژه عموم شده است.
البته توانایی مدلهای زبانی تنها به زبان ختم نمیشود. مدلهای مولد همچنین قابلیت یادگیری قواعد نحوی کدهای نرمافزاری، مولکولها، تصاویر طبیعی و طیفی از سایر انواع داده را نیز دارند. کاربردها و استفاده از این فناوری هر روز در حال رشد است و تنها در ابتدای راه واکاوی پتانسیلهای آن هستیم.
هوش مصنوعی مولد چیست ؟
هوش مصنوعی مولد یعنی الگوریتمهایی (مثل ChatGPT) که میتوان از آنها برای خلق محتوای جدید، مثل محتوای صوتی، کدهای برنامه نویسی، تصاویر، متن، شبیهسازیها و ویدیوها استفاده کرد. تحولات اخیر در این حوزه دارای این پتانسیل است که به طور قابل توجهی رویکرد انسان را نسبت به تولید محتوا تغییر دهد.
به بیان دقیقتر، هوش مصنوعی مولد به مدلهای یادگیری عمیقی گفته میشود که میتوانند محتوای با کیفیتی را بر اساس دادههای آموزشی مورد استفاده، تولید کنند. به بیان ساده، مدل مولد میتواند آنچه را که از نمونههای دریافتی فرا گرفته است، به کار گیرد و بر اساس آن اطلاعات، محتوایی کاملاً جدید را خلق کند. به همین دلیل است که نام «مولد» به معنی «تولید کننده» برای آن انتخاب شده است.
هوش مصنوعی مولد چگونه کار می کند؟
هوش مصنوعی مولد کارش را با دریافت «طرح دستور» (Prompt) آغاز میکند که این پرامپت میتواند در غالب متن، تصویر، ویدیو، طراحی، نُتهای موسیقی یا هر ورودی دیگری باشد که سیستم هوش مصنوعی میتواند پردازش کند. سپس الگوریتمهای مختلف هوش مصنوعی در پاسخ به طرح دستور یا همان پرامپت دریافتی، محتوای جدیدی را خروجی میدهند.
محتوای خروجی میتواند نوشته، راه حل مشکل یا محتوای جعلی باشد که از تصویر یا صدای یک شخص تولید شده است. در خصوص بحث طراحی «پرامپت»، اکنون مهارت جدیدی به نام «پرامپت نویسی» یا «مهندسی پرامپت» (Prompt Engineering) مطرح شده است که اهمیت زیادی دارد و به نظر میرسد رفته رفته لازم خواهد بود همه افراد این مهارت مهم را بدست آورند.
در نسخههای اولیه هوش مصنوعی مولد نیاز بود دادهها حتماً از طریق API یا سایر فرایندهای پیچیده به مدل ارائه شوند. توسعهدهندهها ناچار بودند با ابزارهای اختصاصی آشنا شوند و با استفاده از زبانهایی مثل پایتون، اپلیکیشنهایی را برای این منظور بنویسند.
اکنون پیشگامان حوزه هوش مصنوعی مولد در حال توسعه تجربه کاربری بهتر هستند و امکان شرح درخواست به زبان محاوره روزمره هر روز بیشتر فراهم میشود. پس از دریافت پاسخ اولیه، میتوان، نتایج را به وسیله ارائه بازخورد پیرامون شیوه، لحن و سایر عناصری سفارشیسازی کرد که انتظار بازتاب آنها را از هوش مصنوعی مولد را داریم.
مدل هوش مصنوعی مولد چیست ؟
مدلهای هوش مصنوعی مولد الگوریتمهای هوش مصنوعی مختلفی را با هم ترکیب میکنند تا محتوا ارائه دهند و پردازش محتوا کنند. برای مثال، به منظور تولید متن، روشهای مختلف پردازش زبان طبیعی کاراکترهای خام (مثل حروف، نقطهها و سایر علامتهایی مثل ویرگول و کلمهها) را به جملهها، اجزای جمله، موجودیتها و عملیات تبدیل میکند.
این موارد با استفاده از چندین روش مختلفِ کُدگذاری به صورت بردارهایی بازنمایی میشوند. به طور مشابه، تصاویر را نیز میتوان با استفاده از مدلهای هوش مصنوعی مولد به عنصرهای بصری گوناگون و مختلفی تبدیل کرد که آنها هم به صورت بردارهایی ابراز میشوند.
باید هشدار داد که در این روشها، ممکن است جانبداری، نژادپرستی، فریبکاری و تبلیغات پر سر و صدا هم به عنوان دادههای ورودی به طور غیر عمد مورد استفاده قرار بگیرند و نتایجی دارای اشکال حاصل شود. اما ارائه دهندگان هوش مولد و توسعهدهندگان مدلهای آن، همواره در حال کار روی این مدلها هستند تا چالشهای این چنینی برطرف و مسائل اخلاقی و قانونی در این خصوص رعایت شوند.
کاربردهای هوش مصنوعی مولد چیست ؟
هوش مصنوعی مولد را میتوان در موارد استفاده مختلفی به کار گرفت تا بتوان به طور مجازی، هر نوع محتوایی را تولید کرد. به لطف تحولات ساختارشکنانهای مثل GPT که میتواند برای کاربردهای مختلفی تنظیم شود، دسترسی به این فناوری روز به روز برای انواع مختلف کاربران آسانتر شده است.
در ادامه برخی از کاربردهای رایج هوش مصنوعی مولد فهرست شدهاند.
- پیادهسازی چتبات (رباتهای گفتگو) برای خدمات مشتریان و پشتیبانی فنی
- استقرار مدلهای «جعل عمیق» (Deep Fake) برای تقلید از افراد و حتی تقلید از برخی افراد خاص
- بهبود و پیشرفت صنعت دوبله در سینما، تلویزیون و محتوای آموزشی به زبانهای مختلف
- پاسخ به ایمیلها، ساخت پروفایل برای دوستیابی، نوشتن رزومه و مقالههای پژوهشی
- ایجاد آثار هنری واقعگرایانه با سبک و استایلی خاص
- بهبود ویدیوهای نمایش محصولات
- پیشنهاد ترکیبهای دارویی جدید برای آزمایش
- طراحی محصولات و ساختمانهای فیزیکی
- بهینهسازی طراحی چیپهای جدید
- آهنگسازی به شیوه و لحنی خاص
مزایای هوش مصنوعی مولد کدامند؟
هوش مصنوعی مولد را میتوان در بسیاری از حوزههای مختلف کسب و کار مورد استفاده قرار داد. با استفاده از هوش مصنوعی مولد میتوان تفسیر و درک محتوای فعلی را آسانتر کرد و به طور خودکار محتوای جدید ساخت. توسعهدهندگان و برنامهنویسان در حال جست و جو برای راهکارهایی هستند تا بتوانند با استفاده از هوش مصنوعی جریانهای کاری فعلی را بهبود دهند و نگاهی هم به سازگارسازی کامل جریانهای کاری دارند تا بتوانند از این فناوری نوظهور بهره لازم را ببرند.
برخی از مزایای بالقوه پیادهسازی هوش مصنوعی مولد در ادامه فهرست شدهاند.
- خودکارسازی روند دستی تولید محتوا
- صرفهجویی در وقت و انرژی برای پاسخ دادن به ایمیلها
- بهبود پاسخ به برخی از پُرسمانهای فنی
- ایجاد بازنمودهای واقعگرایانه از افراد
- جمعبندی اطلاعات پیچیده و تبدیل آنها به روایتی معقول و منسجم
- سادهسازی فرایند تولید محتوا به شیوهای خاص
- فراهم شدن امکان تولید تصاویر منحصر به فرد و اجتناب از به کار بردن تصاویر تکراری در محتوا
هوش مصنوعی مولد چه محدودیت هایی دارد؟
پیادهسازیهای اولیه هوش مصنوعی مولد به وضوح محدودیتهای مختلف آن را مشخص میکند. برخی از چالشهایی که در هوش مصنوعی مولد وجود دارند، از رویکردهای خاصی حاصل میشوند که برای پیادهسازی کاربردهای مخصوص مورد استفاده قرار میگیرند.
برای مثال، خواندن خلاصه و چکیدهای از یک موضوع پیچیده نسبت به مطالعه توضیحاتی بسیار آسانتر خواهد بود که در آن از منابع گوناگون برای بیان نکات کلیدی استفاده شده است . اگرچه، خوانا بودن خلاصه و چکیده مربوطه، هزینهای را هم به دنبال دارد و آن هزینه این است که خواننده از منابع مورد استفاده اطلاع نخواهد داشت. در ادامه برخی از محدودیتهایی فهرست شدهاند که در زمان پیادهسازی و استفاده از اپلیکیشنهای هوش مصنوعی مولد با آنها مواجه خواهیم شد.
- مدلهای هوش مولد همیشه منبع محتوا را مشخص نمیکنند.
- ارزیابی میزان سوگیری منابع اصلی میتواند چالشبرانگیز باشد.
- محتوایی که واقعگرایانه به نظر میرسد، شناسایی اطلاعات نادقیق را دشوارتر میکند.
- درک نحوه سازگارسازی با شرایط جدید میتواند دشوار باشد.
- در نتایج ارائه شده ممکن است جهتگیری، تبعیض و تنفر آشکار شود.
چه نگرانی هایی پیرامون هوش مصنوعی مولد وجود دارد؟
به طور قطع، ظهور هوش مصنوعی مولد نگرانیهای مختلفی را هم به وجود آورده است. این نگرانیها به کیفیت نتایج و پتانسیل سوءاستفاده و همچنین پتانسیل مختل کردن مدلهای فعلی کسب و کار مربوط میشوند.
در ادامه برخی از انواع مشخص مسائل مشکلساز موجود با شرایط فعلی هوش مصنوعی مولد در زمان تدوین این نوشته فهرست شدهاند.
- هوش مصنوعی مولد ممکن است اطلاعات نادقیق و گمراه کننده ارائه دهد.
- بدون دانستن منبع و سرچشمه اطلاعات، اطمینان کردن دشوارتر است.
- استفاده از هوش مصنوعی مولد ممکن است منجر به بروز انواع جدیدی از سرقت ادبی شود و حقوق تولیدکنندگان محتوا و هنرمندان نادیده گرفته شود.
- ممکن است هوش مصنوعی مولد، مدلهای فعلی کسب و کاری که پیرامون بهینهسازی موتور جست و جو و تبلیغات ساخته شدهاند را مختل سازد.
- تولید اخبار جعلی احتمالاً با استفاده از هوش مصنوعی مولد آسانتر خواهد شد.
- احتمال دارد در آینده این ادعا مطرح شود که شواهد تصویری واقعی از یک عمل خلاف چیزی بیشتر از تصاویر جعلی تولید شده با هوش مصنوعی نبوده است.
- ممکن است امکان جعل افراد برای حملات سایبری مبتنی بر مهندسی اجتماعی با استفاده از هوش مصنوعی مولد آسانتر شود.
معرفی نمونه هایی از ابزارهای هوش مصنوعی مولد
ابزارهای هوش مصنوعی مولد برای وَجهیَتهای گوناگونی مثل متن، تصویر، موسیقی، کد و صوت وجود دارند.
برخی از تولید کنندههای محبوب محتوای هوش مصنوعی در ادامه فهرست شدهاند.
- ابزارهای تولید متن شامل AI-Writer ،Jasper ،GPT و Lex میشوند.
- ابزارهای تولید تصویر شامل Midjourney ،Dall-E 2 و Stable Diffusion است.
- از ابزارهای هوش مصنوعی تولید کننده موسیقی میتوان به Dadabots ،Amper و MuseNet اشاره کرد.
- از جمله ابزارهای AI برای تولید کدهای برنامه نویسی میتوان به GitHub Copilot ،Codex ،CodeStarter و Tabnine اشاره کرد.
- ابزارهای ترکیب صوت شامل Listnr ،Descript و Podcast.ai میشوند.
- از شرکتهای تولید کننده ابزار برای طراحی چیپهای هوش مصنوعی میتوان Cadence ،Synopsys، گوگل و Nvidia را نام برد.
کاربردهای Generative AI در حوزه های تخصصی مختلف
برخی از افراد، فناوریهای جدید هوش مصنوعی مولد را با نیروی بخار، الکتریسیته و محاسبات مقایسه میکنند، زیرا آنها میتوانند تاثیر بسزایی را در صنایع و کاربردهای گوناگون داشته باشند. ضرورت دارد این مسئله در نظر گرفته شود که مشابه فناوریهای همه منظوره قبلی، به جای اینکه فقط بخشهایی از جریان کارهای موجود سرعت بخشیده شوند، اغلب دههها برای افراد زمان میبرد تا به بهترین راه برای سازماندهی جریانهای کاری به منظور بهرهمندی از رویکرد جدید دست یابند.
در ادامه برخی از راههایی فهرست شده است که هوش مصنوعی مولد میتواند حوزههای تخصصی و صنایع مختلف را تحت تاثیر قرار دهد.
- در حوزه مالی میتوان تراکنشها را در قالب سابقه فردی مشاهده کرد تا امکان ساخت سامانههای قویتر تشخیص ناهنجاری (کلاهبرداری) فراهم شود.
- شرکتهای حقوقی میتوانند هوش مصنوعی مولد را برای طراحی و تفسیر قراردادها، تجزیه و تحلیل شواهد و ارائه استدلال به کار گیرند.
- شرکتهای تولیدی میتوانند از هوش مصنوعی برای تلفیق دقیقتر و اقتصادیتر دادههای دریافتی از دوربینها، تصاویر X-ray و سایر سنجهها به منظور شناسایی بخشهای دارای عیب و دلایل ریشهای استفاده کنند.
- شرکتهای رسانهای و فیلمسازی نیز میتوانند هوش مصنوعی مولد را برای تولید اقتصادیتر محتوا و ترجمه (دوبله) آن به زبانهای دیگر با صدای اصلی بازیگران به خدمت بگیرند.
- در صنعت دارو نیز میتوان از هوش مصنوعی مولد برای شناسایی بهینهتر داروهای امیدبخش استفاده کرد.
- شرکتهای معماری میتوانند از هوش مصنوعی مولد برای طراحی و تطبیق سریعتر نمونههای اولیه کمک بگیرند.
- شرکتهای تولید بازیهای کامپیوتری هم میتوانند از هوش مصنوعی مولد برای طراحی محتوای بازی و مراحل آن استفاده کنند.
اصول اخلاقی و انحراف در هوش مصنوعی مولد
برخلاف وعدهها، ابزارهای جدید هوش مصنوعی مولد، در خصوص دقت، قابلیت اعتماد و اطمینان، جانبداری، توهم و سرقت ادبی، چالشها و سختیهای بسیاری را پدید آوردهاند، مسائلی اخلاقی که رفع آنها سالها زمان خواهد برد. هیچ یک از این مسائل به طور خاص برای هوش مصنوعی جدید نیستند. برای مثال، اولین حضور شرکت مایکروسافت در حوزه چتباتها در سال ۲۰۱۶ اتفاق افتاد و چتبات Tay معرفی شده، اما پس از مدت کوتاهی ناچار شدند آن را از دسترس خارج کنند، چون در توییتر شروع به اشاعه لفاظیهای تنشآفرین کرده بود.
آنچه جدیداً اتفاق افتاده، این است که آخرین محصولات مبتنی بر هوش مصنوعی مولد، به لحاظ سطحی معقولتر و منسجمتر به نظر میرسند. اما این ترکیب زبان انسانگونه و یکپارچگی با هوش انسانی برابری نمیکند و در حال حاضر بحثهای زیادی راجع به این مسئله در گرفته است که آیا مدلهای هوش مصنوعی مولد میتوانند به گونهای آموزش داده شوند که قدرت استدلال داشته باشند. حتی یک مهندس گوگل بعد از اینکه به صورت عمومی اعلام کرد که هوش مصنوعی مولد این شرکت، یعنی «مدلهای زبانی برای کاربردهای گفت و گو» (LaMDA) دارای احساس است، از این شرکت اخراج شد.
واقعگرایانه و متقاعد کننده بودن محتوای تولید شده با هوش مصنوعی مولد مجموعه جدیدی از خطرات در حوزه AI را مطرح میکند. شناسایی محتوای تولید شده با هوش مصنوعی سختتر میشود و مهمتر از آن، دشوارتر شدن شناسایی اشتباه بودن موارد تولید شده است. این معضل میتواند زمانی بیشتر مشکلساز شود که بر نتایج ارائه شده به وسیله هوش مصنوعی مولد برای کد نویسی یا فراهم کردن توصیههای پزشکی تکیه داشته باشیم.
بسیاری از نتایج هوش مصنوعی شفاف نیستند، بنابراین تشخیص این مسئله دشوار است که آیا مدلهای مولد برای مثال قوانین حق نشر را نقض کردهاند یا اینکه مشکلی با منابع اصلی مورد استفاده برای تولید نتایج وجود داشته است. اگر ندانیم که هوش مصنوعی چگونه به چنین نتیجه و خروجی رسیده است، آنگاه نمیتوان در خصوص دلیل اشتباه کردنش هم استدلال کرد.
تفاوت هوش مصنوعی با هوش مصنوعی مولد چیست ؟
هوش مصنوعی مولد تولید محتوای جدید، پاسخ به چتها، طراحی کردن، ساخت تصنعی یا جعل عمیق را انجام میدهد. از سوی دیگر، هوش مصنوعی کلاسیک اما روی شناسایی الگو، تصمیمگیری، تقویت تجزیه و تحلیل، طبقهبندی دادهها و شناسایی ناهنجاری و کلاهبرداری تمرکز دارد.
همانطور که بیان شد، هوش مصنوعی مولد، اغلب از روشهای شبکه عصبی عمیق مثل ترانسفورمرها، شبکههای GAN و VAEها استفاده میکند، اما در طرف دیگر، سایر انواع هوش مصنوعی برای تشخیص، از روشهایی شامل «شبکههای عصبی پیچشی» (کانولوشن | Convolutional)، «شبکههای عصبی بازگشتی» (Recurrent) و «یادگیری تقویتی» (Reinforcement Learning) استفاده میکنند.
هوش مصنوعی مولد اغلب با یک «پرامت» (طرح دستور) آغاز میشود که به کاربر یا منبع داده اجازه میدهد پرسمان یا مجموعه داده اولیه را ثبت و وارد کنند تا به این وسیله هدایت تولید محتوا انجام شود. این میتواند پروسهای تکرارشونده برای کند و کاو در گونههای محتوایی مختلف باشد. اما الگوریتمهای سُنتی هوش مصنوعی دادههای جدیدی را پردازش میکنند تا تنها نتیجههای سادهای را بازگردانند.
بهترین روش ها برای استفاده از هوش مصنوعی مولد
بهترین شیوهها برای استفاده از هوش مصنوعی مولد بسته به وَجهیَتها، جریان کاری و اهداف مورد نظر متفاوت است. به این ترتیب، در نظر گرفتن عوامل ضروری نظیر دقت، شفافیت و سهولت استفاده در کار با هوش مصنوعی مولد ضرورت دارد.
روشهای زیر به رسیدن به فاکتورهای بیان شده کمک میکنند.
- بهتر است به طور واضح تمام محتوای هوش مصنوعی مولد برای کاربران و مصرف کنندگان برچسبگذاری شود.
- میزان دقت محتوای تولید شده با استفاده از منابع اصلی در صورت لزوم بررسی شود.
- باید در نظر بگیریم که چگونه ممکن است جانبداری در نتایج تولید شده توسط هوش مصنوعی اثر بگذارد.
- باید کیفیت کدها و محتوای تولید شده به وسیله هوش مصنوعی را با ابزارهای دیگر بسنجیم.
- لازم است از نقاط قوت و محدودیتهای هر ابزار هوش مصنوعی مولد آگاه باشیم.
- باید خودمان را با حالتهای رایج شکست در نتایج آشنا سازیم تا بتوانیم آنها را دور بزنیم.
تاریخچه هوش مصنوعی مولد
چتبات الیزا که توسط «جوزف ویزنبام» (Joseph Weizenbaum) در دهه ۶۰ میلادی ساخته شد، از جمله اولین نمونههای هوش مصنوعی مولد به حساب میآید. این پیادهسازیهای اولیه از رویکردی مبتنی بر قانون استفاده میکردند که به دلیل دایره لغت محدود، کمبود زمینه و اتکای بیش از حد بر الگوها و سایر کاستیها، به راحتی معیوب میشدند.
این حوزه تحقیقاتی با وقوع پیشرفتهایی در زمینه شبکههای عصبی و یادگیری عمیق در سال ۲۰۱۰ با تجدید حیات مواجه شد. این پیشرفتها باعث شدند که در این فناوری امکان یادگیری نحوه مرور متنهای موجود، طبقهبندی عنصرهای تصویری و رونویسی از صوت فراهم شود.
«ایان گوفِلو» (Ian Goodfellow) شبکههای مولد تخاصمی GAN را در سال ۲۰۱۴ معرفی کرد. این روش یادگیری عمیق، رویکردی نوین را برای سازماندهی شبکههای عصبی رقابتی به منظور تولید و سپس رتبهبندی انواع محتوا ارائه داده است. مدلهای تولید شده به این روش میتوانستند افراد، صداها، موسیقی و متنهای واقعگرایانه تولید کنند. این مسئله به طور همزمان علاقهمندی و همچنین نگرانیهایی را در خصوص نحوه استفاده از هوش مصنوعی مولد برای تولید محتوای جعل عمیق واقعگرایانهای به وجود آورد که خود را به جای افراد مشهور جا میزدند.
از آن زمان تا کنون پیشرفت در سایر تکنیکها و معماریهای شبکه عصبی به گسترش حیطه هوش مصنوعی مولد کمک کرده است. این روشها شامل VAEها، حافظه کوتاه مدت طولانی، ترانسفورمرها، مدلهای انتشاری و «میدانهای تابشی عصبی» (Neural Radiance Fields) میشوند.
مدل های هوش مصنوعی مولد عمیق چگونه ظهور پیدا کردند؟
هوش مصنوعی مولد به مدلهای یادگیری عمیقی گفته میشود که میتوانند دادههای خام، مثل تمام دادههای ویکیپدیا یا آثار جمعآوری شده رامبرانت را بردارند و یاد بگیرند در زمان درخواست، خروجیهای محتمل آماری را تولید کنند. در سطح بالا، مدلهای مولد، بازنمودی سادهسازی شده از دادههای آموزشی خود را کدگذاری میکنند و ترسیمی را از آن انجام میدهند تا کار جدیدی را خلق کنند که مشابه و نه دقیقاً مطابق دادههای اصلی است.
نقش VAE ها در گسترش مدل های هوش مصنوعی مولد
مدلهای هوش مصنوعی مولد برای سالها است که در آمار برای تجزیه و تحلیل دادههای عددی مورد استفاده قرار میگیرند. ظهور یادگیری عمیق، این امکان را فراهم ساخت تا کاربرد مدلهای مولد به استفاده از آنها در تصاویر، سخن گفتن و سایر انواع دادههای پیچیده گسترش یابد.
در میان از جمله اولین نوع از مدلهایی که به این امر خطیر دست یافتند، میتوان به «رمزگذارهای خودکار تغییرپذیر» (Variational Autoencoder) اشاره کرد که به اختصار آنها را VAE هم خطاب میکنند و در سال ۲۰۱۳ معرفی شدند. VAEها از جمله اولین مدلهای یادگیری عمیقی بودند که برای تولید تصاویر واقعگرایانه و سخن گفتن به میزان وسیعی مورد استفاده قرار گرفتند.
VAEها آغازگر سیل عظیم مدلسازی هوش مصنوعی مولد بودند، چرا که امکان مقیاسپذیری مدلها را بسیار سادهتر کردند. در واقع این آغاز ظهور بسیاری از مدلهایی محسوب میشود که امروز به عنوان هوش مصنوعی مولد از آنها یاد میکنیم. کدگذارهای خودکار به وسیله کدگذاری دادههای بدون برچسب و تبدیل آنها به بازنمایی فشردهسازی شده کار میکنند و سپس دادهها به شکل اولیه و اصلی خود کدگشایی میشوند.
از کدگذارهای خودکار «یکنواخت» (Plain) برای مقاصد گوناگونی استفاده میشود که از جمله میتوان به بازسازی تصاویر مخدوش شده یا محو شده اشاره کرد. کدگذارهای خودکار تغییرپذیر این توانایی حیاتی و مهم را اضافه کردند که به وسیله آنها نه تنها میتوانیم دادهها را بازسازی کنیم، بلکه گونههای مختلفی را بر اساس دادههای اصلی خروجی بدهیم.
این قابلیت و توانایی تولید دادههای بدیع، باعث ایجاد پیشرفتهای سریع و ارائه فناوریهای جدیدی با سرعت زیاد از «شبکههای مولد متخاصم» (Generative Adversarial Networks) گرفته تا «مدلهای انتشاری» (Diffusion Models) شد که قابلیت تولید تصاویری بسیار واقعگرایانهتر، اما جعلی را دارا هستند. به این طریق، VAEها زیربنای لازم برای توسعه هوش مصنوعی امروزی با تواناییهای فعلی را فراهم کردهاند.
آنها از بلوکهایی از کُدگذارها و کُدگشاها ساخته شدهاند، نوعی معماری که پایه و اساس مدلهای زبانی امروزی را تشکیل میدهد. کدگذارها مجموعه دادهها را به بازنمایی متراکمی فشردهسازی میکنند و نقاط داده مشابه را در فضایی انتزاعی نزدیکتر نسبت به یکدیگر قرار میدهند. کُدگشاها از این فضا نمونهبرداری میکنند تا چیزی جدید را خلق کنند و در عین حال مهمترین ویژگیهای مجموعه داده را هم حفظ خواهند کرد.
ظهور ترانسفورمرها
«مبدلها» (Transformers) که در سال ۲۰۱۷ به وسیله گوگل در قالب مقالهای با نام «توجه، تمام آن چیزی است که نیاز دارید» در نشریهای برجسته معرفی شدند. ترانسفورمرها معماری «کدگذار کدگشا» را با ساز و کار پردازش متنی با نام «توجه» (Attention) ترکیب کردند تا نحوه آموزش مدلهای زبانی را متحول سازند. کدگذار، متنهای خام نشانهگذاری نشده را به بازنماییهایی به نام «جانماییها» (Embeddings) تبدیل میکند. سپس کدگشا این جانماییها را با هم به همراه خروجیهای پیشین مدل دریافت و به طور پیاپی هر کلمه را در جمله پیشبینی میکند.
از طریق بازیهای حدس جای خالی، کدگذار میآموزد که چگونه کلمهها و جملهها با یکدیگر مرتبط میشوند که این باعث ایجاد بازنمایی قدرتمندی از زبان میشود، بدون اینکه فردی بخواهد اجزای جمله و سایر ویژگیهای دستور زبان را برچسبگذاری کند. در واقع ترانسفورمرها را میتوان از قبل در نقطه شروع بدون هیچ هدف و وظیفه مورد نظری آموزش داد. پس از آنکه یادگیری برای این بازنماییهای قدرتمند اتفاق افتاد، مدلها را بعداً میتوان برای اجرای یک وظیفه مد نظر، با دادههای خیلی کمتری اختصاصی کرد.
نوآوریهای بسیاری این امر را امکانپذیر ساخته است. ترانسفورمرها کلمههای یک جمله را در یک لحظه به طور همزمان پردازش میکنند که این باعث میشود امکان پردازش متن به صورت موازی فراهم شود و سرعت آموزش مدل افزایش پیدا کند. روشهای پیشین مثل «شبکههای عصبی بازگشتی» (RNN) و شبکههای «حافظه کوتاه مدت طولانی» (LSTM) کلمهها را یکی یکی پردازش میکردند. همچنین ترانسفورمرها محل کلمهها در جمله و ارتباط آنها با یکدیگر را هم یاد میگیرند. بافتی که امکان درک مفهوم جمله و مشخص کردن معنی کلمههایی مثل «آن» (it) را در جملههای طولانی فراهم میکرد.
به وسیله حذف نیاز به تعریف یک هدف و وظیفه مشخص از ابتدای کار، ترانسفورمرها امر پیشآموزش مدلهای زبانی را بر اساس مقادیر گستردهای از متنهای خام تبدیل به کاری کاربردی و مفید کردند و این باعث شد اندازه آنها به میزان قابل توجهی افزایش یابد. پیش از این افراد دادهها را جمعآوری و برچسبگذاری میکردند تا یک مدل را تنها برای یک وظیفه خاص آموزش دهند. اما با پیدایش ترانسفورمرها یا همان مبدلها، امکان آموزش یک مدل بر پایه مقدار بسیار زیادی از دادهها و سپس سازگار ساختن آن با چندین وظیفه به وسیله تنظیم دقیق آن برای مقدار کوچکی از دادههای اختصاصی برچسبگذاری شده فراهم شد.
به واسطه انطباقپذیری ترانسفورمرها، آنها را با عنوان «مدلهای اساسی» (Foundation Model) میشناسند. در گذشته اگر میخواستیم یک دستهبند را بهتر کنیم، ناچار بودیم دادههای بیشتری را در ورودی به آن بدهیم. اما اکنون با استفاده از مدلهای اساسی، میتوان مقادیر زیادی از دادههای بدون برچسب را به مدل ارائه داد تا چنان بازنمایی آموزش داده شود که به طور عمومی و کلی برای بسیاری از وظایف به خوبی عمل میکند.
ترانسفورمرهای زبان امروزی، در حال حاضر، برای کاربردهای متنوعی مورد استفاده قرار میگیرند. این کاربردها شامل طبقهبندی و استخراج موجودیت در حوزههای غیرمولد و همچنین ترجمه، خلاصهسازی و پاسخگویی به سؤال در حوزههای مولد میشود. به تازگی، قدرت تولید گفتگو، مقاله و سایر محتوای متقاعد کننده توسط ترانسفورمرها جهان را مبهوت ساخته است.
انواع ترانسفورمرهای زبانی
ترانسفورمرهای زبان به ۳ دسته اصلی «مدلهای تنها کدگذار»، «مدلهای فقط کدگشا» و «مدلهای کدگذار-کدگشا» تقسیم میشوند. مدلهای تنها کدگذار مانند BERT، به موتورهای جستجو و چتباتهای خدمات مشتری، از جمله معاون سرویس دستیار واتسون شرکت IBM قدرت بخشیدهاند. مدلهای تنها کدگذار به طور گسترده برای وظیفههای غیرمولد مانند طبقهبندی بازخورد مشتری و استخراج اطلاعات از سندهای طولانی استفاده میشوند. در یک پروژه با سازمان فضایی ناسا، IBM در حال ساختن مدلی تنها-کدگذار است تا میلیونها مجله علوم زمین را برای یافتن دانش جدید استخراج کند.
مدلهای تنها-کدگشا مانند خانواده مدلهای GPT برای پیشبینی کلمه بعدی بدون نمایش کدگذاری آموزش داده میشوند. GPT-3 با ۱۷۵ میلیارد پارامتر، بزرگترین مدل زبانی از این نوع بود که در سال ۲۰۲۰ توسط OpenAI منتشر شد. مدلهای بزرگ دیگری مانند PaLM شرکت گوگل (۵۴۰ میلیارد پارامتر) و BLOOM (۱۷۶ میلیارد پارامتر) که دسترسی آزاد دارند، به عنوان نمونههایی دیگر به این عرصه پیوستهاند.
مدلهای کدگذار-کدگشا مانند مدل «Text-to-Text Transfer Transformer» (مبدل انتقال متن به متن) یا «T5» شرکت گوگل، ویژگیهایی از هر دو مدل BERT و مدلهای سبک GPT را ترکیب میکنند. آنها قادرند بسیاری از وظایف مولد را همچون مدلهای تنها-کدگشا انجام دهند، اما اندازه کوچک آنها باعث میشود عملکردشان سریعتر و ارزانتر باشد. هوش مصنوعی مولد و مدلهای زبانی بزرگ با سرعتی چشمگیر در حال پیشرفت هستند، به طوری که تقریباً هر روز مدلها، ساختارها و نوآوریهای جدیدی پدید میآیند.
عمل متقابل یادگیری نظارت شده
توانایی بهرهبرداری از دادههای بدون برچسب، یک نوآوری کلیدی بود که قدرت هوش مصنوعی مولد را به رخ کشید. اما نظارت انسانی اخیراً دوباره بازگشته و در حال کمک به پیشرفت مدلهای زبانی گسترده است. توسعهدهندگان هوش مصنوعی به طور فزاینده از یادگیری نظارت شده برای شکلدهی به تعاملهای انسان با مدلهای مولد و بازنماییهای تعبیه شده قدرتمند آنها استفاده میکنند.
نظارت انسانی با تنظیم دستور در مدل های هوش مصنوعی مولد
تنظیم دستور، که با سری مدلهای FLAN شرکت گوگل معرفی شده، به مدلهای مولد امکان داده است تا از وظایف ساده فراتر بروند و به صورت تعاملی و با کلیت بیشتری کمک کند. ارائه دستوراتی به مدل، همراه با پاسخهایی در زمینههای موضوعی بسیار متنوع، میتواند آن را برای تولید نه فقط متنی محتمل به لحاظ آماری، بلکه تولید پاسخهایی انسانگونه به سوالاتی مثل «پایتخت فرانسه چیست» یا درخواستهایی مانند «فهرست اعداد داده شده را مرتب کن» آماده کند.
یادگیری بی نمونه چیست ؟
به وسیله مهندسی دقیقِ مجموعهای از درخواستها، یعنی همان ورودیهای اولیه تغذیه شده به یک مدل پایه، مدل میتواند برای انجام گستره وسیعی از وظایف سفارشیسازی شود. در برخی موارد، در کل هیچ داده برچسبگذاری شدهای مورد نیاز نخواهد بود. به سادگی از مدل میخواهیم تا وظیفهای را انجام دهد، از جمله، مواردی که به صورت صریح به مدل آموزش داده نشدهاند.
این رویکرد کاملاً بدون داده، با نیاز به هیچ نمونهای، با عنوان «یادگیری بینمونه» (Zero-Shot Learning) شناخته میشود. برای آنکه احتمال تولید آنچه به دنبالش هستیم افزایش پیدا کند، همچنین میتوان یک یا چند نمونه را در «یادگیری یک یا چند نمونه» ارائه کرد.
روش یادگیری بینمونه یا کمنمونه میتواند به میزان قابل توجهی زمان مورد نیاز برای ساخت یک محصول هوش مصنوعی را کاهش دهد. دلیلش این است که با استفاده از این شیوه به کمترین میزان جمعآوری داده برای رسیدن به نتیجه نیاز خواهیم داشت.
اما با وجود قدرت و توان زیاد یادگیری بینمونه، این نوع روشها محدودیتهایی هم دارند. اول اینکه بسیاری از مدلهای مولد نسبت به نحوه قالببندی دستورات حساسیت زیادی دارند که این مسئله باعث ایجاد رشته جدیدی در هوش مصنوعی به نام «مهندسی طرح دستور» (Prompt Engineering) نیز شده است.
تاثیر پرامپت نویسی در هوش مصنوعی مولد
با ارائه یک طرح دستور یا همان پرامپت خوب و مطلوب، نتایج مناسب و مورد انتظار با یک یا ۲ بار امتحان کردن تحویل داده خواهد شد. اما این مسئله اغلب تنها به موارد ریزی مثل قرار دادن نقطه ویرگول یا سطر جدید در محل مناسب برمیگردد. اگرچه مهندسی طرح دستورموثر است، اما میتواند بسیار پیچیده هم باشد. طرح دستوری که روی یک مدل به خوبی کار میکند، ممکن است در مدلهای دیگر نتیجه مطلوبی را تولید نکند.
یکی دیگر از محدودیتهای طرح دستور بینمونه یا کمنمونه برای سازمانها این است که به کار گیری دادههای اختصاصی، اغلب امتیازی کلیدی و حیاتی به حساب میآید. اگر مدل هوش مصنوعی مولد بزرگ باشد، تنظیم دقت آن برای دادههای سازمانی میتواند به طور بازدارندهای پر هزینه باشد. روشهایی مثل «تنظیم طرح دستور» (Prompt Tuning) و تطبیق دهندهها به عنوان راهکارهای جایگزین پدید آمدهاند. این روشهای جدید این امکان را به وجود میآورند تا بتوان مدل را بدون نیاز به تنظیم میلیونها یا میلیاردها پارامترش تطبیق داد.
این مدلها به وسیله خلاصه کردن دادههای کاربر و کاهش وظیفه مورد نظر به تعداد کمی پارامتر کار میکنند. سپس این پارامترها در داخل مدلی بزرگ و فریز شده درج میشوند. در این موقعیت، این پارامترها رفتار مدل را تنظیم میکنند، بدون آنکه به صورت مستقیم آن را تغییر دهند.
روشهای تنظیم بهینه پارامتر به کاربران این امکان را میدهند تا بتوانند به اصطلاح با یک تیر ۲ نشان را مورد اصابت قرار دهند. میتوان با دادههای اختصاصی خودمان، از قدرت مدل گسترده از پیش آموزش دیده بهرهمند شد. مهندسی پرامپت و تنظیم بهینه پارامترها به همراه یکدیگر مجموعه قدرتمندی از ابزارها را فراهم میکنند تا بتوان مدل را بدون صرف هزینه و زمان روی راهکارهای سنتی یادگیری عمیق به انجام آنچه وادار کرد که مورد انتظار ما است.
اخیراً نظارت انسانی به وسیله تطابق رفتار مدلها با رفتار ما در حال شکلدهی به مدلهای مولد است. منظور از تطبیق ایده، قابلیت شکلدهی پاسخهای مدلهای مولد به گونهای است که آنها با آنچه میخواهیم ببینیم تطابق بیشتری داشته باشند. «یادگیری تقویتی از بازخوردهای انسانی» (RLHF) روشی تطبیقی است که توسط شرکت OpenAI به محبوبیت رسید و همین قابلیت است که توانایی شگفتانگیز مکالمه شبیه به انسان را برای ChatGPT امکانپذیر میکند.
در RLHF مدل هوش مصنوعی مولد مجموعهای از گزینههای دوتایی دستور و پاسخ را خروجی میدهد و انسانها بر اساس میزان درستی، به هر کدام رای میدهند. به وسیله یادگیری تقویتی، مدل به گونهای تنظیم میشود که پاسخهای بیشتری را مشابه موارد با رای بالا تولید کند. این روش آموزش دادن، باعث ایجاد سیستم هوش مصنوعی میشود که خروجی آن مورد قبول انسان خواهد بود و انسانها چنین خروجی را به عنوان متن گفت و گوی با کیفیت میپذیرند.
هوش مصنوعی مولد به کدام سو می رود؟
تا همین اواخر، روند غالب در هوش مصنوعی مولد، بحث مقیاس بوده است، با آموزش داده شدن مدلهای بزرگتر روی مجموعه دادههای همواره در حال رشد، نتایج بهتر و بهتری حاصل میشود. با توجه به اینکه مدلهای قبلی، برخلاف بزرگتر بودن در اندازه یا آموزش بر روی دادههای بیشتر، چه میزان موفقیت داشتهاند، اکنون نمیتوان تخمین زد که یک مدل جدید و بزرگتر چقدر قدرتمند خواهد بود.
قوانین مقیاسبندی به محققان هوش مصنوعی اجازه میدهد تا در خصوص میزان بزرگی مدل پیش از سرمایهگذاری در منابع عظیم محاسباتی مورد نیاز برای آموزش دادن آن، بتوانند به طور مستدل گمانهزنی کنند. از جنبه معکوس، همچنان علاقه ادامهداری در خصوص قابلیتهای نوظهوری وجود دارد که در زمان رسیدن مدل به اندازهای مشخص پدید میآیند.
این فقط معماری مدل نیست که باعث ظهور این قابلیتها و تواناییها میشود، بلکه مقیاس آن است. از جمله مثالها در این خصوص میتوان به بارقههایی از استدلال منطقی و توانایی پیروی از دستورات اشاره کرد. برخی از آزمایشگاهها به آموزش دادن مدلهایی بزرگتر از این هم ادامه میدهند و به دنبال چنین قابلیتهای نوظهور هستند.
با این حال، شواهد اخیر نشان میدهند که روند تمایل به سمت توسعه مدلهای بزرگتر در حال تغییر است. بسیاری از گروههای تحقیقاتی نشان دادهاند که مدلهای کوچکتری که روی دادههای اختصاصیتر آموزش داده میشوند، اغلب میتوانند نسبت به مدلهای بزرگتر و همهمنظوره بهتر عمل کنند.
برای مثال، محققان در دانشگاه استنفورد مدلی نسبتاً کوچک به نام «PubMedGPT 2.75B» را براساس انتزاعهای زیستپزشکی آموزش و تمرین دادند و متوجه شدند که این مدل میتواند نسبت به یک مدل کلیگرا با همان اندازه، عملکرد بسیار بهتری داشته باشد. این تحقیقات نشان میدهد مدلهای کوچکتر مخصوص دامنهای خاص وقتی عملکرد خاص دامنه اهمیت داشته باشد، به احتمال زیاد انتخاب درستی به حساب میآیند.
با ظهور حوزه در حال رشد «عصارهگیری مدل» (Model Distillation) پاسخ این سوال که آیا مدلهای هوش مصنوعی مولد نسبتاً به زمان حال بزرگتر خواهند شد یا کوچکتر، حتی بیشتر هم در هالهای از ابهام قرار میگیرند. گروهی از استنفورد اخیراً سعی کردهاند قابلیتهای مدل زبانی گسترده شرکت OpenAI یعنی GPT 3.5 را در چتبات خود به نام Alpaca عصارهگیری کنند که بر پایه مدل بسیار کوچکتری ساخته شده است.
محققان از GPT-3.5 خواستند هزاران دستورالعمل و پاسخ آنها را تولید کند و از طریق «تنظیم و بهبود دستورالعمل» (Instruction Tuning) این دادههای تولید شده به وسیله هوش مصنوعی GPT را برای القا کردن مهارتهای مکالماتی مشابه GPT به آلپاکا به کار گرفتند. از آن زمان، دستهای زا مدلهای مشابه با نامهایی از جمله Vicuna و Dolly در اینترنت ظهور پیدا کردهاند.
رویکرد به کار رفته در Alpaca، اینکه آیا مدلهای بزرگ و گسترده برای قابلیتهای نوظهور ضروری هستند را زیر سوال میبرد. در برخی از مدلها مثل Dally 2 حتی مرحله خالصسازی هم انجام نمیشود و به جای آن از روش جمعآوری دادههای دستور و پاسخ مستقیم از انسان استفاده میکنند. با کنار هم قرار دادن همه وقایع اخیر، اینطور به نظر میرسد که در حال ورود به دورانی هستیم که مدلهای جمع و جورتر برای طیف وسیعی از موارد استفاده کاربردی مناسبتر خواهند بود.
آینده هوش مصنوعی مولد چگونه خواهد بود؟
عمق و سادگی خارقالعاده ChatGPT نوید بخش به کار گیری گسترده هوش مصنوعی مولد است. برای کسب اطمینان از این مسئله، همچنین ChatGPT برخی از دشواریهای پیشِ رو در عرضه ایمن و مسئولانه این فناوری را نشان داده است. اما این مشکلات اولیه در پیادهسازی الهامبخش تحقیقات بودهاند و باعث شدهاند ابزارهای بهتری برای شناسایی متنها، تصاویر و ویدیوهای تولید شده توسط هوش مصنوعی ایجاد شوند. صنعت و جامعه همچنین ابزارهای بهتری را برای ردیابی منشاء اطلاعات خواهند ساخت تا بتوان هوش مصنوعیهای قابل اعتمادتری را خلق کرد.
علاوه بر این، پیشرفتها در پلتفرمهای توسعه هوش مصنوعی به افزایش سرعت تحقیقات و توسعه قابلیتهای هوش مصنوعی مولد برای متن، تصاویر، ویدیو، محتوای ۳ بُعدی، دارو، زنجیره تامین، تدارکات و فرایندهای کسب و کار در آینده دامن خواهد زد. به همان اندازه که ابزارهای جدید مبتنی بر Generative AI خوب و با کیفیت هستند، مهمترین تأثیر هوش مصنوعی مولد، تعبیه مستقیم قابلیتهای آن در نسخههایی از ابزارهایی است که پیش از این استفاده میکردیم.
ابزارهای بررسی گرامر بهتر و بهتر خواهند شد. ابزارهای طراحی به طور یکپارچه پیشنهادهای کاربردیتری را مستقیماً در جریانهای کاری تعبیه خواهند کرد. ابزارهای تمرینی و یادگیری قادر خواهند بود تا به صورت خودکار بهترین راهکارها را در بخشی از سازمان شناسایی کنند تا بتوانند کمک کنند سایر بخشها به طور بهینهتری آموزش داده شوند. این موارد تنها بخشی از راههایی هستند که در طی آنها هوش مصنوعی مولد نحوه کار کردن ما را متحول خواهند ساخت.
پرسش های رایج پیرامون هوش مصنوعی مولد
در ادامه این بخش، برخی از سوالات پر تکرار کاربران پیرامون هوش مصنوعی مولد مطرح و پاسخ داده شدهاند.
چه کسی هوش مصنوعی مولد را ابداع کرد؟
جوزف ویزنبام اولین هوش مصنوعی مولد را در سال ۱۹۶۰ به عنوان بخشی از چتبات الیزا ابداع کرد. ایان گودفلو در سال ۲۰۱۴ شبکههای مولد متخاصم را برای تولید تصاویری حاوی افرادی با ظاهر واقعی و با صدایی واقعگرایانه ارائه داد. تحقیقات ادامهدار در خصوص مدلهای زبانی بزرگ یا همان LLMها از سوی شرکت OpenAI و گوگل، علاقه و اشتیاق اخیر در این خصوص را شعلهور ساخت که به خلق و ارائه ابزارهایی مثل ChatGPT، گوگل بارد و Dall-E انجامید.
هوش مصنوعی مولد چطور میتواند جایگزین مشاغل افراد شود؟
هوش مصنوعی مولد این پتانسیل را دارد که جایگزین طیف گستردهای از مشاغل شود که برخی از این مشاغل در ادامه فهرست شدهاند.
- نوشتن مشخصات محصول
- ایجاد کپی بازاریابی
- تولید محتوای ساده و پایه وب
- راهاندازی فروش تعاملی
- پاسخگویی به سوالات مشتریان
- ایجاد گرافیکهای صفحات وب
برخی از شرکتها به دنبال فرصتهایی برای جایگزینی هوش مصنوعی با انسان خواهند بود، در حالی که برخی دیگر از سازمانها به دنبال افزودن و بهبود نیروی کاری فعلی خود به وسیله هوش مصنوعی هستند.
چطور می توان یک مدل هوش مصنوعی مولد ساخت؟
ساخت یک مدل هوش مصنوعی مولد به این شکل آغاز میشود که به طور بهینه بازنمودی از آنچه میخواهیم تولید کنیم کدگذاری شود. برای مثال، یک مدل هوش مصنوعی مولد برای متن ممکن است اینطور شروع شود که راهی برای بازنمایی کلمهها به عنوان بردارهایی پیدا کنیم که شباهت میان کلمههای استفاده شده در یک جمله یا آنهایی که معنای یکسانی دارند را با یکدیگر نشان میدهند. پیشرفتهای اخیر در تحقیقات مدلهای هوش مصنوعی گسترده کمک کرده است تا فرایند یکسانی برای بازنمایی الگوهای پیدا شده در تصاویر، صدا، پروتئینها، DNA، دارو و طراحی ۳ بُعدی در صنعت و حوزههای تخصصی مختلف پیادهسازی شود.
چگونه می توان یک مدل هوش مصنوعی مولد را آموزش داد؟
لازم است مدل هوش مصنوعی مولد برای کاربرد خاصی آموزش داده شود. پیشرفتهای اخیر در زمینه مدلهای زبانی گسترده نقطه آغاز ایدهآلی را به منظور سفارشیسازی کاربردها برای موارد استفاده مختلف رقم زده است. برای مثال، مدل محبوب GPT توسعه داده شده به وسیله شرکت OpenAI برای نوشتن متن، تولید کد و ایجاد تصاویری بر اساس توصیفهای نوشته شده مورد استفاده قرار گرفته است.
آموزش مدل، تنظیم پارامترهای آن برای موارد استفاده متفاوت و سپس تنظیم و بهبود نتایج بر اساس مجموعهای از دادههای آموزشی داده شده را شامل میشود. برای مثال، یک مرکز تماس میتواند چتباتی را بر اساس نوع سوالات دریافتی کارگذاران خدمات از انواع مشتریان مختلف و پاسخهایی آموزش دهد که آنها در ازای هر سوال به مشتریان ارائه میدهند. یک اپلیکیشن تولید تصاویر در تمایز با متن، ممکن است با برچسبهایی کار را شروع کند که توصیف کننده محتوا و استایل تصاویر برای آموزش مدل به منظور تولید تصاویر جدید هستند.
جمعبندی
هوش مصنوعی مولد به منظور ایجاد قابلیتهای جدید و خلق ارزش برای سازمانها پتانسیل بالایی دارد. اگرچه، میتواند خطراتی قانونی، مالی یا حیثیتی را هم به دنبال داشته باشد. بسیاری از مدلهیا مولد، شامل مدلهایی که در ChatGPT استفاده میشوند، میتوانند اطلاعاتی را خروجی بدهند که معتبر به نظر میرسند، اما حقیقت ندارند (که گاهی چنین اطلاعاتی را توهمات مینامیم) یا دارای ایراد هستند و جانبدارانه هستند.
مدلهای هوش مصنوعی مولد همچنین ممکن است به طور غیر عمد اطلاعاتی را به عنوان دادههای آموزشی دریافت کنند که شخصی یا دارای حق نشر هستند و بعدها همان اطلاعات را به عنوان خروجی ارائه دهند که این باعث میشود چالشهای منحصربفردی پیرامون قوانین حریم خصوصی و مالکیت معنوی پدید آید.