هوش مصنوعی مولد چیست؟ – به زبان ساده

۲۳۳۰ بازدید
آخرین به‌روزرسانی: ۱۳ شهریور ۱۴۰۲
زمان مطالعه: ۲۳ دقیقه
هوش مصنوعی مولد چیست؟ – به زبان ساده

به طور خلاصه، «هوش مصنوعی مولد» (Generative Artificial Intelligence) به مدل‌های یادگیری عمیقی گفته می‌شود که می‌توانند متن، تصاویر و سایر محتوای با کیفیت را بر اساس داده‌های آموزشی تولید کنند. هوش مصنوعی مولد را «Generative AI» هم خطاب می‌کنند. در ادامه این مطلب از مجله فرادرس دقیق‌تر به این پرسش پاسخ داده شده است که هوش مصنوعی مولد چیست و به موضوع‌های کلیدی حول این مفهوم پرداخته‌ایم.

فهرست مطالب این نوشته

مقدمه

حیطه هوش مصنوعی چرخه‌های هیاهوی بسیاری را تجربه کرده، اما حتی از دیدگاه بدبینان و شکاکان نیز انتشار ChatGPT نقطه عطفی را در این حوزه تثبیت کرده است. چَت‌بات هوش مصنوعی شرکت OpenAI با قدرت گرفتن از آخرین مدل زبانی گسترده خود می‌تواند شعر بسراید، لطیفه تعریف کند و تولید سریع مقاله‌هایی را انجام دهد که گویی انسان آن‌ها را ساخته است. تنها در چند کلمه از ChatGPT درخواست خود را مطرح می‌کنیم و خروجی دریافتی، مثلاً شعرهای عاشقانه با قالب پلتفرم‌های نقد و بررسی Yelp یا متنِ ترانه به سبکِ «Nick Cave» خواهد بود.

آخرین باری که هوش مصنوعی مولد یا همان Generative AI به این اندازه مطرح شد و درخشید، مربوط می‌شود به تحولی که در بینایی ماشین اتفاق افتاد. تصاویر سلفی به پرتره‌هایی به سبک رنسانس تبدیل می‌شدند و تصاویر صورت‌های دارای کهولت سنِ پیش از موعد، صفحات شبکه‌های اجتماعی را پر کرده بودند. ۵ سال پس از آن، نوبت به پیشرفت بزرگ در «پردازش زبان طبیعی» (NLP) فرا می‌رسد و قابلیت مدل‌های زبانی در سخن گفتن پیرامون هر موضوعی موجب جلب توجه ویژه عموم شده است.

البته توانایی مدل‌های زبانی تنها به زبان ختم نمی‌شود. مدل‌های مولد همچنین قابلیت یادگیری قواعد نحوی کدهای نرم‌افزاری، مولکول‌ها، تصاویر طبیعی و طیفی از سایر انواع داده را نیز دارند. کاربردها و استفاده از این فناوری هر روز در حال رشد است و تنها در ابتدای راه واکاوی پتانسیل‌های آن هستیم.

هوش مصنوعی مولد چیست ؟

هوش مصنوعی مولد یعنی الگوریتم‌هایی (مثل ChatGPT) که می‌توان از آن‌ها برای خلق محتوای جدید، مثل محتوای صوتی، کدهای برنامه نویسی، تصاویر، متن، شبیه‌سازی‌ها و ویدیوها استفاده کرد. تحولات اخیر در این حوزه دارای این پتانسیل است که به طور قابل توجهی رویکرد انسان را نسبت به تولید محتوا تغییر دهد.

به بیان دقیق‌تر، هوش مصنوعی مولد به مدل‌های یادگیری عمیقی گفته می‌شود که می‌توانند محتوای با کیفیتی را بر اساس داده‌های آموزشی مورد استفاده، تولید کنند. به بیان ساده، مدل مولد می‌تواند آنچه را که از نمونه‌های دریافتی فرا گرفته است، به کار گیرد و بر اساس آن اطلاعات، محتوایی کاملاً جدید را خلق کند. به همین دلیل است که نام «مولد» به معنی «تولید کننده» برای آن انتخاب شده است.

هوش مصنوعی مولد
ذهنیتی از هوش مصنوعی مولد، تولید شده با هوش مصنوعی مولد DALL-E

هوش مصنوعی مولد چگونه کار می کند؟

هوش مصنوعی مولد کارش را با دریافت «طرح دستور» (Prompt) آغاز می‌کند که این پرامپت می‌تواند در غالب متن، تصویر، ویدیو، طراحی، نُت‌های موسیقی یا هر ورودی دیگری باشد که سیستم هوش مصنوعی می‌تواند پردازش کند. سپس الگوریتم‌های مختلف هوش مصنوعی در پاسخ به طرح دستور یا همان پرامپت دریافتی، محتوای جدیدی را خروجی می‌دهند.

محتوای خروجی می‌تواند نوشته، راه حل مشکل یا محتوای جعلی باشد که از تصویر یا صدای یک شخص تولید شده است. در خصوص بحث طراحی «پرامپت»، اکنون مهارت جدیدی به نام «پرامپت نویسی» یا «مهندسی پرامپت» (Prompt Engineering) مطرح شده است که اهمیت زیادی دارد و به نظر می‌رسد رفته رفته لازم خواهد بود همه افراد این مهارت مهم را بدست آورند.

نحوه کار Generative AI
ذهنیت نحوه کار هوش مصنوعی مولد از دیدگاه DALL-E (پرامت تولید شده با ChatGPT)

در نسخه‌های اولیه هوش مصنوعی مولد نیاز بود داده‌ها حتماً از طریق API یا سایر فرایندهای پیچیده به مدل ارائه شوند. توسعه‌دهنده‌ها ناچار بودند با ابزارهای اختصاصی آشنا شوند و با استفاده از زبان‌هایی مثل پایتون، اپلیکیشن‌هایی را برای این منظور بنویسند.

اکنون پیشگامان حوزه هوش مصنوعی مولد در حال توسعه تجربه کاربری بهتر هستند و امکان شرح درخواست به زبان محاوره روزمره هر روز بیشتر فراهم می‌شود. پس از دریافت پاسخ اولیه، می‌توان، نتایج را به وسیله ارائه بازخورد پیرامون شیوه، لحن و سایر عناصری سفارشی‌سازی کرد که انتظار بازتاب آن‌ها را از هوش مصنوعی مولد را داریم.

مدل هوش مصنوعی مولد چیست ؟

مدل‌های هوش مصنوعی مولد الگوریتم‌های هوش مصنوعی مختلفی را با هم ترکیب می‌کنند تا محتوا ارائه دهند و پردازش محتوا کنند. برای مثال، به منظور تولید متن، روش‌های مختلف پردازش زبان طبیعی کاراکترهای خام (مثل حروف، نقطه‌ها و سایر علامت‌هایی مثل ویرگول و کلمه‌ها) را به جمله‌ها، اجزای جمله، موجودیت‌ها و عملیات تبدیل می‌کند.

این موارد با استفاده از چندین روش مختلفِ کُدگذاری به صورت بردارهایی بازنمایی می‌شوند. به طور مشابه، تصاویر را نیز می‌توان با استفاده از مدل‌های هوش مصنوعی مولد به عنصرهای بصری گوناگون و مختلفی تبدیل کرد که آن‌ها هم به صورت بردارهایی ابراز می‌شوند.

باید هشدار داد که در این روش‌ها، ممکن است جانب‌داری، نژادپرستی، فریب‌کاری و تبلیغات پر سر و صدا هم به عنوان داده‌های ورودی به طور غیر عمد مورد استفاده قرار بگیرند و نتایجی دارای اشکال حاصل شود. اما ارائه دهندگان هوش مولد و توسعه‌دهندگان مدل‌های آن، همواره در حال کار روی این مدل‌ها هستند تا چالش‌های این چنینی برطرف و مسائل اخلاقی و قانونی در این خصوص رعایت شوند.

مدل هوش مصنوعی Generative

کاربردهای هوش مصنوعی مولد چیست ؟

هوش مصنوعی مولد را می‌توان در موارد استفاده مختلفی به کار گرفت تا بتوان به طور مجازی، هر نوع محتوایی را تولید کرد. به لطف تحولات ساختارشکنانه‌ای مثل GPT که می‌تواند برای کاربردهای مختلفی تنظیم شود، دسترسی به این فناوری روز به روز برای انواع مختلف کاربران آسان‌تر شده است.

در ادامه برخی از کاربردهای رایج هوش مصنوعی مولد فهرست شده‌اند.

  • پیاده‌سازی چت‌بات (ربات‌های گفتگو) برای خدمات مشتریان و پشتیبانی فنی
  • استقرار مدل‌های «جعل عمیق» (Deep Fake) برای تقلید از افراد و حتی تقلید از برخی افراد خاص
  • بهبود و پیشرفت صنعت دوبله در سینما، تلویزیون و محتوای آموزشی به زبان‌های مختلف
  • پاسخ به ایمیل‌ها، ساخت پروفایل برای دوست‌یابی، نوشتن رزومه و مقاله‌های پژوهشی
  • ایجاد آثار هنری واقع‌گرایانه با سبک و استایلی خاص
  • بهبود ویدیوهای نمایش محصولات
  • پیشنهاد ترکیب‌های دارویی جدید برای آزمایش
  • طراحی محصولات و ساختمان‌های فیزیکی
  • بهینه‌سازی طراحی چیپ‌های جدید
  • آهنگسازی به شیوه و لحنی خاص

مزایای هوش مصنوعی مولد کدامند؟

هوش مصنوعی مولد را می‌توان در بسیاری از حوزه‌های مختلف کسب و کار مورد استفاده قرار داد. با استفاده از هوش مصنوعی مولد می‌توان تفسیر و درک محتوای فعلی را آسان‌تر کرد و به طور خودکار محتوای جدید ساخت. توسعه‌دهندگان و برنامه‌نویسان در حال جست و جو برای راهکارهایی هستند تا بتوانند با استفاده از هوش مصنوعی جریان‌های کاری فعلی را بهبود دهند و نگاهی هم به سازگارسازی کامل جریان‌های کاری دارند تا بتوانند از این فناوری نوظهور بهره لازم را ببرند.

برخی از مزایای بالقوه پیاده‌سازی هوش مصنوعی مولد در ادامه فهرست شده‌اند.

  • خودکارسازی روند دستی تولید محتوا
  • صرفه‌جویی در وقت و انرژی برای پاسخ دادن به ایمیل‌ها
  • بهبود پاسخ به برخی از پُرسمان‌های فنی
  • ایجاد بازنمودهای واقع‌گرایانه از افراد
  • جمع‌بندی اطلاعات پیچیده و تبدیل آن‌ها به روایتی معقول و منسجم
  • ساده‌سازی فرایند تولید محتوا به شیوه‌ای خاص
  • فراهم شدن امکان تولید تصاویر منحصر به فرد و اجتناب از به کار بردن تصاویر تکراری در محتوا
مزایای هوش مصنوعی مولد چیست

هوش مصنوعی مولد چه محدودیت هایی دارد؟

پیاده‌سازی‌های اولیه هوش مصنوعی مولد به وضوح محدودیت‌های مختلف آن را مشخص می‌کند. برخی از چالش‌هایی که در هوش مصنوعی مولد وجود دارند، از رویکردهای خاصی حاصل می‌شوند که برای پیاده‌سازی کاربردهای مخصوص مورد استفاده قرار می‌گیرند.

برای مثال، خواندن خلاصه و چکیده‌ای از یک موضوع پیچیده نسبت به مطالعه توضیحاتی بسیار آسان‌تر خواهد بود که در آن از منابع گوناگون برای بیان نکات کلیدی استفاده شده است . اگرچه، خوانا بودن خلاصه و چکیده مربوطه، هزینه‌ای را هم به دنبال دارد و آن هزینه این است که خواننده از منابع مورد استفاده اطلاع نخواهد داشت. در ادامه برخی از محدودیت‌هایی فهرست شده‌اند که در زمان پیاده‌سازی و استفاده از اپلیکیشن‌های هوش مصنوعی مولد با آن‌ها مواجه خواهیم شد.

  • مدل‌های هوش مولد همیشه منبع محتوا را مشخص نمی‌کنند.
  • ارزیابی میزان سوگیری منابع اصلی می‌تواند چالش‌برانگیز باشد.
  • محتوایی که واقع‌گرایانه به نظر می‌رسد، شناسایی اطلاعات نادقیق را دشوارتر می‌کند.
  • درک نحوه سازگارسازی با شرایط جدید می‌تواند دشوار باشد.
  • در نتایج ارائه شده ممکن است جهت‌گیری، تبعیض و تنفر آشکار شود.

چه نگرانی هایی پیرامون هوش مصنوعی مولد وجود دارد؟

به طور قطع، ظهور هوش مصنوعی مولد نگرانی‌های مختلفی را هم به وجود آورده است. این نگرانی‌ها به کیفیت نتایج و پتانسیل سوء‌استفاده و همچنین پتانسیل مختل کردن مدل‌های فعلی کسب و کار مربوط می‌شوند.

در ادامه برخی از انواع مشخص مسائل مشکل‌ساز موجود با شرایط فعلی هوش مصنوعی مولد در زمان تدوین این نوشته فهرست شده‌اند.

  • هوش مصنوعی مولد ممکن است اطلاعات نادقیق و گمراه کننده ارائه دهد.
  • بدون دانستن منبع و سرچشمه اطلاعات، اطمینان کردن دشوارتر است.
  • استفاده از هوش مصنوعی مولد ممکن است منجر به بروز انواع جدیدی از سرقت ادبی شود و حقوق تولید‌کنندگان محتوا و هنرمندان نادیده گرفته شود.
  • ممکن است هوش مصنوعی مولد، مدل‌های فعلی کسب و کاری که پیرامون بهینه‌سازی موتور جست و جو و تبلیغات ساخته شده‌اند را مختل سازد.
  • تولید اخبار جعلی احتمالاً با استفاده از هوش مصنوعی مولد آسان‌تر خواهد شد.
  • احتمال دارد در آینده این ادعا مطرح شود که شواهد تصویری واقعی از یک عمل خلاف چیزی بیشتر از تصاویر جعلی تولید شده با هوش مصنوعی نبوده است.
  • ممکن است امکان جعل افراد برای حملات سایبری مبتنی بر مهندسی اجتماعی با استفاده از هوش مصنوعی مولد آسان‌تر شود.
معایب هوش مصنوعی مولد
نیمه تاریک هوش مصنوعی مولد – تولید شده با DALL-E

معرفی نمونه هایی از ابزارهای هوش مصنوعی مولد

ابزارهای هوش مصنوعی مولد برای وَجهیَت‌های گوناگونی مثل متن، تصویر، موسیقی، کد و صوت وجود دارند.

برخی از تولید کننده‌های محبوب محتوای هوش مصنوعی در ادامه فهرست شده‌اند.

  • ابزارهای تولید متن شامل AI-Writer ،Jasper ،GPT و Lex می‌شوند.
  • ابزارهای تولید تصویر شامل Midjourney ،Dall-E 2 و Stable Diffusion است.
  • از ابزارهای هوش مصنوعی تولید کننده موسیقی می‌توان به Dadabots ،Amper و MuseNet اشاره کرد.
  • از جمله ابزارهای AI برای تولید کدهای برنامه نویسی می‌توان به GitHub Copilot ،Codex ،CodeStarter و Tabnine اشاره کرد.
  • ابزارهای ترکیب صوت شامل Listnr ،Descript و Podcast.ai می‌شوند.
  • از شرکت‌های تولید کننده ابزار برای طراحی چیپ‌های هوش مصنوعی می‌توان Cadence ،Synopsys، گوگل و Nvidia را نام برد.

کاربردهای Generative AI در حوزه های تخصصی مختلف

برخی از افراد، فناوری‌های جدید هوش مصنوعی مولد را با نیروی بخار، الکتریسیته و محاسبات مقایسه می‌کنند، زیرا آن‌ها می‌توانند تاثیر بسزایی را در صنایع و کاربردهای گوناگون داشته باشند. ضرورت دارد این مسئله در نظر گرفته شود که مشابه فناوری‌های همه منظوره قبلی، به جای اینکه فقط بخش‌هایی از جریان کارهای موجود سرعت بخشیده شوند، اغلب دهه‌ها برای افراد زمان می‌برد تا به بهترین راه برای سازمان‌دهی جریان‌های کاری به منظور بهره‌مندی از رویکرد جدید دست یابند.

در ادامه برخی از راه‌هایی فهرست شده است که هوش مصنوعی مولد می‌تواند حوزه‌های تخصصی و صنایع مختلف را تحت تاثیر قرار دهد.

  • در حوزه مالی می‌توان تراکنش‌ها را در قالب سابقه فردی مشاهده کرد تا امکان ساخت سامانه‌های قوی‌تر تشخیص ناهنجاری (کلاه‌برداری) فراهم شود.
  • شرکت‌های حقوقی می‌توانند هوش مصنوعی مولد را برای طراحی و تفسیر قراردادها، تجزیه و تحلیل شواهد و ارائه استدلال به کار گیرند.
  • شرکت‌های تولیدی می‌توانند از هوش مصنوعی برای تلفیق دقیق‌تر و اقتصادی‌تر داده‌های دریافتی از دوربین‌ها، تصاویر X-ray و سایر سنجه‌ها به منظور شناسایی بخش‌های دارای عیب و دلایل ریشه‌ای استفاده کنند.
  • شرکت‌های رسانه‌ای و فیلمسازی نیز می‌توانند هوش مصنوعی مولد را برای تولید اقتصادی‌تر محتوا و ترجمه (دوبله) آن به زبان‌های دیگر با صدای اصلی بازیگران به خدمت بگیرند.
  • در صنعت دارو نیز می‌توان از هوش مصنوعی مولد برای شناسایی بهینه‌تر داروهای امیدبخش استفاده کرد.
  • شرکت‌های معماری می‌توانند از هوش مصنوعی مولد برای طراحی و تطبیق سریع‌تر نمونه‌های اولیه کمک بگیرند.
  • شرکت‌های تولید بازی‌های کامپیوتری هم می‌توانند از هوش مصنوعی مولد برای طراحی محتوای بازی و مراحل آن استفاده کنند.
کاربردهای هوش مصنوعی مولد

اصول اخلاقی و انحراف در هوش مصنوعی مولد

برخلاف وعده‌ها، ابزارهای جدید هوش مصنوعی مولد، در خصوص دقت، قابلیت اعتماد و اطمینان، جانبداری، توهم و سرقت ادبی، چالش‌ها و سختی‌های بسیاری را پدید آورده‌اند، مسائلی اخلاقی که رفع آن‌ها سال‌ها زمان خواهد برد. هیچ یک از این مسائل به طور خاص برای هوش مصنوعی جدید نیستند. برای مثال، اولین حضور شرکت مایکروسافت در حوزه چت‌بات‌ها در سال ۲۰۱۶ اتفاق افتاد و چت‌بات Tay معرفی شده، اما پس از مدت کوتاهی ناچار شدند آن را از دسترس خارج کنند، چون در توییتر شروع به اشاعه لفاظی‌های تنش‌آفرین کرده بود.

آنچه جدیداً اتفاق افتاده، این است که آخرین محصولات مبتنی بر هوش مصنوعی مولد، به لحاظ سطحی معقول‌تر و منسجم‌تر به نظر می‌رسند. اما این ترکیب زبان انسان‌گونه و یکپارچگی با هوش انسانی برابری نمی‌کند و در حال حاضر بحث‌های زیادی راجع به این مسئله در گرفته است که آیا مدل‌های هوش مصنوعی مولد می‌توانند به گونه‌ای آموزش داده شوند که قدرت استدلال داشته باشند. حتی یک مهندس گوگل بعد از اینکه به صورت عمومی اعلام کرد که هوش مصنوعی مولد این شرکت، یعنی «مدل‌های زبانی برای کاربردهای گفت و گو» (LaMDA) دارای احساس است، از این شرکت اخراج شد.

واقع‌گرایانه و متقاعد کننده بودن محتوای تولید شده با هوش مصنوعی مولد مجموعه جدیدی از خطرات در حوزه AI را مطرح می‌کند. شناسایی محتوای تولید شده با هوش مصنوعی سخت‌تر می‌شود و مهم‌تر از آن، دشوارتر شدن شناسایی اشتباه بودن موارد تولید شده است. این معضل می‌تواند زمانی بیشتر مشکل‌ساز شود که بر نتایج ارائه شده به وسیله هوش مصنوعی مولد برای کد نویسی یا فراهم کردن توصیه‌های پزشکی تکیه داشته باشیم.

بسیاری از نتایج هوش مصنوعی شفاف نیستند، بنابراین تشخیص این مسئله دشوار است که آیا مدل‌های مولد برای مثال قوانین حق نشر را نقض کرده‌اند یا اینکه مشکلی با منابع اصلی مورد استفاده برای تولید نتایج وجود داشته است. اگر ندانیم که هوش مصنوعی چگونه به چنین نتیجه و خروجی رسیده است، آنگاه نمی‌توان در خصوص دلیل اشتباه کردنش هم استدلال کرد.

تفاوت هوش مصنوعی با هوش مصنوعی مولد چیست ؟

هوش مصنوعی مولد تولید محتوای جدید، پاسخ به چت‌ها، طراحی کردن، ساخت تصنعی یا جعل عمیق را انجام می‌دهد. از سوی دیگر، هوش مصنوعی کلاسیک اما روی شناسایی الگو، تصمیم‌گیری، تقویت تجزیه و تحلیل، طبقه‌بندی داده‌ها و شناسایی ناهنجاری و کلاه‌برداری تمرکز دارد.

همان‌طور که بیان شد، هوش مصنوعی مولد، اغلب از روش‌های شبکه عصبی عمیق مثل ترانسفورمرها، شبکه‌های GAN و VAEها استفاده می‌کند، اما در طرف دیگر، سایر انواع هوش مصنوعی برای تشخیص، از روش‌هایی شامل «شبکه‌های عصبی پیچشی» (کانولوشن | Convolutional)، «شبکه‌های عصبی بازگشتی» (Recurrent) و «یادگیری تقویتی» (Reinforcement Learning) استفاده می‌کنند.

هوش مصنوعی مولد اغلب با یک «پرامت» (طرح دستور) آغاز می‌شود که به کاربر یا منبع داده اجازه می‌دهد پرسمان یا مجموعه داده اولیه را ثبت و وارد کنند تا به این وسیله هدایت تولید محتوا انجام شود. این می‌تواند پروسه‌ای تکرارشونده برای کند و کاو در گونه‌های محتوایی مختلف باشد. اما الگوریتم‌های سُنتی هوش مصنوعی داده‌های جدیدی را پردازش می‌کنند تا تنها نتیجه‌های ساده‌ای را بازگردانند.

بهترین روش ها برای استفاده از هوش مصنوعی مولد

بهترین شیوه‌ها برای استفاده از هوش مصنوعی مولد بسته به وَجهیَت‌ها، جریان کاری و اهداف مورد نظر متفاوت است. به این ترتیب، در نظر گرفتن عوامل ضروری نظیر دقت، شفافیت و سهولت استفاده در کار با هوش مصنوعی مولد ضرورت دارد.

روش‌های زیر به رسیدن به فاکتورهای بیان شده کمک می‌کنند.

  • بهتر است به طور واضح تمام محتوای هوش مصنوعی مولد برای کاربران و مصرف کنندگان برچسب‌گذاری شود.
  • میزان دقت محتوای تولید شده با استفاده از منابع اصلی در صورت لزوم بررسی شود.
  • باید در نظر بگیریم که چگونه ممکن است جانب‌داری در نتایج تولید شده توسط هوش مصنوعی اثر بگذارد.
  • باید کیفیت کدها و محتوای تولید شده به وسیله هوش مصنوعی را با ابزارهای دیگر بسنجیم.
  • لازم است از نقاط قوت و محدودیت‌های هر ابزار هوش مصنوعی مولد آگاه باشیم.
  • باید خودمان را با حالت‌های رایج شکست در نتایج آشنا سازیم تا بتوانیم آن‌ها را دور بزنیم.
بهترین شیوه ها برای استفاده از هوش مصنوعی مولد

تاریخچه هوش مصنوعی مولد

چت‌بات الیزا که توسط «جوزف ویزنبام» (Joseph Weizenbaum) در دهه ۶۰ میلادی ساخته شد، از جمله اولین نمونه‌های هوش مصنوعی مولد به حساب می‌آید. این پیاده‌سازی‌های اولیه از رویکردی مبتنی بر قانون استفاده می‌کردند که به دلیل دایره لغت محدود، کمبود زمینه و اتکای بیش از حد بر الگوها و سایر کاستی‌ها، به راحتی معیوب می‌شدند.

این حوزه تحقیقاتی با وقوع پیشرفت‌هایی در زمینه شبکه‌های عصبی و یادگیری عمیق در سال ۲۰۱۰ با تجدید حیات مواجه شد. این پیشرفت‌ها باعث شدند که در این فناوری امکان یادگیری نحوه مرور متن‌های موجود، طبقه‌بندی عنصرهای تصویری و رونویسی از صوت فراهم شود.

الیزا اولین هوش مصنوعی مولد

«ایان گوفِلو» (Ian Goodfellow) شبکه‌های مولد تخاصمی GAN را در سال ۲۰۱۴ معرفی کرد. این روش یادگیری عمیق،‌ رویکردی نوین را برای سازماندهی شبکه‌های عصبی رقابتی به منظور تولید و سپس رتبه‌بندی انواع محتوا ارائه داده است. مدل‌های تولید شده به این روش می‌توانستند افراد، صداها، موسیقی و متن‌های واقع‌گرایانه تولید کنند. این مسئله به طور همزمان علاقه‌مندی و همچنین نگرانی‌هایی را در خصوص نحوه استفاده از هوش مصنوعی مولد برای تولید محتوای جعل عمیق واقع‌گرایانه‌ای به وجود آورد که خود را به جای افراد مشهور جا می‌زدند.

از آن زمان تا کنون پیشرفت در سایر تکنیک‌ها و معماری‌های شبکه عصبی به گسترش حیطه هوش مصنوعی مولد کمک کرده است. این روش‌ها شامل VAEها، حافظه کوتاه مدت طولانی، ترانسفورمرها، مدل‌های انتشاری و «میدان‌های تابشی عصبی» (Neural Radiance Fields) می‌شوند.

مدل های هوش مصنوعی مولد عمیق چگونه ظهور پیدا کردند؟

هوش مصنوعی مولد به مدل‌های یادگیری عمیقی گفته می‌شود که می‌توانند داده‌های خام، مثل تمام داده‌های ویکی‌پدیا یا آثار جمع‌آوری شده رامبرانت را بردارند و یاد بگیرند در زمان درخواست، خروجی‌های محتمل آماری را تولید کنند. در سطح بالا، مدل‌های مولد، بازنمودی ساده‌سازی شده از داده‌های آموزشی خود را کدگذاری می‌کنند و ترسیمی را از آن انجام می‌دهند تا کار جدیدی را خلق کنند که مشابه و نه دقیقاً‌ مطابق داده‌های اصلی است.

نقش VAE ها در گسترش مدل های هوش مصنوعی مولد

مدل‌های هوش مصنوعی مولد برای سال‌ها است که در آمار برای تجزیه و تحلیل داده‌های عددی مورد استفاده قرار می‌گیرند. ظهور یادگیری عمیق، این امکان را فراهم ساخت تا کاربرد مدل‌های مولد به استفاده از آن‌ها در تصاویر، سخن گفتن و سایر انواع داده‌های پیچیده گسترش یابد.

در میان از جمله اولین نوع از مدل‌هایی که به این امر خطیر دست یافتند، می‌توان به «رمزگذارهای خودکار تغییرپذیر» (Variational Autoencoder) اشاره کرد که به اختصار آن‌ها را VAE هم خطاب می‌کنند و در سال ۲۰۱۳ معرفی شدند. VAEها از جمله اولین مدل‌های یادگیری عمیقی بودند که برای تولید تصاویر واقع‌گرایانه و سخن گفتن به میزان وسیعی مورد استفاده قرار گرفتند.

VAEها آغازگر سیل عظیم مدل‌سازی هوش مصنوعی مولد بودند، چرا که امکان مقیاس‌پذیری مدل‌ها را بسیار ساده‌تر کردند. در واقع این آغاز ظهور بسیاری از مدل‌هایی محسوب می‌شود که امروز به عنوان هوش مصنوعی مولد از آن‌ها یاد می‌کنیم. کدگذارهای خودکار به وسیله کدگذاری داده‌های بدون برچسب و تبدیل آن‌ها به بازنمایی فشرده‌سازی شده کار می‌کنند و سپس داده‌ها به شکل اولیه و اصلی خود کدگشایی می‌شوند.

از کدگذارهای خودکار «یکنواخت» (Plain) برای مقاصد گوناگونی استفاده می‌شود که از جمله می‌توان به بازسازی تصاویر مخدوش شده یا محو شده اشاره کرد. کدگذارهای خودکار تغییرپذیر این توانایی حیاتی و مهم را اضافه کردند که به وسیله آن‌ها نه تنها می‌توانیم داده‌ها را بازسازی کنیم، بلکه گونه‌های مختلفی را بر اساس داده‌های اصلی خروجی بدهیم.

هوش مصنوعی Generative چیست

این قابلیت و توانایی تولید داده‌های بدیع، باعث ایجاد پیشرفت‌های سریع و ارائه فناوری‌های جدیدی با سرعت زیاد از «شبکه‌های مولد متخاصم» (Generative Adversarial Networks) گرفته تا «مدل‌‌های انتشاری» (Diffusion Models) شد که قابلیت تولید تصاویری بسیار واقع‌گرایانه‌تر، اما جعلی را دارا هستند. به این طریق، VAEها زیربنای لازم برای توسعه هوش مصنوعی امروزی با توانایی‌های فعلی را فراهم کرده‌اند.

آن‌ها از بلوک‌هایی از کُدگذارها و کُدگشاها ساخته شده‌اند، نوعی معماری که پایه و اساس مدل‌های زبانی امروزی را تشکیل می‌دهد. کدگذارها مجموعه داده‌ها را به بازنمایی متراکمی فشرده‌سازی می‌کنند و نقاط داده مشابه را در فضایی انتزاعی نزدیک‌تر نسبت به یکدیگر قرار می‌دهند. کُدگشاها از این فضا نمونه‌برداری می‌کنند تا چیزی جدید را خلق کنند و در عین حال مهم‌ترین ویژگی‌های مجموعه داده را هم حفظ خواهند کرد.

ظهور ترانسفورمرها

«مبدل‌ها» (Transformers) که در سال ۲۰۱۷ به وسیله گوگل در قالب مقاله‌ای با نام «توجه، تمام آن چیزی است که نیاز دارید» در نشریه‌ای برجسته معرفی شدند. ترانسفورمرها معماری «کدگذار کدگشا» را با ساز و کار پردازش متنی با نام «توجه» (Attention) ترکیب کردند تا نحوه آموزش مدل‌های زبانی را متحول سازند. کدگذار، متن‌های خام نشانه‌گذاری نشده را به بازنمایی‌هایی به نام «جانمایی‌ها» (Embeddings) تبدیل می‌کند. سپس کدگشا این جانمایی‌ها را با هم به همراه خروجی‌های پیشین مدل دریافت و به طور پیاپی هر کلمه را در جمله پیش‌بینی می‌کند.

از طریق بازی‌های حدس جای خالی، کدگذار می‌آموزد که چگونه کلمه‌ها و جمله‌ها با یکدیگر مرتبط می‌شوند که این باعث ایجاد بازنمایی قدرتمندی از زبان می‌شود، بدون اینکه فردی بخواهد اجزای جمله و سایر ویژگی‌های دستور زبان را برچسب‌گذاری کند. در واقع ترانسفورمرها را می‌توان از قبل در نقطه شروع بدون هیچ هدف و وظیفه مورد نظری آموزش داد. پس از آنکه یادگیری برای این بازنمایی‌های قدرتمند اتفاق افتاد، مدل‌ها را بعداً می‌توان برای اجرای یک وظیفه مد نظر، با داده‌های خیلی کم‌تری اختصاصی کرد.

نوآوری‌های بسیاری این امر را امکان‌پذیر ساخته است. ترانسفورمرها کلمه‌های یک جمله را در یک لحظه به طور همزمان پردازش می‌کنند که این باعث می‌شود امکان پردازش متن به صورت موازی فراهم شود و سرعت آموزش مدل افزایش پیدا کند. روش‌های پیشین مثل «شبکه‌های عصبی بازگشتی» (RNN) و شبکه‌های «حافظه کوتاه مدت طولانی» (LSTM) کلمه‌ها را یکی یکی پردازش می‌کردند. همچنین ترانسفورمرها محل کلمه‌ها در جمله و ارتباط آن‌ها با یکدیگر را هم یاد می‌گیرند. بافتی که امکان درک مفهوم جمله و مشخص کردن معنی کلمه‌هایی مثل «آن» (it) را در جمله‌های طولانی فراهم می‌کرد.

به وسیله حذف نیاز به تعریف یک هدف و وظیفه مشخص از ابتدای کار، ترانسفورمرها امر پیش‌آموزش مدل‌های زبانی را بر اساس مقادیر گسترده‌ای از متن‌های خام تبدیل به کاری کاربردی و مفید کردند و این باعث شد اندازه آن‌ها به میزان قابل توجهی افزایش یابد. پیش از این افراد داده‌ها را جمع‌آوری و برچسب‌گذاری می‌کردند تا یک مدل را تنها برای یک وظیفه خاص آموزش دهند. اما با پیدایش ترانسفورمرها یا همان مبدل‌ها، امکان آموزش یک مدل بر پایه مقدار بسیار زیادی از داده‌ها و سپس سازگار ساختن آن با چندین وظیفه به وسیله تنظیم دقیق آن برای مقدار کوچکی از داده‌های اختصاصی برچسب‌گذاری شده فراهم شد.

ظهور ترانسفورمرها

به واسطه انطباق‌پذیری ترانسفورمرها، آن‌ها را با عنوان «مدل‌های اساسی» (Foundation Model) می‌شناسند. در گذشته اگر می‌خواستیم یک دسته‌بند را بهتر کنیم، ناچار بودیم داده‌های بیشتری را در ورودی به آن بدهیم. اما اکنون با استفاده از مدل‌های اساسی، می‌توان مقادیر زیادی از داده‌های بدون برچسب را به مدل ارائه داد تا چنان بازنمایی آموزش داده شود که به طور عمومی و کلی برای بسیاری از وظایف به خوبی عمل می‌کند.

ترانسفورمرهای زبان امروزی، در حال حاضر، برای کاربردهای متنوعی مورد استفاده قرار می‌گیرند. این کاربردها شامل طبقه‌بندی و استخراج موجودیت در حوزه‌های غیرمولد و همچنین ترجمه، خلاصه‌سازی و پاسخگویی به سؤال در حوزه‌های مولد می‌شود. به تازگی، قدرت تولید گفتگو، مقاله و سایر محتوای متقاعد کننده توسط ترانسفورمرها جهان را مبهوت ساخته است.

انواع ترانسفورمرهای زبانی

ترانسفورمرهای زبان به ۳ دسته اصلی «مدل‌های تنها کدگذار»، «مدل‌های فقط کدگشا» و «مدل‌های کدگذار-کدگشا» تقسیم می‌شوند. مدل‌های تنها کدگذار مانند BERT، به موتورهای جستجو و چت‌بات‌های خدمات مشتری، از جمله معاون سرویس دستیار واتسون شرکت IBM قدرت بخشیده‌اند. مدل‌های تنها کدگذار به طور گسترده برای وظیفه‌های غیرمولد مانند طبقه‌بندی بازخورد مشتری و استخراج اطلاعات از سند‌های طولانی استفاده می‌شوند. در یک پروژه با سازمان فضایی ناسا، IBM در حال ساختن مدلی تنها-کدگذار است تا میلیون‌ها مجله علوم زمین را برای یافتن دانش جدید استخراج کند.

مدل‌های تنها-کدگشا مانند خانواده مدل‌های GPT برای پیش‌بینی کلمه بعدی بدون نمایش کدگذاری آموزش داده می‌شوند. GPT-3 با ۱۷۵ میلیارد پارامتر، بزرگترین مدل زبانی از این نوع بود که در سال ۲۰۲۰ توسط OpenAI منتشر شد. مدل‌های بزرگ دیگری مانند PaLM شرکت گوگل (۵۴۰ میلیارد پارامتر) و BLOOM (۱۷۶ میلیارد پارامتر) که دسترسی آزاد دارند، به عنوان نمونه‌هایی دیگر به این عرصه پیوسته‌اند.

مدل‌های کدگذار-کدگشا مانند مدل «Text-to-Text Transfer Transformer» (مبدل انتقال متن به متن) یا «T5» شرکت گوگل، ویژگی‌هایی از هر دو مدل BERT و مدل‌های سبک GPT را ترکیب می‌کنند. آن‌ها قادرند بسیاری از وظایف مولد را همچون مدل‌های تنها-کدگشا انجام دهند، اما اندازه کوچک آن‌ها باعث می‌شود عملکردشان سریع‌تر و ارزان‌تر باشد. هوش مصنوعی مولد و مدل‌های زبانی بزرگ با سرعتی چشمگیر در حال پیشرفت هستند، به طوری که تقریباً هر روز مدل‌ها، ساختارها و نوآوری‌های جدیدی پدید می‌آیند.

عمل متقابل یادگیری نظارت شده

توانایی بهره‌برداری از داده‌های بدون برچسب، یک نوآوری کلیدی بود که قدرت هوش مصنوعی مولد را به رخ کشید. اما نظارت انسانی اخیراً دوباره بازگشته و در حال کمک به پیشرفت مدل‌های زبانی گسترده است. توسعه‌دهندگان هوش مصنوعی به طور فزاینده از یادگیری نظارت شده برای شکل‌دهی به تعامل‌های انسان با مدل‌های مولد و بازنمایی‌های تعبیه شده قدرتمند آن‌ها استفاده می‌کنند.

نظارت انسانی با تنظیم دستور در مدل های هوش مصنوعی مولد

تنظیم دستور، که با سری مدل‌های FLAN شرکت گوگل معرفی شده، به مدل‌های مولد امکان داده است تا از وظایف ساده فراتر بروند و به صورت تعاملی و با کلیت بیشتری کمک کند. ارائه دستوراتی به مدل، همراه با پاسخ‌هایی در زمینه‌های موضوعی بسیار متنوع، می‌تواند آن را برای تولید نه فقط متنی محتمل به لحاظ آماری، بلکه تولید پاسخ‌هایی انسان‌گونه به سوالاتی مثل «پایتخت فرانسه چیست» یا درخواست‌هایی مانند «فهرست اعداد داده شده را مرتب کن» آماده کند.

نظارت انسانی روی هوش مصنوعی مولد

یادگیری بی نمونه چیست ؟

به وسیله مهندسی دقیقِ مجموعه‌ای از درخواست‌ها، یعنی همان ورودی‌های اولیه تغذیه شده به یک مدل پایه، مدل می‌تواند برای انجام گستره وسیعی از وظایف سفارشی‌سازی شود. در برخی موارد، در کل هیچ داده برچسب‌گذاری شده‌ای مورد نیاز نخواهد بود. به سادگی از مدل می‌خواهیم تا وظیفه‌ای را انجام دهد، از جمله، مواردی که به صورت صریح به مدل آموزش داده نشده‌اند.

این رویکرد کاملاً بدون داده، با نیاز به هیچ نمونه‌ای، با عنوان «یادگیری بی‌نمونه» (Zero-Shot Learning) شناخته می‌شود. برای آنکه احتمال تولید آنچه به دنبالش هستیم افزایش پیدا کند، همچنین می‌توان یک یا چند نمونه را در «یادگیری یک یا چند نمونه» ارائه کرد.

روش یادگیری بی‌نمونه یا کم‌نمونه می‌تواند به میزان قابل توجهی زمان مورد نیاز برای ساخت یک محصول هوش مصنوعی را کاهش دهد. دلیلش این است که با استفاده از این شیوه به کم‌ترین میزان جمع‌آوری داده برای رسیدن به نتیجه نیاز خواهیم داشت.

اما با وجود قدرت و توان زیاد یادگیری بی‌نمونه، این نوع روش‌ها محدودیت‌هایی هم دارند. اول اینکه بسیاری از مدل‌های مولد نسبت به نحوه قالب‌بندی دستورات حساسیت زیادی دارند که این مسئله باعث ایجاد رشته جدیدی در هوش مصنوعی به نام «مهندسی طرح دستور» (Prompt Engineering) نیز شده است.

تاثیر پرامپت نویسی در هوش مصنوعی مولد

با ارائه یک طرح دستور یا همان پرامپت خوب و مطلوب، نتایج مناسب و مورد انتظار با یک یا ۲ بار امتحان کردن تحویل داده خواهد شد. اما این مسئله اغلب تنها به موارد ریزی مثل قرار دادن نقطه ویرگول یا سطر جدید در محل مناسب برمی‌گردد. اگرچه مهندسی طرح دستورموثر است، اما می‌تواند بسیار پیچیده هم باشد. طرح دستوری که روی یک مدل به خوبی کار می‌کند، ممکن است در مدل‌های دیگر نتیجه مطلوبی را تولید نکند.

یکی دیگر از محدودیت‌های طرح دستور بی‌نمونه یا کم‌نمونه برای سازمان‌ها این است که به کار گیری داده‌های اختصاصی، اغلب امتیازی کلیدی و حیاتی به حساب می‌آید. اگر مدل هوش مصنوعی مولد بزرگ باشد، تنظیم دقت آن برای داده‌های سازمانی می‌تواند به طور بازدارنده‌ای پر هزینه باشد. روش‌هایی مثل «تنظیم طرح دستور» (Prompt Tuning) و تطبیق دهنده‌ها به عنوان راهکارهای جایگزین پدید آمده‌اند. این روش‌های جدید این امکان را به وجود می‌آورند تا بتوان مدل را بدون نیاز به تنظیم میلیون‌ها یا میلیاردها پارامترش تطبیق داد.

این مدل‌ها به وسیله خلاصه کردن داده‌های کاربر و کاهش وظیفه مورد نظر به تعداد کمی پارامتر کار می‌کنند. سپس این پارامترها در داخل مدلی بزرگ و فریز شده درج می‌شوند. در این موقعیت، این پارامترها رفتار مدل را تنظیم می‌کنند، بدون آنکه به صورت مستقیم آن را تغییر دهند.

روش‌های تنظیم بهینه پارامتر به کاربران این امکان را می‌دهند تا بتوانند به اصطلاح با یک تیر ۲ نشان را مورد اصابت قرار دهند. می‌توان با داده‌های اختصاصی خودمان، از قدرت مدل گسترده از پیش آموزش دیده بهره‌مند شد. مهندسی پرامپت و تنظیم بهینه پارامترها به همراه یکدیگر مجموعه قدرتمندی از ابزارها را فراهم می‌کنند تا بتوان مدل را بدون صرف هزینه و زمان روی راهکارهای سنتی یادگیری عمیق به انجام آنچه وادار کرد که مورد انتظار ما است.

اهمیت مهندسی پرامپت

اخیراً نظارت انسانی به وسیله تطابق رفتار مدل‌ها با رفتار ما در حال شکل‌دهی به مدل‌های مولد است. منظور از تطبیق ایده، قابلیت شکل‌دهی پاسخ‌های مدل‌های مولد به گونه‌ای است که آن‌ها با آنچه می‌خواهیم ببینیم تطابق بیشتری داشته باشند. «یادگیری تقویتی از بازخوردهای انسانی» (RLHF) روشی تطبیقی است که توسط شرکت OpenAI به محبوبیت رسید و همین قابلیت است که توانایی شگفت‌انگیز مکالمه شبیه به انسان را برای ChatGPT امکان‌پذیر می‌کند.

در RLHF مدل هوش مصنوعی مولد مجموعه‌ای از گزینه‌های دوتایی دستور و پاسخ را خروجی می‌دهد و انسان‌ها بر اساس میزان درستی، به هر کدام رای می‌دهند. به وسیله یادگیری تقویتی، مدل به گونه‌ای تنظیم می‌شود که پاسخ‌های بیشتری را مشابه موارد با رای بالا تولید کند. این روش آموزش دادن، باعث ایجاد سیستم هوش مصنوعی می‌شود که خروجی آن مورد قبول انسان خواهد بود و انسان‌ها چنین خروجی را به عنوان متن گفت و گوی با کیفیت می‌پذیرند.

هوش مصنوعی مولد به کدام سو می رود؟

تا همین اواخر، روند غالب در هوش مصنوعی مولد، بحث مقیاس بوده است، با آموزش داده شدن مدل‌های بزرگ‌تر روی مجموعه داده‌های همواره در حال رشد، نتایج بهتر و بهتری حاصل می‌شود. با توجه به اینکه مدل‌های قبلی، برخلاف بزرگ‌تر بودن در اندازه یا آموزش بر روی داده‌های بیشتر، چه میزان موفقیت داشته‌اند، اکنون نمی‌توان تخمین زد که یک مدل جدید و بزرگ‌تر چقدر قدرتمند خواهد بود.

قوانین مقیاس‌بندی به محققان هوش مصنوعی اجازه می‌دهد تا در خصوص میزان بزرگی مدل پیش از سرمایه‌گذاری در منابع عظیم محاسباتی مورد نیاز برای آموزش دادن آن، بتوانند به طور مستدل گمانه‌زنی کنند. از جنبه معکوس، همچنان علاقه ادامه‌داری در خصوص قابلیت‌های نوظهوری وجود دارد که در زمان رسیدن مدل به اندازه‌ای مشخص پدید می‌آیند.

این فقط معماری مدل نیست که باعث ظهور این قابلیت‌ها و توانایی‌ها می‌شود، بلکه مقیاس آن است. از جمله مثال‌ها در این خصوص می‌توان به بارقه‌هایی از استدلال منطقی و توانایی پیروی از دستورات اشاره کرد. برخی از آزمایشگاه‌ها به آموزش دادن مدل‌هایی بزرگ‌تر از این هم ادامه می‌دهند و به دنبال چنین قابلیت‌های نوظهور هستند.

با این حال، شواهد اخیر نشان می‌دهند که روند تمایل به سمت توسعه مدل‌های بزرگ‌تر در حال تغییر است. بسیاری از گروه‌های تحقیقاتی نشان داده‌اند که مدل‌های کوچک‌تری که روی داده‌های اختصاصی‌تر آموزش داده می‌شوند، اغلب می‌توانند نسبت به مدل‌های بزرگ‌تر و همه‌منظوره بهتر عمل کنند.

برای مثال، محققان در دانشگاه استنفورد مدلی نسبتاً کوچک به نام «PubMedGPT 2.75B» را براساس انتزاع‌های زیست‌پزشکی آموزش و تمرین دادند و متوجه شدند که این مدل می‌تواند نسبت به یک مدل کلی‌‌گرا با همان اندازه، عملکرد بسیار بهتری داشته باشد. این تحقیقات نشان می‌دهد مدل‌های کوچک‌تر مخصوص دامنه‌ای خاص وقتی عملکرد خاص دامنه اهمیت داشته باشد، به احتمال زیاد انتخاب درستی به حساب می‌آیند.

آینده Generative Artificial intelligence

با ظهور حوزه در حال رشد «عصاره‌گیری مدل» (Model Distillation) پاسخ این سوال که آیا مدل‌های هوش مصنوعی مولد نسبتاً به زمان حال بزرگ‌تر خواهند شد یا کوچک‌تر، حتی بیشتر هم در هاله‌ای از ابهام قرار می‌گیرند. گروهی از استنفورد اخیراً سعی کرده‌اند قابلیت‌های مدل زبانی گسترده شرکت OpenAI یعنی GPT 3.5 را در چت‌بات خود به نام Alpaca عصاره‌گیری کنند که بر پایه مدل بسیار کوچک‌تری ساخته شده است.

محققان از GPT-3.5 خواستند هزاران دستورالعمل و پاسخ آن‌ها را تولید کند و از طریق «تنظیم و بهبود دستورالعمل» (Instruction Tuning) این داده‌های تولید شده به وسیله هوش مصنوعی GPT را برای القا کردن مهارت‌های مکالماتی مشابه GPT به آلپاکا به کار گرفتند. از آن زمان، دسته‌ای زا مدل‌های مشابه با نام‌هایی از جمله Vicuna و Dolly در اینترنت ظهور پیدا کرده‌اند.

رویکرد به کار رفته در Alpaca، اینکه آیا مدل‌های بزرگ و گسترده برای قابلیت‌های نوظهور ضروری هستند را زیر سوال می‌برد. در برخی از مدل‌ها مثل Dally 2 حتی مرحله خالص‌سازی هم انجام نمی‌شود و به جای آن از روش جمع‌آوری داده‌های دستور و پاسخ مستقیم از انسان استفاده می‌کنند. با کنار هم قرار دادن همه وقایع اخیر، اینطور به نظر می‌رسد که در حال ورود به دورانی هستیم که مدل‌های جمع و جورتر برای طیف وسیعی از موارد استفاده کاربردی مناسب‌تر خواهند بود.

آینده هوش مصنوعی مولد چگونه خواهد بود؟

عمق و سادگی خارق‌العاده ChatGPT نوید بخش به کار گیری گسترده هوش مصنوعی مولد است. برای کسب اطمینان از این مسئله، همچنین ChatGPT برخی از دشواری‌های پیشِ رو در عرضه ایمن و مسئولانه این فناوری را نشان داده است. اما این مشکلات اولیه در پیاده‌سازی الهام‌بخش تحقیقات بوده‌اند و باعث شده‌اند ابزارهای بهتری برای شناسایی متن‌ها، تصاویر و ویدیوهای تولید شده توسط هوش مصنوعی ایجاد شوند. صنعت و جامعه همچنین ابزارهای بهتری را برای ردیابی منشاء اطلاعات خواهند ساخت تا بتوان هوش مصنوعی‌های قابل اعتماد‌تری را خلق کرد.

علاوه بر این، پیشرفت‌ها در پلتفرم‌های توسعه هوش مصنوعی به افزایش سرعت تحقیقات و توسعه قابلیت‌های هوش مصنوعی مولد برای متن، تصاویر، ویدیو، محتوای ۳ بُعدی، دارو، زنجیره تامین، تدارکات و فرایندهای کسب و کار در آینده دامن خواهد زد. به همان اندازه که ابزارهای جدید مبتنی بر Generative AI خوب و با کیفیت هستند، مهم‌ترین تأثیر هوش مصنوعی مولد، تعبیه مستقیم قابلیت‌های آن در نسخه‌هایی از ابزارهایی است که پیش از این استفاده می‌کردیم.

ابزارهای بررسی گرامر بهتر و بهتر خواهند شد. ابزارهای طراحی به طور یکپارچه پیشنهادهای کاربردی‌تری را مستقیماً در جریان‌های کاری تعبیه خواهند کرد. ابزارهای تمرینی و یادگیری قادر خواهند بود تا به صورت خودکار بهترین راهکارها را در بخشی از سازمان شناسایی کنند تا بتوانند کمک کنند سایر بخش‌ها به طور بهینه‌تری آموزش داده شوند. این موارد تنها بخشی از راه‌هایی هستند که در طی آن‌ها هوش مصنوعی مولد نحوه کار کردن ما را متحول خواهند ساخت.

پرسش های رایج پیرامون هوش مصنوعی مولد

در ادامه این بخش، برخی از سوالات پر تکرار کاربران پیرامون هوش مصنوعی مولد مطرح و پاسخ داده شده‌اند.

چه کسی هوش مصنوعی مولد را ابداع کرد؟

جوزف ویزنبام اولین هوش مصنوعی مولد را در سال ۱۹۶۰ به عنوان بخشی از چت‌بات الیزا ابداع کرد. ایان گودفلو در سال ۲۰۱۴ شبکه‌های مولد متخاصم را برای تولید تصاویری حاوی افرادی با ظاهر واقعی و با صدایی واقع‌گرایانه ارائه داد. تحقیقات ادامه‌دار در خصوص مدل‌های زبانی بزرگ یا همان LLMها از سوی شرکت OpenAI و گوگل، علاقه و اشتیاق اخیر در این خصوص را شعله‌ور ساخت که به خلق و ارائه ابزارهایی مثل ChatGPT، گوگل بارد و Dall-E انجامید.

مخترع هوش مصنوعی مولد کیست

هوش مصنوعی مولد چطور می‌تواند جایگزین مشاغل افراد شود؟

هوش مصنوعی مولد این پتانسیل را دارد که جایگزین طیف گسترده‌ای از مشاغل شود که برخی از این مشاغل در ادامه فهرست شده‌اند.

  • نوشتن مشخصات محصول
  • ایجاد کپی بازاریابی
  • تولید محتوای ساده و پایه وب
  • راه‌اندازی فروش تعاملی
  • پاسخگویی به سوالات مشتریان
  • ایجاد گرافیک‌های صفحات وب

برخی از شرکت‌ها به دنبال فرصت‌هایی برای جایگزینی هوش مصنوعی با انسان خواهند بود، در حالی که برخی دیگر از سازمان‌ها به دنبال افزودن و بهبود نیروی کاری فعلی خود به وسیله هوش مصنوعی هستند.

چطور می توان یک مدل هوش مصنوعی مولد ساخت؟

ساخت یک مدل هوش مصنوعی مولد به این شکل آغاز می‌شود که به طور بهینه بازنمودی از آنچه می‌خواهیم تولید کنیم کدگذاری شود. برای مثال، یک مدل هوش مصنوعی مولد برای متن ممکن است اینطور شروع شود که راهی برای بازنمایی کلمه‌ها به عنوان بردارهایی پیدا کنیم که شباهت میان کلمه‌های استفاده شده در یک جمله یا آن‌هایی که معنای یکسانی دارند را با یکدیگر نشان می‌دهند. پیشرفت‌های اخیر در تحقیقات مدل‌های هوش مصنوعی گسترده کمک کرده است تا فرایند یکسانی برای بازنمایی الگوهای پیدا شده در تصاویر، صدا، پروتئین‌ها، DNA، دارو و طراحی ۳ بُعدی در صنعت و حوزه‌های تخصصی مختلف پیاده‌سازی شود.

چگونه می توان یک مدل هوش مصنوعی مولد را آموزش داد؟

لازم است مدل هوش مصنوعی مولد برای کاربرد خاصی آموزش داده شود. پیشرفت‌های اخیر در زمینه مدل‌های زبانی گسترده نقطه آغاز ایده‌آلی را به منظور سفارشی‌سازی کاربردها برای موارد استفاده مختلف رقم زده است. برای مثال، مدل محبوب GPT توسعه داده شده به وسیله شرکت OpenAI برای نوشتن متن، تولید کد و ایجاد تصاویری بر اساس توصیف‌های نوشته شده مورد استفاده قرار گرفته است.

آموزش مدل، تنظیم پارامترهای آن برای موارد استفاده متفاوت و سپس تنظیم و بهبود نتایج بر اساس مجموعه‌ای از داده‌های آموزشی داده شده را شامل می‌شود. برای مثال، یک مرکز تماس می‌تواند چت‌باتی را بر اساس نوع سوالات دریافتی کارگذاران خدمات از انواع مشتریان مختلف و پاسخ‌هایی آموزش دهد که آن‌ها در ازای هر سوال به مشتریان ارائه می‌دهند. یک اپلیکیشن تولید تصاویر در تمایز با متن، ممکن است با برچسب‌هایی کار را شروع کند که توصیف کننده محتوا و استایل تصاویر برای آموزش مدل به منظور تولید تصاویر جدید هستند.

جمع‌بندی

هوش مصنوعی مولد به منظور ایجاد قابلیت‌های جدید و خلق ارزش برای سازمان‌ها پتانسیل بالایی دارد. اگرچه، می‌تواند خطراتی قانونی، مالی یا حیثیتی را هم به دنبال داشته باشد. بسیاری از مدل‌هیا مولد، شامل مدل‌هایی که در ChatGPT استفاده می‌شوند، می‌توانند اطلاعاتی را خروجی بدهند که معتبر به نظر می‌رسند، اما حقیقت ندارند (که گاهی چنین اطلاعاتی را توهمات می‌نامیم) یا دارای ایراد هستند و جانبدارانه هستند.

مدل‌های هوش مصنوعی مولد همچنین ممکن است به طور غیر عمد اطلاعاتی را به عنوان داده‌های آموزشی دریافت کنند که شخصی یا دارای حق نشر هستند و بعدها همان اطلاعات را به عنوان خروجی ارائه دهند که این باعث می‌شود چالش‌های منحصربفردی پیرامون قوانین حریم خصوصی و مالکیت معنوی پدید آید.

بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
IBMTechTarget
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *