ساخت عکس با هوش مصنوعی با ۱۰ سایت کاربردی + آموزش نحوه استفاده
فناوری «هوش مصنوعی» (Artificial Intelligence) یا همان AI، قابلیتهای شگفتانگیز و متنوعی را برایمان فراهم کرده است. این امکانات در قالب ابزارهایی میتوانند در بسیاری از موارد و موضوعات کمک حال ما باشند. یکی از این موارد، توانایی تولید تصاویر واقع گرایانه در سَبکهای مختلف، با شرح دادن موضوع یا جزئیات آن در قالب پرامپت است. در این مطلب از مجله فرادرس خواهیم گفت که نحوه ساخت عکس با هوش مصنوعی چگونه است و همچنین چندین وبسایت کاربردی در این زمینه را به شما معرفی خواهیم کرد.
نحوه ساخت عکس با هوش مصنوعی چگونه است؟
اگر بخواهیم کمی تخصصیتر به موضوع ساخت عکس با هوش مصنوعی نگاه کنیم، باید بگوییم که سازندههای تصویر هوش مصنوعی، از شبکههای عصبی آموزشدیده برای تولید یک تصویر با AI، بهره میبرند. این سازندهها بر مبنای ورودی متنی که به زبان طبیعی - نظیر انگلیسی یا فارسی - در اختیارش قرار دادهایم، قابلیت ایجاد تصاویر واقعگرایانه و مبتکرانه را دارند. موردی که این سیستمها را بهطور فوقالعادهای برجسته میسازد، تواناییهایشان در تلفیق سَبکها، مفاهیم و خصوصیات برای ساخت عکسهای هنرمندانه و مرتبط با موضوع است. تمامی این قابلیتها در حال حاضر بهوسیله «هوش مصنوعی مولد» (Generative Artificial Intelligence) امکانپذیر شده است.
معرفی سایت های ساخت عکس با هوش مصنوعی
در این بخش، برخی از وب سایتهای قابل دسترس برای ساخت عکس با هوش مصنوعی را معرفی کردهایم.
ساخت عکس رایگان با هوش مصنوعی بینگ
قابلیت ساخت تصویر با هوش مصنوعی بهوسیله بینگ، رایگان است و برای دسترسی به آن نیز لزومی به استفاده از مرورگر Edge وجود ندارد.
بهدلیل گسترش استفاده از ابزارهای گوناگون هوش مصنوعی در سال اخیر، رشد سریع توسعه هوش مصنوعی مولد را در بسیاری از موضوعات مشاهده کردهایم. انتشار ChatGPT بهوسیله OpenAI سبب شد تا گوگل، مایکروسافت و متا هم ابزارها و چتباتهای AI خود را ارائه دهند.
همسو با این قضیه، مایکروسافت یک مولد تصویر AI را در Bing منتشر کرد که مجهز به یکی از آخرین پروژههای شرکت OpenAI یعنی DALL-E3 است. بدین ترتیب امکان ایجاد تصویری با کیفیت بهتر، بهبود جزئیات درون تصاویر و پردازش دقیقتر پرامپتها را نسبت به نسخه پیشین DALL-E که توسط Bing بهکار گرفته شده بود، فراهم میکند.
برای بهکارگیری سازنده تصویر Bing میتوانیم از چت Bing یا بهطور مستقیم از طریق سایت استفاده کنیم. پس از باز کردن این وبسایت «+»، روی گزینه Join & Create کلیک کرده و وارد حساب مایکروسافت خود میشویم.
اکنون میتوانیم پرامپت خود را - که توصیفی از عکس مورد نظر است را با بیان جزئیات - در کادر ورودی وارد و روی دکمه Create کلیک کنیم. پس از آماده شدن تصاویر AI میتوانیم نتایج را بررسی کنیم. سازنده تصویر Bing و DALL-E بهطور معمول به ازای هر پرامپتی که وارد میکنیم، ۴ تصویر تولیدشده را نمایش میدهند که میتوانیم آنها را روی سیستم خود ذخیره کنیم و برای اهداف دلخواه خود بهکار ببریم. ممکن است که نتایج همیشه آنطور که میخواهیم تولید نشوند و این ابزارهای رایگان به اندازهای پیشرفته نباشند که تصاویری واقعی و بدون مشکل را ایجاد کنند. بههمین دلیل باید انتظار وجود برخی خطاها در جزئیات تصاویر نظیر انگشتهای دست انسان، محل قرارگیری چشمها یا کلیدهای روی کیبرد کامپیوتر و غیره را داشته باشیم.
از ویژگیهای متمایز کننده تولید تصویر با هوش مصنوعی Bing میتوانیم به پشتیبانی آن از زبان فارسی اشاره کنیم. بهطوریکه این امکان برایمان فراهم شده است تا پرامپت خود را به زبان فارسی در کادر مربوطه وارد کرده و پس از کلیک روی دکمه Create، تصاویری با مضمون مورد نظر به کمک AI تولید شوند. بهعنوان مثال با وارد کردن پرامپت «یک استاد در کلاس درس که به دانشجویان خود تحلیل داده ها را آموزش می دهد» در این ابزار AI، نتیجهای مشابه آنچه در ادامه آوردهایم برایمان تولید شده است. لازم به ذکر است که این تصاویر منحصر به فرد هستند یعنی در هر مرتبه با پرامپتی یکسان، تصاویری متفاوت خواهیم داشت.
در این مثال از پرامپت کوتاهی استفاده کردیم. در صورتیکه بخواهیم تصویری دقیقتر با آنچه در ذهن داریم تولید شود میبایست پرامپتی با جزئیات بیشتر برای این ابزار سازنده تصویر AI فراهم کنیم.
ساخت عکس با هوش مصنوعی سرویس Stable Diffusion از Clipdrop
وبسایت Clipdrop، مجموعهای شگفتانگیز از ابزارهای AI را در اختیار کاربران قرار داده است.
در ادامه برخی از سرویسهای این وبسایت را فهرست کردهایم.
- Stable Diffusion XL: جهشی در ایجاد تصاویر به کمک AI محسوب میشود.
- Uncrop: امکان افزایش ابعاد تصویر.
- Reimagine XL: ایجاد نسخههای متفاوت از یک تصویر.
- Stable Doodle: تبدیل طرحهای ساده ما به تصاویری واقعی.
- Remove Background: حذف پسزمینه عکس.
- Cleanup: حذف اشیا، افراد، متن و غیره از عکس.
- Image Upscaler: مواردی مانند کاهش نویز، افزایش کیفیت و اندازه تصویر با این سرویس امکانپذیر شده است.
- Relight: نورپردازی تصویر.
- Text Remover: حذف نوشتههای موجود در عکس.
Stable Diffusion XL یکی از سرویسهای Clipdrop میباشد که میتوانیم از آن برای تولید عکس با هوش مصنوعی کمک بگیریم. برای استفاده از این ابزار، در صفحه اصلی وبسایت Clipdrop روی گزینه Stable Diffusion XL کلیک میکنیم تا این سرویس را مشابه آنچه در ادامه آوردهایم، مشاهده کنیم.
بهطور مثال، فرض کنید میخواهیم تصویری با مضمون «پسر بچهای که روی چمن با اسباب بازی خود بازی میکند» تولید کنیم. برای این منظور پرامپت «A little boy playing with his toy on the grass» را در کادر مربوطه سرویس Stable Diffusion وارد کردیم و پس از کلیک روی دکمه Generate، این سیستم تصاویری مشابه آنچه در ادامه آوردهایم را بهکمک AI برایمان تولید کرد. همچنین با کلیک روی دکمه «+» در کنار ۴ تصویری تولیدی، میتوانیم از این ابزار بخواهیم تا ۴ مورد دیگر را برایمان تولید کند.
ساخت عکس با هوش مصنوعی Midjourney
هوش مصنوعی Midjourney «+» بهدلیل کیفیت عالی تصویر تولیدی، یکی از پیشتازان تولید عکس با هوش مصنوعی است. این سازنده تصویر AI، عکسها را بر مبنای توصیفهای ارائه شده و با دقت زیادی با روشهای یادگیری ماشین تولید میکند. بدینترتیب میتوانیم عکسهایی را با این هوشمصنوعی تولید کنیم که شبیه به سبک یک هنرمند یا دوره تاریخی معینی باشند. موردی که باید به آن توجه کنیم این است که دستور داده شده به هوش مصنوعی - که به آن «پرامپت» (Prompt) نیز میگویند - میبایست تا حد امکان دقیق باشد تا نتیجه مطلوب طبق انتظار تولید شود.
افزون بر این، Midjourney امکان تغییر اندازه عکسها یا ایجاد نسخههای مختلف از یک تصویر را نیز فراهم میکند. با این وجود، Midjourney تنها از طریق رابط کاربری Discord قابل استفاده است. همچنین جدای از رابط کاربری پیچیده، خصوصیاتی دیگری نیز دارد که مورد انتقاد واقع شده است. عکسهایی که از این طریق با هوش مصنوعی تولید میکنیم برای سایر کاربران Discord نیز قابل مشاهده و استفاده مجدد هستند. بههمین دلیل، حقوق مربوط به عکسها را نخواهیم داشت. افزون بر موارد بیان شده، تولید عکس با هوش مصنوعی میدجِرنی رایگان نیست و مستلزم پرداخت حق اشتراک ماهانه است.
مزایا و معایب Midjourney
جدول آورده شده در زیر، مزایا و معایب وب سایت Midjourney برای تولید عکس با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت تصویر از متن نوشته شده با زبان طبیعی | فاقد نسخه رایگان |
کیفیت بسیار خوب عکسهای تولیدی | رابط کاربری پیچیده و گیج کننده |
ابزارهای متنوع برای ویرایش تصویر | عمومی بودن تصاویر ساخته شده با AI |
قابل دسترس تنها از طریق رابط دیسکورد |
ساخت عکس با هوش مصنوعی ArtSmart.ai
با استفاده از ArtSmart.ai «+» میتوانیم عکسهای هوش مصنوعی شگفتانگیزی ایجاد کنیم. ArtSmart.ai برخلاف سایر تولیدکنندههای عکس هوش مصنوعی، بر مبنای فناوری «انتشار پایدار» (Stable Diffusion) - از مدلهای یادگیری عمیق و متن به عکس - عمل میکند. این مدل، یک تولیدکننده یادگیری عمیق برای تبدیل متن به عکسهای باکیفیت - که واقعی و منحصر به فرد به نظر میآیند - است. البته این مورد تنها چیزی نیست که باعث تمایز ArtSmart.ai از سایر برنامههای تولیدکننده تصاویر هوش مصنوعی میشود. این ابزار همچنین افزون بر دارا بودن رابطی کاربرپسند، قابلیت استفاده آسانی را در اختیار کاربران قرار میدهد.
افزون بر این، ArtSmart قابلیت بهکارگیری تنظیمات پیشفرض نظیر سَبکهای هنری، زاویه دوربین و آب و هوا را فراهم میکند. با این وجود، شاهد برخی محدودیتها نیز در آن هستیم. بهطور مثال، برای تولید عکس با هوش مصنوعی، نیاز است تا متن ورودی بسیار دقیقی را ارائه دهیم. اگر متن ورودی خیلی کلی باشد، تصویر تولیدشده با AI با چیزی که در ذهن داریم ممکن است فرق داشته باشد. با این تفاصیل، نسخه آزمایشی این سازنده عکس هوش مصنوعی، امکان تولید ۵۰ عکس را بهصورت رایگان برایمان فراهم میکند.
ساخت عکس با هوش مصنوعی DreamStudio
سرویس DreamStudio «+» که بهوسیله Stability.ai ارائه شده است نیز بر مبنای Stable Diffusion عمل میکند. از خصوصیات مهم این ابزار میتوان به توسعه مستمر و پیشرفتهای مداوم آن اشاره کرد. در حال حاضر میتوانیم از این سرویس برای تولید لوگوی شرکت، بنرها و تصاویر برای کمپینهای بازاریابی و غیره استفاده کنیم. نکته برجسته دیگر DreamStudio، کاربرپسند بودن آن است، به این دلیل که دارای رابط کاربری واضح و طراحی سادهای است. DreamStudio برخلاف دیگر مولدهای عکس هوش مصنوعی، در ابتدای کار، سبکهای پیشفرض یا راهنمایی را فراهم نمیکند. بههمین دلیل، بهکارگیری این ابزار بیشتر برای کاربران پیشرفته توصیه میشود.
مزایا و معایب DreamStudio
مزایا و معایب وب سایت DreamStudio برای تولید عکس با هوش مصنوعی را در قالب جدول زیر آوردهایم.
مزایا | معایب |
ساخت تصویر از متن نوشته شده با زبان طبیعی | دارای سبکهای پیشفرض اندک |
کیفیت بسیار خوب عکسهای تولید شده | عملکردهای محدود نسبت به سایر تولیدکنندههای عکس هوش مصنوعی |
رابط کاربری ساده | برای افراد مبتدی مناسب نیست. |
توسعه و بهبودهای مستمر بههمراه ویژگیهای جدید | مستلزم خرید اعتبار |
ساخت عکس با هوش مصنوعی DALL-E 2
ابزار DALL-E 2 «+» هم مانند ChatGPT، محصول شرکت OpenAI و یکی سایتهای ساخت عکس با هوش مصنوعی بهشمار میرود که میتوانیم از آدرس «+» به آن دسترسی داشته باشیم.
نام DALL-E در واقع، تلفیقی از Dali - سوررئالیست مشهور، سالوادور دالی - و WALL.E - ربات محبوب انیمیشنهای دیزنی - است که آمیختن هنر با هوش مصنوعی را نشان میدهد.