ساخت عکس با هوش مصنوعی با ۱۰ سایت کاربردی + آموزش نحوه استفاده
فناوری «هوش مصنوعی» (Artificial Intelligence) یا همان AI، قابلیتهای شگفتانگیز و متنوعی را برایمان فراهم کرده است. این امکانات در قالب ابزارهایی میتوانند در بسیاری از موارد و موضوعات کمک حال ما باشند. یکی از این موارد، توانایی تولید تصاویر واقع گرایانه در سَبکهای مختلف، با شرح دادن موضوع یا جزئیات آن در قالب پرامپت است. در این مطلب از مجله فرادرس خواهیم گفت که نحوه ساخت عکس با هوش مصنوعی چگونه است و همچنین چندین وبسایت کاربردی در این زمینه را به شما معرفی خواهیم کرد.
نحوه ساخت عکس با هوش مصنوعی چگونه است؟
اگر بخواهیم کمی تخصصیتر به موضوع ساخت عکس با هوش مصنوعی نگاه کنیم، باید بگوییم که سازندههای تصویر هوش مصنوعی، از شبکههای عصبی آموزشدیده برای تولید یک تصویر با AI، بهره میبرند. این سازندهها بر مبنای ورودی متنی که به زبان طبیعی - نظیر انگلیسی یا فارسی - در اختیارش قرار دادهایم، قابلیت ایجاد تصاویر واقعگرایانه و مبتکرانه را دارند. موردی که این سیستمها را بهطور فوقالعادهای برجسته میسازد، تواناییهایشان در تلفیق سَبکها، مفاهیم و خصوصیات برای ساخت عکسهای هنرمندانه و مرتبط با موضوع است. تمامی این قابلیتها در حال حاضر بهوسیله «هوش مصنوعی مولد» (Generative Artificial Intelligence) امکانپذیر شده است.
معرفی سایت های ساخت عکس با هوش مصنوعی
در این بخش، برخی از وب سایتهای قابل دسترس برای ساخت عکس با هوش مصنوعی را معرفی کردهایم.
ساخت عکس رایگان با هوش مصنوعی بینگ
قابلیت ساخت تصویر با هوش مصنوعی بهوسیله بینگ، رایگان است و برای دسترسی به آن نیز لزومی به استفاده از مرورگر Edge وجود ندارد.
بهدلیل گسترش استفاده از ابزارهای گوناگون هوش مصنوعی در سال اخیر، رشد سریع توسعه هوش مصنوعی مولد را در بسیاری از موضوعات مشاهده کردهایم. انتشار ChatGPT بهوسیله OpenAI سبب شد تا گوگل، مایکروسافت و متا هم ابزارها و چتباتهای AI خود را ارائه دهند.
همسو با این قضیه، مایکروسافت یک مولد تصویر AI را در Bing منتشر کرد که مجهز به یکی از آخرین پروژههای شرکت OpenAI یعنی DALL-E3 است. بدین ترتیب امکان ایجاد تصویری با کیفیت بهتر، بهبود جزئیات درون تصاویر و پردازش دقیقتر پرامپتها را نسبت به نسخه پیشین DALL-E که توسط Bing بهکار گرفته شده بود، فراهم میکند.
برای بهکارگیری سازنده تصویر Bing میتوانیم از چت Bing یا بهطور مستقیم از طریق سایت استفاده کنیم. پس از باز کردن این وبسایت «+»، روی گزینه Join & Create کلیک کرده و وارد حساب مایکروسافت خود میشویم.
اکنون میتوانیم پرامپت خود را - که توصیفی از عکس مورد نظر است را با بیان جزئیات - در کادر ورودی وارد و روی دکمه Create کلیک کنیم. پس از آماده شدن تصاویر AI میتوانیم نتایج را بررسی کنیم. سازنده تصویر Bing و DALL-E بهطور معمول به ازای هر پرامپتی که وارد میکنیم، ۴ تصویر تولیدشده را نمایش میدهند که میتوانیم آنها را روی سیستم خود ذخیره کنیم و برای اهداف دلخواه خود بهکار ببریم. ممکن است که نتایج همیشه آنطور که میخواهیم تولید نشوند و این ابزارهای رایگان به اندازهای پیشرفته نباشند که تصاویری واقعی و بدون مشکل را ایجاد کنند. بههمین دلیل باید انتظار وجود برخی خطاها در جزئیات تصاویر نظیر انگشتهای دست انسان، محل قرارگیری چشمها یا کلیدهای روی کیبرد کامپیوتر و غیره را داشته باشیم.
از ویژگیهای متمایز کننده تولید تصویر با هوش مصنوعی Bing میتوانیم به پشتیبانی آن از زبان فارسی اشاره کنیم. بهطوریکه این امکان برایمان فراهم شده است تا پرامپت خود را به زبان فارسی در کادر مربوطه وارد کرده و پس از کلیک روی دکمه Create، تصاویری با مضمون مورد نظر به کمک AI تولید شوند. بهعنوان مثال با وارد کردن پرامپت «یک استاد در کلاس درس که به دانشجویان خود تحلیل داده ها را آموزش می دهد» در این ابزار AI، نتیجهای مشابه آنچه در ادامه آوردهایم برایمان تولید شده است. لازم به ذکر است که این تصاویر منحصر به فرد هستند یعنی در هر مرتبه با پرامپتی یکسان، تصاویری متفاوت خواهیم داشت.
در این مثال از پرامپت کوتاهی استفاده کردیم. در صورتیکه بخواهیم تصویری دقیقتر با آنچه در ذهن داریم تولید شود میبایست پرامپتی با جزئیات بیشتر برای این ابزار سازنده تصویر AI فراهم کنیم.
ساخت عکس با هوش مصنوعی سرویس Stable Diffusion از Clipdrop
وبسایت Clipdrop، مجموعهای شگفتانگیز از ابزارهای AI را در اختیار کاربران قرار داده است.
در ادامه برخی از سرویسهای این وبسایت را فهرست کردهایم.
- Stable Diffusion XL: جهشی در ایجاد تصاویر به کمک AI محسوب میشود.
- Uncrop: امکان افزایش ابعاد تصویر.
- Reimagine XL: ایجاد نسخههای متفاوت از یک تصویر.
- Stable Doodle: تبدیل طرحهای ساده ما به تصاویری واقعی.
- Remove Background: حذف پسزمینه عکس.
- Cleanup: حذف اشیا، افراد، متن و غیره از عکس.
- Image Upscaler: مواردی مانند کاهش نویز، افزایش کیفیت و اندازه تصویر با این سرویس امکانپذیر شده است.
- Relight: نورپردازی تصویر.
- Text Remover: حذف نوشتههای موجود در عکس.
Stable Diffusion XL یکی از سرویسهای Clipdrop میباشد که میتوانیم از آن برای تولید عکس با هوش مصنوعی کمک بگیریم. برای استفاده از این ابزار، در صفحه اصلی وبسایت Clipdrop روی گزینه Stable Diffusion XL کلیک میکنیم تا این سرویس را مشابه آنچه در ادامه آوردهایم، مشاهده کنیم.
بهطور مثال، فرض کنید میخواهیم تصویری با مضمون «پسر بچهای که روی چمن با اسباب بازی خود بازی میکند» تولید کنیم. برای این منظور پرامپت «A little boy playing with his toy on the grass» را در کادر مربوطه سرویس Stable Diffusion وارد کردیم و پس از کلیک روی دکمه Generate، این سیستم تصاویری مشابه آنچه در ادامه آوردهایم را بهکمک AI برایمان تولید کرد. همچنین با کلیک روی دکمه «+» در کنار ۴ تصویری تولیدی، میتوانیم از این ابزار بخواهیم تا ۴ مورد دیگر را برایمان تولید کند.
ساخت عکس با هوش مصنوعی Midjourney
هوش مصنوعی Midjourney «+» بهدلیل کیفیت عالی تصویر تولیدی، یکی از پیشتازان تولید عکس با هوش مصنوعی است.
این سازنده تصویر AI، عکسها را بر مبنای توصیفهای ارائه شده و با دقت زیادی با روشهای یادگیری ماشین تولید میکند. بدینترتیب میتوانیم عکسهایی را با این هوشمصنوعی تولید کنیم که شبیه به سبک یک هنرمند یا دوره تاریخی معینی باشند. موردی که باید به آن توجه کنیم این است که دستور داده شده به هوش مصنوعی - که به آن «پرامپت» (Prompt) نیز میگویند - میبایست تا حد امکان دقیق باشد تا نتیجه مطلوب طبق انتظار تولید شود.
افزون بر این، Midjourney امکان تغییر اندازه عکسها یا ایجاد نسخههای مختلف از یک تصویر را نیز فراهم میکند. با این وجود، Midjourney تنها از طریق رابط کاربری Discord قابل استفاده است. همچنین جدای از رابط کاربری پیچیده، خصوصیاتی دیگری نیز دارد که مورد انتقاد واقع شده است. عکسهایی که از این طریق با هوش مصنوعی تولید میکنیم برای سایر کاربران Discord نیز قابل مشاهده و استفاده مجدد هستند. بههمین دلیل، حقوق مربوط به عکسها را نخواهیم داشت. افزون بر موارد بیان شده، تولید عکس با هوش مصنوعی میدجِرنی رایگان نیست و مستلزم پرداخت حق اشتراک ماهانه است.
مزایا و معایب Midjourney
جدول آورده شده در زیر، مزایا و معایب وب سایت Midjourney برای تولید عکس با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت تصویر از متن نوشته شده با زبان طبیعی | فاقد نسخه رایگان |
کیفیت بسیار خوب عکسهای تولیدی | رابط کاربری پیچیده و گیج کننده |
ابزارهای متنوع برای ویرایش تصویر | عمومی بودن تصاویر ساخته شده با AI |
قابل دسترس تنها از طریق رابط دیسکورد |
ساخت عکس با هوش مصنوعی ArtSmart.ai
با استفاده از ArtSmart.ai «+» میتوانیم عکسهای هوش مصنوعی شگفتانگیزی ایجاد کنیم. ArtSmart.ai برخلاف سایر تولیدکنندههای عکس هوش مصنوعی، بر مبنای فناوری «انتشار پایدار» (Stable Diffusion) - از مدلهای یادگیری عمیق و متن به عکس - عمل میکند. این مدل، یک تولیدکننده یادگیری عمیق برای تبدیل متن به عکسهای باکیفیت - که واقعی و منحصر به فرد به نظر میآیند - است. البته این مورد تنها چیزی نیست که باعث تمایز ArtSmart.ai از سایر برنامههای تولیدکننده تصاویر هوش مصنوعی میشود. این ابزار همچنین افزون بر دارا بودن رابطی کاربرپسند، قابلیت استفاده آسانی را در اختیار کاربران قرار میدهد.
افزون بر این، ArtSmart قابلیت بهکارگیری تنظیمات پیشفرض نظیر سَبکهای هنری، زاویه دوربین و آب و هوا را فراهم میکند. با این وجود، شاهد برخی محدودیتها نیز در آن هستیم. بهطور مثال، برای تولید عکس با هوش مصنوعی، نیاز است تا متن ورودی بسیار دقیقی را ارائه دهیم. اگر متن ورودی خیلی کلی باشد، تصویر تولیدشده با AI با چیزی که در ذهن داریم ممکن است فرق داشته باشد. با این تفاصیل، نسخه آزمایشی این سازنده عکس هوش مصنوعی، امکان تولید ۵۰ عکس را بهصورت رایگان برایمان فراهم میکند.
ساخت عکس با هوش مصنوعی DreamStudio
سرویس DreamStudio «+» که بهوسیله Stability.ai ارائه شده است نیز بر مبنای Stable Diffusion عمل میکند. از خصوصیات مهم این ابزار میتوان به توسعه مستمر و پیشرفتهای مداوم آن اشاره کرد. در حال حاضر میتوانیم از این سرویس برای تولید لوگوی شرکت، بنرها و تصاویر برای کمپینهای بازاریابی و غیره استفاده کنیم. نکته برجسته دیگر DreamStudio، کاربرپسند بودن آن است، به این دلیل که دارای رابط کاربری واضح و طراحی سادهای است. DreamStudio برخلاف دیگر مولدهای عکس هوش مصنوعی، در ابتدای کار، سبکهای پیشفرض یا راهنمایی را فراهم نمیکند. بههمین دلیل، بهکارگیری این ابزار بیشتر برای کاربران پیشرفته توصیه میشود.
مزایا و معایب DreamStudio
مزایا و معایب وب سایت DreamStudio برای تولید عکس با هوش مصنوعی را در قالب جدول زیر آوردهایم.
مزایا | معایب |
ساخت تصویر از متن نوشته شده با زبان طبیعی | دارای سبکهای پیشفرض اندک |
کیفیت بسیار خوب عکسهای تولید شده | عملکردهای محدود نسبت به سایر تولیدکنندههای عکس هوش مصنوعی |
رابط کاربری ساده | برای افراد مبتدی مناسب نیست. |
توسعه و بهبودهای مستمر بههمراه ویژگیهای جدید | مستلزم خرید اعتبار |
ساخت عکس با هوش مصنوعی DALL-E 2
ابزار DALL-E 2 «+» هم مانند ChatGPT، محصول شرکت OpenAI و یکی سایتهای ساخت عکس با هوش مصنوعی بهشمار میرود که میتوانیم از آدرس «+» به آن دسترسی داشته باشیم.
نام DALL-E در واقع، تلفیقی از Dali - سوررئالیست مشهور، سالوادور دالی - و WALL.E - ربات محبوب انیمیشنهای دیزنی - است که آمیختن هنر با هوش مصنوعی را نشان میدهد.
با این ابزار هوش مصنوعی، افزون برا امکان تولید تصاویر AI، میتوانیم آنها را ویرایش هم کنیم. برای ویرایش میتوانیم از خصوصیات اضافی کمک بگیریم. مواردی نظیر «تکمیل بیرون تصاویر» (Outpainting) - بهطور مثال، تصویری را UnCrop کنیم - «تکمیل درون تصاویر» (Inpainting) - مثل ترمیم تصاویری که بخشی از آنها از بین رفته است - و همچنین ایجاد نسخههای مختلفی از یک تصویر که از نظر سبک و رنگ و غیره متفاوت هستند. همچنین میتوانیم با استفاده از یک API به DALL-E 2 متصل شویم یا اینکه بهصورت مستقیم با OpenAI Labs به نرمافزار دسترسی داشته باشیم.
برخلاف سایر سرویسهای تولید عکس با هوش مصنوعی، برای تولید تصاویر میتوانیم از مواردی بیش از کلمات استفاده کنیم. در Dall-E 2 این امکان وجود دارد تا تصویری بهعنوان تصویر مرجع انتخاب شود. با این وجود، تنظیمات اضافی نظیر تغییر نسبت ابعاد عکس در دسترس نمیباشد. بهکارگیری DALL-E 2 همچنین مستلزم پرداخت هزینه ماهانه است.
مزایا و معایب DALL-E 2
مزایا و معایب وب سایت DALL-E 2 برای ساخت عکس با هوش مصنوعی را در قالب جدول زیر آوردهایم.
مزایا | معایب |
ساخت عکس از متن نوشته شده با زبان طبیعی | وابستگی شدید نتایج به دقت توصیف در پرامپت |
کیفیت بسیار خوب عکسهای تولید شده | گران بودن و مستلزم خرید اعتبار |
امکان ویرایش عکسها | |
استفاده آزادانه از عکسهای تولید شده |
DALL-E 2، نسخه توسعه یافتهای از DALL-E است که در اوایل ۱۴۰۱ (۲۰۲۲ میلادی) عرضه شد و بر مبنای معماری پیشرفتهای پدید آمده که یک مدل Diffusion - از مدلهای یادگیری ماشین - را بهکار میگیرد و به ادغام اطلاعاتی از CLIP پرداخته و داده های CLIP را یکپارچه میکند. CLIP (Contrastive Language-Image Pre-training) که توسط OpenAI توسعه یافته است، مدلی است که بازنمایی های بصری و متنی را به هم متصل میکند. DALL-E 2 از مدل GPT-3 برای تفسیر اعلانهای زبان طبیعی، درست همانند نسخه قبلی خود، استفاده میکند.
ساخت عکس با هوش مصنوعی Neuroflash
ابزار Neuroflash «+» نه تنها تولیدکننده متن محبوبی است بلکه برای ساخت عکس با هوش مصنوعی نیز میتواند مورد استفاده قرار گیرد. طراحی ساده آن باعث شده است تا این تولیدکننده عکس، بهطور ویژهای کاربر پسند باشد. با این وجود، تلاشهای کاربر به منظور یافتن گزینههای پیشرفته نظیر قابلیت ویرایش عکس بهطور مستقیم در اپلیکیشن یا نمایش آن در وضوح - رزولیشن - بالاتر بی ثمر خواهد ماند. کیفیت عکسهای تولید شده هم در حد قابل قبولی است. از سویی دیگر، تولید عکس با هوش مصنوعی هزینهای در بر نخواهد داشت. مزیت دیگر بهکارگیری این ابزار، امکان ساخت و ویرایش عکسها در خود برنامه است.
مزایا و معایب Neuroflash
در ادامه، جدولی آوردهایم که مزایا و معایب وب سایت Neuroflash برای ساخت تصویر با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت عکس از متن نوشته شده با زبان طبیعی | تولید تصاویری با کیفیت معمولی تا خوب |
کاربرپسند بودن | فقدان گزینههایی برای ویرایش تصویر |
رایگان اما دارای محدودیت |
ساخت عکس با هوش مصنوعی Canva
ابزاری که در این قسمت معرفی میکنیم بهوسیله پلتفرم محبوب طراحی گرافیک آنلاین Canva «+» در سال ۱۴۰۲ عرضه شده است. این ابزار نیز بر مبنای فناوری Stable Diffusion عمل میکند و دارای رابط کاربری ساده و کاربر پسندی است. همچنین، افزون بر پرامپتی که وارد میکنیم، این امکان وجود دارد تا از بین ۱۹ سبک پیشفرض نظیر سَبک مداد رنگی، هنر مفهومی، انیمه و آبرنگ، غیره سَبک مورد نظر را انتخاب کنیم.
افزون بر مواردی که بیان شد، میتوانیم خروجی را به منظور افزودن تغییراتی شخصی - به عکس تولید شده - ویرایش کنیم. بهطور مثال، میتوانیم درخشش و کنتراست را ویرایش، فیلتر یا جلوههایی را اضافه یا متنی را با قلمهای متنوع به عکس تولید شده اضافه کنیم. با اینکه کیفیت عکس تولیدشده بهوسیله Canva چندان چشمگیر نیست اما نسخه پایه ساخت عکس با هوش مصنوعی برای استفاده نیازی به پرداخت هزینه ندارد.
مزایا و معایب Canva
جدولی که در ادامه آوردهایم، مزایا و معایب وب سایت Canva برای ساخت عکس با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت عکس از متن نوشته شده با زبان طبیعی | تولید تصاویری با کیفیت معمولی تا خوب |
نسخه ابتدایی رایگان | دسترسی به برخی از امکانات پیشرفته تنها با اشتراک پولی |
قابلیت ویرایش عکسهای تولیدشده | وضوح محدود برای عکسهای تولیدی |
کاربر پسند بودن |
ساخت عکس با هوش مصنوعی ArtSpace.ai
ArtSpace.ai «+» برخلاف بیشتر ابزارهای ساخت عکس با هوش مصنوعی، مبتنی بر مدل Stable Diffusion نیست اما در عوض از یک «مدل هوش مصنوعی خود توسعه یافته» (Self-Developed AI model) بهره میبرد. جدای از پرامپتی که بهعنوان ورودی میدهیم، میتوانیم طراحیهای خود را ایجاد یا تصاویری را بهعنوان مرجع آپلود کنیم تا از این طریق به ساخت تصویر با هوش مصنوعی بپردازیم. این ابزار، رابط کاربری خوشساختاری دارد و بهکارگیری آن آسان است. عکسهای تولیدی را همچنین میتوان با امکانات Inpainting و Outpainting ویرایش کرد. بزرگترین انتقادی که به این ابزار میتوان وارد کرد کیفیت بهنسبت پایین تصاویر آن است. با پرداخت هزینهای مشخص میتوان از امکانات ArtSpace بهصورت همیشگی استفاده کرد.
مزایا و معایب ArtSpace
جدولی که در ادامه آوردهایم، مزایا و معایب وب سایت ArtSpace برای ایجاد تصاویر با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت عکس از متن زبان طبیعی، طرحها یا عکس مرجع | تولید تصاویری با کیفیت نه چندان مطلوب |
تخفیف برای اشتراک دائمی | امکانات اضافی اندک |
قابلیت ویرایش عکسهای تولیدی | جدید بودن فناوری و باگها |
کاربر پسند بودن | فاقد دموی رایگان |
ساخت عکس با هوش مصنوعی Jasper Art
Jasper Art «+» ابزاری قدرتمند و آسان برای ساخت عکس با هوش مصنوعی است. Jasper Art از مدل DALL-E 2 از OpenAI و نسخهای اصلاح شده از GPT-3 بهره میبرد که میتواند تصاویر AI را در عرض چندین ثانیه ایجاد کند. جدای از ورودی متنی، میتوانیم عکسی را بهعنوان مرجع آپلود کنیم. همچنین، این امکان وجود دارد از تا از طریق منوی این اپلیکیشن، استایل عکسی که میخواهیم بسازیم را مشخص کنیم. با این وجود، تصاویری با کیفیت بهنسبت متوسط تولید میکند و استفاده از آن نیز رایگان نیست.
مزایا و معایب Jasper Art
جدولی که در ادامه آوردهایم، مزایا و معایب سرویس Jasper Art برای ساخت عکس با هوش مصنوعی را بیان میکند.
مزایا | معایب |
ساخت عکس از متن زبان طبیعی یا عکس مرجع | تولید تصاویری با کیفیت معمولی |
نسخه آزمایشی محدود | غیر قابل تنظیم بودن عکسهای تولیدی |
دارای گزینههای متعدد برای تصویر | پلن اشتراک بهنسبت گران |
کاربر پسند بودن |
سوالات متداول
اکنون که یاد گرفتیم نحوه ساخت تصاویر با خوش مصنوعی چگونه است و با وبسایتهای کاربردی در این زمینه آشنا شدیم، برخی از سوالات متداول در این زمینه را بههمراه پاسخهای متناظرشان با هم بررسی میکنیم.
بهترین سایت برای ساخت عکس با هوش مصنوعی چیست؟
پلتفرمهای و وبسایتهای متعددی در این زمینه وجود دارد که میتوانیم از امکانت آنها استفاده کنیم، برای نمونه میتوان به ابزراهایی نظیر DALL-E 2 ،Jasper Art ،WOMBO Dream NightCafe ،AutoDraw ،Designs.ai ،CF Spark Art و OpenArt اشاره کرد.
آیا تصاویر تولیدی با هوش مصنوعی دارای کپی رایت هستند؟
خیر. تصاویری که با هوش مصنوعی ایجاد میشوند فاقد کپی رایت هستند.
ساخت عکس با هوش مصنوعی رایگان است؟
با توجه به پلتفرم و سایت مورد استفاده برای ساخت تصویر با هوش مصنوعی، این کار ممکن است رایگان و با محدودیت در اختیارمان قرار بگیرد. همچنین ممکن است برای استفاده از آن یا شخصیسازی بیشتر تصاویر تولیدی، نیاز به تهیه اشتراک یا پرداخت هزینه داشته باشیم.
جمعبندی
در این نوشتار از مجله فرادرس، چگونگی ساخت تصویر با هوش مصنوعی را توضیح دادیم و در ادامه وبسایتها و پلتفرمهایی را آوردهایم که میتوان از آنها برای تولید تصاویر با فناوری هوش مصنوعی استفاده کرد.
با استفاده از این کاربرد هوش مصنوعی، میتوانیم تصاویری در موضوعات مختلف، جزئیات مورد نظر و منحصر به خودمان داشته باشیم.