پردازش تصویر در متلب — راهنمای جامع
در این مطلب، با مبحث پردازش تصویر در متلب آشنا خواهید شد. همچنین، بسیاری از مفاهیم پایه و تعدادی از مفاهیم و موضوعات پیشرفته پردازش تصویر در متلب ارائه خواهند شد. هدف از این مطلب، پوشش دادن نحوه عملکرد و شیوه استفاده از «توابع» (Functions) یکی از معروفترین «تولباکسهای» (Toolbox) موجود در «محیط محاسبات عددی» (Numerical Computing Environment) و زبان برنامه نویسی «متلب» (Matlab) است؛ «تولباکس پردازش تصویر» (Image Processing Toolbox | جعبه ابزار پردازش تصویر).
در ابتدا، تعریف ابتدایی از «تصاویر دیجیتال» (Digital Images) و محیط برنامهنویسی متلب ارائه خواهد شد. سپس، مجموعهای از عملیات ابتدایی پردازش تصویر در متلب مورد بررسی قرار خواهد گرفت. از جمله مهمترین فرایندهای پردازشی مقدماتی روی تصاویر دیجیتال، میتوان به مواردی نظیر «خواندن تصویر» (Image Reading)، «نمایش تصویر» (Image Display) و «ذخیرهسازی تصویر» (Image Storing) اشاره کرد. در ادامه نیز، مجموعهای از توابع پردازش تصویر پیشرفته در متلب مورد بررسی قرار خواهد گرفت و چگونگی استفاده از آنها برای پردازش تصویر در متلب شرح داده خواهد شد.
پردازش تصویر چیست ؟
«پردازش تصویر» (Image Processing) به مجموعهای از تکنیکهایی اطلاق میشود که با هدف «تبدیل» (Convert) یک تصویر به «قالب دیجیتال» (Form) و انجام اعمال محاسباتی بر روی آن شکل گرفتهاند. هدف از انجام اعمال محاسباتی مرتبط با پردازش تصویر در متلب، تولید نسخهای «بهبود یافته» (Enhanced) از تصاویر دیجیتالی و یا استخراج اطلاعات با معنی و مفید از آنها است.
تغییراتی که بر اثر پردازش تصویر دیجیتالی، روی تصاویر اتفاق میافتند، معمولا به طور خودکار و بر پایه مجموعهای از الگوریتمهای به دقت طراحی شده انجام میشوند. این دسته از الگوریتمهای پردازش تصویر در متلب، از لحاظ محاسباتی بسیار «دقیق» (Accurate) و «بهینه» (Optimized) هستند.
حوزه پردازش تصویری، یک حوزه «چند رشتهای» (Multidisciplinary) در شاخه «علوم کامپیوتر» (Computer Science) است که بخشی از مفاهیم خود را از رشتههای علمی دیگر نظیر «ریاضیات» (Mathematics)، «فیزیک» (Physics) و «مهندسی برق» (Electrical Engineering) به اشتراک گرفته است. همچنین، حوزه پردازش تصویر، همپوشانی بسیار زیادی با حوزههای تحقیقاتی نظیر «بازشناسی الگو» (Pattern Recognition)، «یادگیری ماشین» (Machine Learning)، «هوش مصنوعی» (Artificial Intelligence) و «بینایی کامپیوتر» (Computer Vision) دارد.
برای انجام عملیات محاسباتی متناظر با پردازش تصویر در متلب، ابتدا باید تصاویر دیجیتال از طریق «واسطهایی» (Interfaces) نظیر «اسکنر نوری» (Optical Scanner) و «دوربینهای دیجیتال» (Digital Cameras) تولید شوند. سپس، تصاویر دیجیتال تولید شده «تحلیل» (Analyze) میشوند. در مرحله بعد، تصاویر دیجیتالی از طریق فرآیندهایی نظیر «فشردهسازی دادهها» (Data Compression)، «بهبود تصاویر» (Image Enhancements)، «فیلتر تصاویر» (Image Filtering) و سایر موارد، مورد «دستکاری عددی» (Numerical Manipulation) قرار گرفته و در نهایت، تصاویر خروجی مطلوب تولید میشوند.
«قوه محرکه» (Driving Force) توسعه تکنیکهای پردازش تصویر در متلب، نیاز محققان این حوزه به «استخراج اطلاعات» (Information Extraction) مفید و بامعنی از تصاویر دیجیتالی و تفسیر آنها است. امروزه، از تکنیکهای توسعه داده شده در حوزه پردازش تصویر، در شاخههای مختلفی نظیر «پزشکی» (Medicine)، «صنعت» (Industry)، «نظامی» (Military)، «دستگاههای الکترونیکی کاربردی» (Consumer Electronics) و سایر موارد استفاده میشود.
در پزشکی، از تکنیکهای پردازش تصویر در دستگاهها و روشهای «تصویربرداری تشخیص پزشکی» (Diagnostic Imaging Modalities) نظیر «برشنگاری با انتشار پوزیترون» (Positron Emission Tomography | PET)، «برشنگاری محوری کامپیوتر» (Computerised Axial Tomography | CAT)، «تصویربرداری رزونانس مغناطیسی» (Magnetic Resonance Imaging | MRI) و «تصویربرداری رزونانس مغناطیسی کارکردی» (functional Magnetic Resonance Imaging | fMRI) استفاده میشود. بسیاری از تکنیکهای تشخیص پزشکی، توسط الگوریتمهای پردازش تصویر در متلب پیادهسازی میشوند.
همچنین، سیستمهای تولید نظیر سیستمهای ایمنی، سیستمهای کنترل کیفیت و سیستمهای «کنترل وسیله نقلیه خودراهنما» (Automated Guided Vehicle Control) از جمله کاربردهای تکنیکهای پردازش تصویر در صنعت محسوب میشوند.
الگوریتمهای پیشرفته پردازش تصویر در کاربردهایی نظیر «تشخیص سرباز یا وسیله نقلیه» (Detection of Soldiers or Vehicles)، «هدایت موشک» (Missile Guidance)، «بازشناسی اشیاء» (Object Recognition) و سایر موارد مورد استفاده قرار میگیرند. تکنیکهای «بیومتریک» (Biometric) نظیر بازشناسی اثر انگشت، صورت، دست و عنبیه، به شکل گستردهای توسط «نیروهای امنیتی و اجرای قانون» (Law Enforcement and Security) به کار گرفته میشوند. بسیاری از روشهای مورد نیاز برای پیادهسازی چنین کاربردهایی، از طریق الگوریتمهای پردازش تصویر در متلب قابل پیادهسازی هستند.
دوربینهای دیجیتال، تلویزیونهای هوشمند و تلفنهای هوشمند از جمله دستگاههای الکترونیکی کاربردی هستند که از تکنیکهای پردازش تصویر استفاده میکنند.
متلب چیست ؟
محیط محاسبات عددی و زبان برنامهنویسی «متلب» (MATLAB)، که مخفف عبارت «آزمایشگاه ماتریس» (MATrix LABoratory) است، پلتفرمی برای حل مسائل علمی و ریاضیاتی است. متلب یک «زبان برنامهنویسی اختصاصی» (Proprietary Programming Language) توسعه داده شده به وسیله شرکت MathWorks است.
در این محیط برنامهنویسی، توسعهدهندگان قادرند تا از روشهای «دستکاری ماتریسی» (Matrix Manipulation)، توابع، روشهای نمایش داده و الگوریتمهای توسعه داده شده در متلب، برای پیادهسازی روشهای هوشمند (مبتنی بر نمایش عددی و ماتریسی) دلخواه خود استفاده کنند. همچنین، متلب امکان تعامل برنامهنویسی مستقیم را با برنامههای نوشته شده به زبانهای دیگر نظیر «سی» (C)، «سی پلاس پلاس» (++C)، «جاوا» (Java) و سایر موارد، برای توسعهدهندگان فراهم آورده است.
الگوریتمهای پردازش تصویر در متلب، مجموعهای از توابع هستند که قابلیتهای محیط محاسبات عددی متلب را گسترش میدهند. تولباکس پردازش تصویر در متلب، مجموعهای از «الگوریتمهای مرجع استاندارد» (Reference-Standard Algorithms) را برای کاربردهای پردازش، تحلیل و نمایش بصری تصاویر و همچنین توسعه الگوریتمهای پردازش تصویر در متلب فراهم میآورد.
از الگوریتمهای پردازش تصویر در متلب، میتوان برای «بخشبندی تصاویر» (Image Segmentation)، بهبود تصاویر، «کاهش نویز» (Noise Reduction) در تصاویر، «تبدیلات هندسی» (Geometric Transformation)، «انطباق تصویر» (Image Registration) و انجام عملیات «پردازش تصویر 3-بعدی» (3D Image Processing) استفاده کرد.
تصویر دیجیتالی چیست؟
یک تصویر دیجیتال در تولباکس پردازش تصویر در متلب، در قالب یک تابع دو بعدی به شکل تعریف میشود. در این تابع، و مختصات مکانی هر نقطه را در تصویر نشان میدهند. همچنین، به دامنه مقداری تابع ، به ازاء هر جفت مختصات و ، «شدت» (Intensity) تصویر در آن نقطه گفته میشود. در صورتی که ، و دامنه مقداری تابع ، همگی مقادیر گسسته متناهی باشند، به تصویر مورد نظر، یک تصویر دیجیتال گفته میشود.
به فرایند «عددیسازی» (Digitising) مقادیر مختصات، «نمونهگیری» (Sampling) و به فرایند عددیسازی مقادیر شدت، «کوانتیزهسازی» (Quantization) گفته میشود. نتیجه حاصل از فرایندهای نمونهگیری و کوانتیزهسازی، تولید ماتریسی از مقادیر «حقیقی» (Real) است. یک تصویر دیجیتال، از طریق ماتریسی به شکل زیر قابل نمایش است:
به هر کدام از عناصر موجود در این ماتریس، «پیکسل» (Pixel) یا عنصر تصویر گفته میشود.
دستورات ابتدایی پردازش تصویر در متلب
در متلب، بر خلاف فرم نمایش قبلی، یک تصویر به شکل زیر نمایش داده میشود:
تفاوت این نمایش با نمایش قبلی است که در متلب، «مبدأ» (Origin) از (0، 0) به (1، 1) «انتقال» (Shift) داده میشود.
خواندن تصاویر در متلب
برای خواندن تصاویر در محیط متلب، از تابع (imread) استفاده میشود. «قالب دستوری» (Syntax) این تابع به شکل زیر است:
1imread(‘filename’);
در این تابع، آرگومان (filename) رشتهای است که نام کامل تصویر و «فرمت» (Extension) آن را نمایش میدهد. به عنوان نمونه:
1F = imread(Penguins_grey.jpg);
2G = imread(Penguins_RGB.jpg);
شایان توجه است زمانی که آدرس فیزیکی محل ذخیرهسازی تصویر، در آرگومان (filename) قید نشده باشد، تابع (imread) تصویر را از «دایرکتوری» (Directory) کنونی متلب خواهد خواند. در شرایطی که نیاز باشد تا تصویر از دایرکتوری دیگری در متلب خوانده شود، لازم است تا آدرس کامل تصویر در آرگومان (filename) مشخص شود.
در صورت قرار ندادن «نقطه ویرگول» (Semicolon) در انتهای دستورات متلب، نتایج ذخیره شده در یک متغیر یا خروجی حاصل از یک عملیات پردازشی در «پنجره دستورات» (Command Window) نمایش داده میشوند. در غیر این صورت، نتایج عملیات تنها در متغیرها ذخیره میشوند و خروجیها در پنجره دستورات نمایش داده نخواهند شد. نماد (<<)، ابتدای یک خط دستوری را نمایش میدهد.
از توابع (imshow) ،(imread) و (imwrite) در متلب، برای خواندن تصاویر در محیط متلب، نمایش تصاویر در «میزکار» (Desktop) متلب و ذخیرهسازی تصاویر در دایرکتوری کنونی متلب استفاده میشود. در صورتی که تصویر مورد نظر، دقت پیکسلی برابر یا 256x256 و در فضای «سطح خاکستری» (Greyscale) تعریف شده باشد، ماتریس حاصل از اجرای دستور (imread)، ابعادی برابر با 256x256 یا 655536 عنصر خواهد داشت. با اجرای دستور زیر (شکل اول):
1imread(Penguins_grey.jpg);
مقادیر سطح خاکستری تمامی پیکسلهای موجود در تصویر سطح خاکستری، در ماتریسی به نام F و با ابعاد 256x256 ذخیره میشود. از این به بعد، ماتریس F یک «متغیر» (Variable) متلب محسوب میشود و میتوان عملیات ماتریسی مختلفی بر روی آن انجام داد. در صورتی که دستور زیر (شکل دوم) اجرا شود:
1G = imread(Penguins_RGB.jpg);
یک تصویر رنگی در «فضای رنگی» (Color Space) به نام RGB تعریف و در متغیر G ذخیره میشود. تفاوت خروجی این دستور با خط دستوری قبلی این است که در این حالت، مقادیر پیکسلی شامل لیستی از سه مقدار خواهند بود. هر کدام از مقادیر سهگانه پیکسلی، متناظر با مقادیر مؤلفههای قرمز، سبز و آبی رنگ یک پیکسل داده شده هستند. بنابراین، ماتریس G یک ماتریس سهبعدی با ابعاد 256x256x3 خواهد بود. به طور خلاصه، تابع (imread) مقادیر پیکسلی را از یک فایل تصویر میخواند و ماتریس حاوی تمامی مقادیر پیکسلی را خروجی میدهد.
برای به دست آوردن اندازه یک تصویر دوبعدی، از دستور زیر در متلب استفاده میشود:
1[M,N] = size(f)
این دستور، تعداد سطرها (M) و تعداد ستونهای (N) تصویر را در خروجی نمایش میدهد. همچنین، با استفاده از دستور (whos Variable_Name) اطلاعات اضافی مرتبط با یک تصویر دوبعدی نمایش داده خواهد شد. به عنوان نمونه:
1whos G
نام متغیر | اندازه | بایتها | مشخصههای کلاسی |
G | 768×1024×3 | 2359296 | uint8 |
1whos F
نام متغیر | اندازه | بایتها | مشخصههای کلاسی |
F | 768×1024 | 786432 | uint8 |
نمایش تصاویر در متلب
با استفاده از تابع (imshow)، امکان نمایش تصاویر در میزکار متلب فراهم شده است. قالب دستوری این تابع به شکل زیر است:
1imshow(Var_Name)
در این دستور، متغیر Var_Name یک آرایه تصویری از نوع دادهای (uint8) یا double است. نوع دادهای uint8، مقادیر اعداد صحیح ذخیره شده در متغیر Var_Name را به مقادیری بین 0 و 255 محدود میکند. شایان توجه است که برای یک ماتریس از نوع double، تابع (imshow) انتظار دارد که مقادیر عناصر این ماتریس، بین صفر و یک باشند (مقدار صفر، رنگ سیاه و مقدار 1، رنگ سفید است). هر مقداری که بین 0 و 1 قرار داشته باشد، با رنگ سطح خاکستری (grayscale) نمایش داده میشود. مقادیر بزرگتر از 1، با رنگ سفید و مقادیر کوچکتر از 0 نیز با رنگ سیاه نمایش داده خواهند شد. برای اینکه مقادیر عناصر ماتریسِ متناظر با یک تصویر، در بازه صفر و یک قرار بگیرند، میتوان از روشهای نرمالسازی یا استانداردسازی دادهها استفاده کرد.
برای بهبود «کنتراستِ» (Contrast) تصاویری که «محدوده پویای پایینی» (Low Dynamic Range) دارند، میتوان از دستور زیر استفاده کرد:
1imshow(Var_Name, [ ])
تابع ابزار تصویر در متلب
تابع «ابزار تصویر» (Image Tool) که در تولباکس پردازش تصویر در متلب موجود است، محیط تعاملیتر برای مشاهده تصاویر و کاوش اطلاعات درون آنها، برای کاربران ایجاد میکند.
با استفاده از این تابع، اطلاعاتی نظیر مقادیر پیکسلها، محاسبه فاصله میان دو پیکسل موجود در تصویر و برخی دیگر از عملیات محاسباتی مفید، در اختیار کاربران قرار میگیرد. با استفاده از دستورات زیر:
1B = imread(Penguins_grey.jpg);
2imtool(B)
ابتدا، تصاویر در محیط متلب خوانده میشوند. سپس، با استفاده از دستور تابع (imtool) اطلاعات مرتبط با تصویر خوانده شده نمایش داده خواهد شد. همان طور که در شکل زیر قابل مشاهده است، با اجرای خط دستوری بالا (تابع imtool)، پنجرهای نمایان خواهد شد. در نتیجه اجرای این تابع و ظاهر شدن پنجره، اطلاعات «مکاننمای ماوس» (Mouse Cursor) و مقدار پیکسلی که ماوس بر روی آن قرار دارد، در گوشه پایین تصویر نمایش داده خواهد شد.
با استفاده از ابزار «محاسبه فاصله» (Measure Distance) در تابع (imtool)، این امکان برای کاربر فراهم شده است تا فاصله میان دو نقطه انتخاب شده در تصویر را (به عنوان نمونه، فاصله میان منقارهای دو پنگوئن) محاسبه کنند.
با استفاده از ابزار «ناحیه پیکسلی» (Pixel Region) در تابع (imtool)، تک تک پیکسلهای موجود در یک ناحیه کوچک از تصویر، به همراه اطلاعات رنگی (مقادیر شدت رنگی پیکسلها و مقادیر کانالهای رنگ قرمز، سبز و آبی) پیکسلهای آن ناحیه نمایش داده خواهد شد.
با استفاده از تابع (subplot)، این امکان فراهم شده است تا چندین تصویر در یک شکل نمایش داده شوند. تابع (subplot) سه پارامتر ورودی دارد: دو پارامتر اول، تعداد سطرهای و ستونهای لازم برای تقسیمبندی یک شکل را مشخص میکنند و پارامتر سوم، مشخص میکند که کدام زیر قسمت، باید برای نمایش یکی از تصاویر مورد استفاده قرار بگیرد.
به عنوان نمونه، دستور (subplot(3,2,3 برای متلب مشخص میکند که باید شکل به سه سطر و دو ستون تقسیمبندی و از زیر سمت سوم، برای نمایشِ یکی از تصاویر موجود در شکل استفاده شود. برای نمایش دو تصویر (Penguins_RGB.jpg) و (Penguins_grey.jpg) در یک شکل، از دستورات زیر استفاده میشود:
1A=imread(‘Penguins_grey.jpg’);
2B=imread(‘Penguins_RGB.jpg’);
3figure
4subplot(1,2,1),imshow(A)
5subplot(1,2,2),imshow(B)
ذخیره کردن تصاویر در متلب
برای ذخیره کردن تصاویر در دایرکتوری کنونی متلب، از تابع (imwrite) با قالب دستوری زیر استفاده میشود:
1imwrite(Var_Name, ‘filename’);
این دستور، داده متناظر با تصویر (Var_Name) را در فایلی که به وسیله متغیر (filename) به آن اشاره میشود (در دایرکتوری کنونی متلب)، ذخیره میکند. تابع (imwrite)، از غالب فرمتهای تصویری شناخته شده برای ذخیره تصویر نظیر (JPG ،PBM ،BMP ،PGM ،PNG ،PNM ،PPM ،TIFF) پشتیبانی میکند. به عنوان نمونه، با استفاده از دستور زیر، یک آرایه 100x100 از مقادیر سطح خاکستری را در یک فایل به نام random و با فرمت PNG ذخیره میشود.
1F = rand(100);
2imwrite(F, ‘random.png’)
برای ذخیرهسازی تصاویر در فرمت JPEG، از قالب دستوری زیر استفاده میشود:
1imwrite(F, ‘filename.jpg’, ‘quality’, q)
در این دستور، پارامتر q مقداری صحیح بین 0 و 100 است. از این پارامتر، برای کاهش حجم تصویر استفاده میشود. پارامتر q، یک پارامتر «موازنه» (Trade-off) محسوب میشود و توازن لازم را میان حجم و کیفیت تصویر ایجاد میکند. به عنوان نمونه، با استفاده از دستورات زیر، میتوان تصویر (Penguins_grey.jpg) را با فرمت JPEG در سه کیفیت 75 (حجم و کیفیت معمولی)، 90 (حجم زیاد و کیفیت بالا) و 10 (حجم کم و کیفیت پایین) ذخیرهسازی کرد. نکته مهم در این زمینه این است که مقدار 75، مقدار «پیشفرض» (Default) برای پارامتر q است.
1F = imread(‘Penguins_grey.jpg’);
2imwrite(F,’Penguins_grey_75.
3jpg’,’quality’,75);
4imwrite(F,’Penguins_grey_10.
5jpg’,’quality’,10);
6imwrite(F,’Penguins_grey_90.
7jpg’,’quality’,90);
نمایش اطلاعات تصاویر در متلب
با استفاده از تابع (imfinfo)، فیلدهای اطلاعاتی مرتبط با یک تصویر را میتوان در یک «متغیر ساختاری» (Structural Variable) ذخیره و در محاسباتی آتی مورد استفاده قرار داد. به عنوان نمونه، با استفاده از دستور زیر، کلیه اطلاعات مرتبط با تصویر (Penguins_grey.jpg) در متغیری به نام (Var_Name) ذخیره میشود:
1K = imfinfo(‘Penguins_grey.jpg’)
تکنیکهای پیشرفته پردازش تصویر در متلب
پردازش تصویر و تکنیکهای مختلف پیادهسازی در متلب، مجموعهای بسیار بزرگ از الگوریتمهای استاندارد و مرجع را شامل میشوند. مهمترین و بنیادیترین فرایندهای پردازشی قابل انجام روی تصویر، که تقریبا در تمامی تکنیکها و الگوریتمهای پردازش تصویر در متلب وجود دارند، عبارتند از:
- دقیق کردن و نمایانسازی تصاویر (Image Sharpening)
- «حذف کردن نویز» (Noise Removal)
- تصحیح لکهها و تار شدگیهای موجود در تصویر (Deblurring)
- «استخراج لبهها» (Edge Extraction)
- باینری کردن تصاویر (Binarization)
- بهبود کنتراست تصاویر دیجیتالی (Contrast Enhancement)
- بخشبندی تصاویر و برچسبگذاری اشیاء موجود در آنها (Object Segmentation and Labeling)
دقیق کردن و نمایانسازی ویژگیهای بارز موجود در تصاویر
در تکنیکهای دقیق کردن و نمایانسازی تصاویر، لبهها و جزئیات ظریف موجود در تصویر، برای مشاهده انسانی تقویت میشوند. در این دسته از روشها، کنتراست میان نواحی تاریک و روشن افزایش مییابد تا ویژگیهای بارز موجود در تصویر خودنمایی کنند.
به عبارت دیگر، در این دسته از روشهای پردازش تصویر، «فیلترهای بالاگذر» (High-Pass Filter) بر روی تصاویر دیجیتالی اعمال میشوند تا مهمترین ویژگیهای موجود در تصویر (نظیر لبهها)، واضحتر شوند.
حذف کردن نویز
روشهای حذف نویز از تصاویر دیجیتالی، جزء روشهای پرکاربرد پیشپردازشی هستند و معمولا، پیش از اعمال روشهای پردازش تصویر در متلب مورد استفاده قرار میگیرند.
معمولا پیش از پردازش تصویر، از این دسته از تکنیکها، برای کاهش میزان نویز در تصویر استفاده میشود. روشهای حذف نویز نقش مهمی در پردازش و تفسیر تصاویر دیجیتالی دارند؛ زیرا، اجازه استخراج اطلاعات مفید را از تصویر میدهند. تصاویر حاصل شده از دوربینهای دیجیتال و فیلمهای دوربینهای سنتی، حاوی نویزهای مختلف از منابع متفاوتی هستند. نویزهایی نظیر «نویز فلفل-نمکی» (Salt-and-Pepper Noise) و «نویز گاوسی» (Gaussian Noise)، مهمترین منابع ایجاد نویز در تصاویر هستند.
به طور کلی، نویزها به دو دسته «نویزهای همبسته» (Correlated Noise) و «نویزهای ناهمبسته» (Uncorrelated Noise) تقسیمبندی میشوند. در بیشتر موارد، مقادیر نویز در پیکسلهای مختلف تصویر، به شکلی مدل شدهاند که مستقل از هم هستند و لی از توزیع یکسان تبعیت میکنند. به این دسته از نویزها، نویزهای ناهمبسته گفته میشود. در هنگام انتخاب الگوریتم حذف نویز از تصاویر، باید به نکاتی نظیر «قدرت محاسباتی» (Computing Power) سیستم پردازش تصویر، زمان محاسباتی لازم برای حذف نویزها و از همه مهمتر، موازنه میان از بین رفتن جزئیات موجود در تصویر و حذف نویز توجه شود.
تصحیح لکهها و تار شدگیهای موجود در تصویر
در این دسته از روشهای پردازش تصویر، «مصنوعات تار شده» (Blurring Artifacts)، نظیر تارشدگیهای موجود در تصویر که در اثر حرکت پدید آمدهاند، از تصویر حذف میشوند.
این فرایندها تکراری هستند و برای رسیدن به جواب مطلوب، ممکن است چندین بار تکرار شوند. به عبارت دیگر، فرایندهای موجود در این دسته از روشها، آنقدر تکرار میشوند تا تصویر حاصل، تقریب مناسبی از تصویر اصلی شود. این دسته از روشها، به عنوان فرایندهای پیش پردازشی و معمولا، پیش از پردازش تصویر در متلب، مورد استفاده قرار میگیرند.
استخراج لبهها از تصاویر
این دسته از روشها که به آنها روشهای «تشخیص لبه» (Edge Detection) نیز گفته میشود، یکی از مهمترین روشهای پردازش تصویر در متلب محسوب میشوند. از روشهای استخراج لبه، برای جداسازی «اشیاء» (Objects) موجود در تصویر استفاده میشود.
در روشهای تشخیص لبه، هدف، شناسایی نقاطی در تصاویر دیجیتال است که در این نقاط، «روشنایی تصویر» (Image Brightness) نسبت به نقاط همسایه، به شدت تغییر میکند. روشهای تشخیص لبه، به دو دسته روشهای «مبتنی بر جستجو» (Search-based) و «مبتنی بر عبور از صفر» (Zero-Crossing-based) تقسیمبندی میشوند.
در روشهای مبتنی بر جستجو، ابتدا قدرت لبهها با استفاده از معیارهایی نظیر «اندازه گرادیان» (Gradient Magnitude) محاسبه میشود (معمولا، از طریق محاسبه مشتق مرتبه اول). سپس، با استفاده از تخمین محاسبه شده از «جهت محلی» (Local Orientation) لبهها (جهت گرادیان)، «بیشینه جهتدار محلی» (Local Directional Maxima) متناظر با اندازه گرادیان جستجو و لبهها شناسایی میشوند.
در روشهای مبتنی بر عبور از صفر، نقاط عبور از صفر موجود در مشتق مرتبه دوم محاسبه شده از تصویر، جستجو خواهند شد و از این طریق، لبههای موجود در تصاویر شناسایی میشوند. روشهایی نظیر تشخیص لبه Canny، عملگر Prewitt و عملگر Sobel، جزء روشهای تشخیص لبه مبتنی بر مشتق مرتبه اول هستند.
باینری کردن تصاویر
باینری کردن تصاویر به فرایندی اطلاق میشود که در آن، تصاویر سطح خاکستری (greyscale) به تصاویر «سیاه و سفید» (Black and White) تبدیل میشوند.
استفاده از «حد آستانه» (Threshold)، یکی از محبوبترین تکنیکهای تبدیل تصاویر سطح خاکستری به تصاویر سیاه و سفید است. این دسته از روشها، جزء سادهترین و البته، پرکاربردترین روشهای پردازش تصویر در متلب محسوب میشوند.
بهبود کنتراست تصاویر دیجیتالی
در روشهای بهبود کنتراست، با هدف بهتر شدن دید انسانی از تصاویر و همچنین، بهبود فرایندهای پردازش تصویر، تصاویر دیجیتال مورد پردازش قرار میگیرند.
در این دسته از روشهای پردازش تصویر در متلب، با در نظر گرفتن سیستم رنگ دستگاههای نمایشی یا واسطهای خروجی تصویر و بهینهسازی تصاویر دیجیتال برای نمایش در آنها، ویژگیهای موجود در تصویر پررنگتر میشوند. در روشهای بهبود کنتراست تصاویر دیجیتالی، «محدوده» (Range) مقادیر کنتراست در تصویر، توسط فرایندهای خاصی تغییر مییابد. این دسته از روشها، جزء مهمترین روشهای پردازش تصویر در متلب به حساب میآیند.
بخشبندی تصاویر و برچسبگذاری اشیاء موجود در آنها
پیادهسازی سیستمهای بخشبندی تصاویر و برچسبگذاری اشیاء موجود در آنها، پیششرط لازم برای توسعه یک سیستم «بازشناسی و دستهبندی اشیاء» (Object Recognition and Classification) محسوب میشود.
این دسته از روشها، جزء مهمترین روشهای پردازش تصویر در متلب به حساب میآیند. در بخشبندی تصاویر دیجیتال، هر کدام از پیکسلهای موجود در تصویر، توسط دو یا چند برچسب کلاسی، «برچسبگذاری» (Labelling) میشوند. به عبارت دیگر، بخشبندی تصاویر دیجیتال به فرایند تقسیمبندی تصویر دیجیتال به چندین بخش یا مجموعه اطلاق میشود (به عنوان نمونه، مجموعهای از پیکسلها، که به آنها اَبَر پیکسل نیز گفته میشود).
هدف این دسته از فرایندها، سادهسازی یا تغییر «نمایش کنتراستی» (Contrast Representation) تصویر به مدلی است که تحلیل آن سادهتر و بامعنیتر باشد. به محض اینکه اشیاء مرتبط بخشبندی و برچسبگذاری شدند، ویژگیهای مهم موجود در آنها، جهت دستهبندی، مقایسه، خوشهبندی یا بازشناسی اشیاء مرتبط، استخراج میشوند.
انواع تصاویر
در تولباکس پردازش تصویر در متلب و توابع موجود در آن، چهار نوع تصویر پشتیبانی میشود:
- تصاویر سطح خاکستری ( Grayscale | Grey-level Images)
- تصاویر باینری (Binary Images)
- تصاویر شاخصگذاری شده (Indexed Images)
- تصاویر RGB
تصاویر سطح خاکستری
در این دسته از تصاویر، که به آنها تصاویر «تکرنگ» (Monochrome) نیز گفته میشود، از 8 بیت برای نمایش مقدار شدت رنگ هر پیکسل استفاده میشود؛ پیکسل با مقدار شدت برابر با صفر، رنگ سیاه را نمایش میدهد.
همچنین، پیکسل با مقدار شدت برابر با 255، رنگ سفید خواهد بود. در نهایت، پیکسلهایی که مقادیری بین 0 و 255 دارند، طیفهای خاکستری را نمایش میدهند. تصاویر سطح خاکستری، توسط آرایههای دوبعدی و مقادیر پیکسلها نیز، توسط یک عدد 8 بیتی نمایش داده میشوند.
تصاویر باینری
در این دسته از تصاویر، از تنها 1 بیت برای نمایش مقدار پیکسلها استفاده میشود؛ مقدار 1، به معنای رنگ سفید و مقدار 0، به معنای رنگ سیاه. تصاویر سیاه و سفید نیز توسط آرایههای دوبعدی نمایش داده میشوند. حجم کم این دسته از تصاویر، مهمترین مزیت آنها محسوب میشود.
تصاویر شاخصگذاری شده
این تصاویر، ماتریسی از مقادیر «صحیح» (Integer) هستند. در این ماتریس، هر مقدار صحیح به یک سطر خاص از مقادیر RGB، در یک ماتریس («نقشه» (Map)) ثانویه به نام «نقشه رنگ» (Colour Map) اشاره دارد.
تصاویر RGB
در تصاویر RGB، هر پیکسل رنگی توسط یک سهتایی مشخص کننده مؤلفههای قرمز (R)، سبز (G) و آبی (B) آن پیکسل، نمایش داده میشود. در تولباکس پردازش تصویر در متلب و توابع آن، هر تصویر رنگی RGB متناظر با یک آرایه سهبعدی به ابعاد MxNx3 است.
در اینجا، M بیانگر ارتفاع و N، نشان دهنده پهنای تصویر است. همچنین، عدد 3 بیانگر تعداد مؤلفههای رنگی تصویر RGB است. در تصاویر RGB از نوع double، محدوده مقادیر شدت پیکسلها، بازه [0 و 1] است. در تصویر RGB از نوع Unit8 و Unit16، محدوده مقادیر به ترتیب برابر با بازه [0 و 255] و [0 و 65535] است.
شایان توجه است که بیشتر الگوریتمهای پردازش تصویر در متلب (از نوع پردازش تصاویر تکرنگ)، از تصاویر باینری یا سطح خاکستری برای انجام عملیات پردازشی استفاده میکنند.
کیفیت تصویر
«کیفیت تصویر» (Image Quality) در فرایند پردازش تصویر، بر حسب مفاهیمی نظیر «تفکیک مکانی» (Spatial Resolution) و کوانتیزهسازی تعریف میشود.
تفکیک مکانی یا دقت پیکسلی تصویر
منظور از تفکیک مکانی، «چگالی پیکسلی» (Pixel Density) در تصویر است. هر چقدر که تفکیک مکانی یک تصویر بیشتر باشد، بدین معنی است که پیکسلهای بیشتری برای نمایش تصویر مورد استفاده قرار گرفته شده است. تفکیک مکانی یک تصویر، به طور کیفی، بر اساس معیاری به نام «نقطه در اینچ» (Dot per Inch | DPI) بیان میشود.
با استفاده از تابع (imresize)، میتوان قدرت تفکیک یا به عبارت دیگر، دقت پیکسلی یک تصویر را تغییر داد. به عنوان نمونه، با استفاده از دستور زیر، ابعاد یک تصویر به نصف کاهش پیدا میکند. ویژگی مهم تابع (imresize) این است که در ماتریسهای چندبعدی متناظر با تصویر (نظیر تصاویر RGB که سهبعدی هستند)، به طور پیشفرض، تنها دو بعد اول ماتریس تغییر پیدا میکنند.
1imresize(x,1/2)
همچنین در هنگام استفاده از خط دستوری زیر و اجرای تابع (imresize)، تمامی پیکسلهای موجود در تصویر تکرار میشوند تا تصویری ایجاد شود که ابعاد آن مشابه تصویر اصلی ولی قدرت تفکیک یا دقت پیکسلی آن در هر جهت، نصف تصویر اصلی است.
1imresize(x,2)
با استفاده از تابع (imresize)، تغییرات دلخواه در قدرت تفکیک یا دقت پیکسلی تصاویر قابل اعمال است. به عنوان نمونه، دستور زیر قدرت تفکیک یا دقت پیکسلی تصویر را نصف میکند ولی تغییری در ابعاد تصویر ایجاد نمیکند.
1mresize(imresize(x,1/2),2)
همچنین، خط دستوری زیر، قدرت تفکیک یا دقت پیکسلی تصویر را به اندازه یک چهارم () تغییر میدهد.
1imresize(imresize(x,1/4),4)
برای واضحتر شدن این مطلب، از تابع (imresize) برای انجام یک سری تغییرات روی تصویر (Penguins_grey.jpg) استفاده میشود. به عبارت دیگر، قرار است با استفاده از این تابع، قدرت تفکیک یا دقت پیکسلی تصویر به مقدار دلخواه تغییر داده شود.
دستور زیر، قدرت تفکیک یا دقت پیکسلی تصویر (Penguins_grey.jpg) را به نصف تغییر میدهد.
1A = imread(‘Penguins_grey.jpg’);
2A1 = imresize((imresize(A,1/2)),2);
3imshow(A1)
1A = imread(‘Penguins_grey.jpg’);
2A2 = imresize((imresize(A,1/4)),4);
3imshow(A2)
1A = imread(‘Penguins_grey.jpg’);
2A3 = imresize((imresize(A,1/8)),8);
3imshow(A3)
کوانتیزهسازی تصویر
«کوانتیزهسازی تصویر» (Image Quantisation) را میتوان در قالب یک فرایند «نگاشت» (Mapping) توصیف کرد که در آن، مجموعهای از نقاط دادهای (مجموعهای از پیکسلها که در یک محدوده سطح خاکستری مشخصی قرار دارند) به یک نقطه (یک مقدار سطح خاکستری خاص) نگاشت میشوند.
برای «بازکوانتیزهسازی» (Requantization) تصویر در متلب، میتوان از تابع (grayslice) در تولباکس پردازش تصویر در متلب استفاده کرد. با استفاده از مجموعه دستورات زیر، سطوح کوانتیزهسازی تصویر (Penguins_grey.jpg) به 64 کاهش پیدا میکند و تصویر حاصل در خروجی نمایش داده میشود.
1A = imread(‘Penguins_grey.jpg’);
2B=grayslice(A,64);
3imshow(B,gray(64))
مجموعه دستورات زیر، سطوح کوانتیزهسازی تصویر (Penguins_grey.jpg) را به 8 کاهش و تصویر حاصل را در خروجی نمایش میدهند.
1A = imread(‘Penguins_grey.jpg’);
2B=grayslice(A,8);
3imshow(B,gray(8))
هیستوگرام تصویر
«هیستوگرام» (Histogram) یک تصویر سطح خاکستری، «تناوب» (Frequency) رخدادِ مقادیر «سطوح خاکستری» (Grey Levels) در تصویر را نمایش میدهد. هیستوگرام یک نمایش گرافی است که تعداد دفعات رخدادِ هر یک از مقادیر سطح خاکستری موجود در تصویر را بیان میکند.
در یک تصویر تاریک، سطوح خاکستری (و در نتیجه، هیستوگرام تصویر) بیشتر در حد پایین مقادیر (نزدیک به صفر) تجمع پیدا میکنند. در حالی که در تصویری به شکل یکنواخت روشن است، سطوح خاکستری (هیستوگرام تصویر) بیشتر در حد بالای مقادیر (نزدیک به 255) تجمع پیدا میکند. در تصاویری که از «کنتراست» (Contrast) خوبی برخوردارند، سطوح خاکستری (هیستوگرام تصویر) تقریبا به خوبی در محدوده تعریف شده برای مقادیر سطح خاکستری (0 تا 255) پخش شدهاند.
با استفاده از تابع (imhist)، هیستوگرام یک تصویر در تولباکس پردازش تصویر در متلب نمایش داده میشود. به عنوان نمونه، با استفاده از دستورات زیر، هیستوگرام تصویر (Penguins_grey.jpg) در خروجی نمایش داده خواهد شد.
1A = imread(‘Penguins_grey.
2jpg’);
3figure(1), imhist(A);
شایان توجه است که هر ستون در نمودار هیستوگرام بیانگر آن است که چه تعداد پیکسل در تصویر، دارای مقدار پیکسلی هستند که توسط آن ستون نمایش داده شده است. اما هیستوگرام اطلاعاتی پیرامون موقعیت قرارگیری آن پیکسل ارائه نمیکند. در نتیجه، دو تصویر متفاوت میتوانند نمودار هیستوگرام یکسانی داشته باشند.
تولباکس پردازش تصویر در متلب، امکان انجام سه دسته عملیات مهم روی هیستوگرامهای تصاویر را، برای کاربران فراهم میکند. این دسته از عملیات پردازشی، با هدف بهبود تصاویر دیجیتالی، در تولباکس پردازش تصویر در متلب توسعه داده شدهاند.
- روش Histogram Stretching
- روش Histogram Shrinking
- روش Histogram Sliding
روش Histogram Stretching
در این روش، که به آن «برش ورودی» (Input Cropping) نیز گفته میشود، از یک تبدیل خطی برای «کشش» (Stretch) بخشهایی از هیستوگرام اصلی تصویر استفاده میشود. هدف از این عملیات، گسترش دادن محدوده «غیر صفر» (Non-Zero) مقادیر شدتِ پیکسلهای تصویر به تمامی سطوح سطح خاکستری است.
در صورتی که هیستوگرام یک تصویر، در مرکز محدوده تعریف شده برای مقادیر سطح خاکستری (0 تا 255)، تجمع پیدا کرده باشد، با استفاده از تابع (imadjust) امکان کشش یا Stretch بخشهایی از هیستوگرام آن تصویر وجود دارد. با استفاده از قالب دستوری زیر، عملیات کشش هیستوگرام یک تصویر، در تولباکس پردازش تصویر در متلب انجام میشود. در این قالب دستوری، مقادیر پارامترهای d ،c ،b ،a باید بین 0 و 1 باشند.
1imadjust (Var_Name, [a,b], [c,d])
به عنوان نمونه، دستور زیر، مقادیر سطح خاکستری تصویر را معکوس میکند و از این طریق، تصاویری مشابه «فیلم عکاسی» (Photographic Negative) تولید میشود.
1imadjust (Var_Name, [], [1,0])
راه حل جایگزین برای کشش یا Stretch بخشهایی از هیستوگرام تصویر، استفاده از روش «یکنواختسازی هیستوگرام» (Histogram Equalization) یا تابع (histeq) در تولباکس پردازش تصویر در متلب است. این روش، بر خلاف روش Histogram Stretching که نیازمند تعیین دستی پارامترها توسط کاربر است، به طور خودکار انجام میشود. نحوه استفاده از تابع (histeq) و نمایش هیستوگرام اصلاح شده در ادامه آمده است:
1A = imread(‘Penguins_grey.jpg’);
2HE = histeq(A);
3imshow(HE),figure, imhist(HE)
روش Histogram Shrinking
در این روش، که به آن «برش خروجی» (Output Cropping) نیز گفته میشود، هیستوگرام اصلی تصویر به گونهای تغییر پیدا میکند که محدوده فعلی مقادیر سطح خاکستری در تصویر، به محدوده سطح خاکستری باریکتری فشردهسازی میشود. برای چنین کاری، از تابع (imadjust) در تولباکس پردازش تصویر در متلب استفاده میشود.
روش Histogram Sliding
در روش Histogram Sliding، یک «مقدار ثابت روشنایی» (Constant Brightness Value) به تمامی پیکسلهای موجود در تصویر اضافه یا از تمامی آنها کسر میشود. در تصاویر حاصل، ویژگیهای کنتراستی بهتر از تصویر اصلی است؛ با این حال، سطح روشنایی آنها، نسبت به میانگین روشنایی تصویر اصلی، بیشتر یا کمتر است. در هنگام استفاده از روش Histogram Sliding در متلب، باید اطمینان حاصل شود که مقادیر پیکسلها، از محدوده مجاز تعریف شده برای مقادیر سطح خاکستری (0 تا 255) فراتر نروند. در مجموعه دستورات زیر، از روش Histogram Sliding برای بهبود تصویر (Penguins_grey.jpg) استفاده شده است.
1A = imread(‘Penguins_grey.jpg’);
2imshow(A),title(‘Original Image’);
3B=im2double(A);
4bright_add = 0.2;
5imhist(A), title(‘Original Histogram’);
6C=B+bright_add;
7imshow(C),title(‘New Bright Image’);
8imhist(C), title(‘New Histogram’);
در این مثال، تصویر اصلی، از طریق اضافه کردن مقدار ثابت ۰٫۲ به تمامی پیکسلهای موجود در تصویر، روشنتر شده است.
روش آستانهگذاری در تولباکس پردازش تصویر در متلب
از روش «آستانهگذاری» (Thresholding)، برای حذف اطلاعات غیر ضروری و تمرکز روی اطلاعات اساسی در تصویر استفاده میشود. همچنین، در صورتی که اشیاء موجود در تصویر و «پسزمینه» (Background) سطوح خاکستری مشابهی داشته باشند، از این روش، برای نمایان کردن جزئیات مخفی در تصویر استفاده میشود.
روشهای آستانهگذاری، به دو دسته روشهای «تک آستانهگذاری» (Single Thresholding) و «آستانهگذاری دوگانه» (Double Thresholding) تقسیمبندی میشوند. روشهای تک آستانهگذاری و آستانهگذاری دوگانه، در تولباکس پردازش تصویر در متلب پیادهسازی شدهاند.
روش تک آستانهگذاری
در این روش، تصاویر سطح خاکستری از طریق مراحل زیر به تصاویر باینری (سیاه و سفید) تبدیل میشوند:
- ابتدا، یک سطح خاکستری، نظیر T، در تصویر اصلی انتخاب میشود. به این سطح خاکستری، حد آستانه گفته میشود.
- سپس، تمامی پیکسلهای تصویر، بسته به اینکه مقدار سطح خاکستری آنها از حد آستانه کمتر یا بیشتر باشند، سیاه یا سفید میشوند.
آستانگذاری، یکی از مراحل اصلی روشهای «بخشبندی تصاویر» (Image Segmentation) است. در این دسته از روشها، کاربر تمایل دارد تا اشیاء را از پسزمینه جدا کند. برای تبدیل یک تصویر سطح خاکستری (نظیر F)، به یک تصویر باینری، با استفاده از حد آستانه 100 از دستور زیر استفاده میشود.
1G=F>100
در ادامه، تصویر سطح خاکستری (Penguins_grey.jpg)، با استفاده از حد آستانه 70، به تصویر سیاه و سفید تبدیل میشود.
1A = imread(‘Penguins_grey.jpg’);
2imshow(A),figure, imshow(A>70)
علاوه بر این، دستوری در تولباکس پردازش تصویر در متلب وجود دارد که به کاربران اجازه میدهد تا تصاویر سطح خاکستری و رنگی را به تصاویر باینری تبدیل کنند. برای این کار از تابع (im2bw) استفاده میشود. در این تابع، آرگومان level مقداری بین 0 و 1 دارد.
1im2bw(image,level)
روش آستانهگذاری دوگانه
در این روش، به جای یک حد آستانه، دو حد آستانه T1 و T2 تعریف میشود. در صورتی که مقدار سطح خاکستری یک پیکسل بین دو حد آستانه T1 و T2 باشد، پیکسل سفید خواهد شد.
در صورتی که مقدار پیکسل خارج از این محدوده باشد، پیکسل سیاه خواهد شد.
دقیق کردن و نمایانسازی ویژگیهای بارز موجود در تصاویر (Image Sharpening)
به این دسته از روشها، روشهای Image Sharpening نیز گفته میشود. این روشها، ابزارهایی قدرتمند برای بهتر جلوه دادن «بافت» (Texture) در تصاویر هستند. این روشها قادر هستند کیفیت تصویر را، حتی بهتر از امکانات سختافزاری موجود در دوربینهای گران قیمت بازار بهبود ببخشند.
در بسیاری از نرمافزارهای Image Sharpening، از تکنیکی به نام Unsharp Masking جهت نمایانسازی ویژگیهای بارز موجود در تصاویر (به ویژه بافتها) استفاده میشود. در این روش، تفاوت روشنایی در راستای لبههای درون یک تصویر، پررنگتر میشود. شایان توجه است که روشهای Image Sharpening قادر به بازسازی تصویر ایدهآل نیستند، با این حال، لبههای موجود در تصاویر تغییر یافته به مراتب پررنگتر از تصاویر اصلی خواهند بود.
از تابع (imsharpen)، برای دقیق کردن و نمایانسازی ویژگیهای شاخص تصاویر (در تولباکس پردازش تصویر در متلب) استفاده میشود.
1B = imsharpen(A)
در نتیجه اجرای چنین دستوری، نسخه بهبود بهبود یافته از تصاویر ورودی (RGB یا سطح خاکستری)، تولید میشود. در تصاویر جدید تولید شده، برخی از ویژگیهای تصویر نظیر لبه، پررنگتر شدهاند. به عنوان نمونه، با استفاده از دستورات زیر، ویژگیهای شاخص موجود در تصویر نمایانتر میشوند.
1a=imread(‘Image_sharpen.jpg’);
2imshow(a)
3=imsharpen(a);
4figure,imshow(b)
همچنین، این امکان فراهم شده است تا پارامترهای «شعاع» (Radius) و «مقدار» (Amount) در تابع (imsharpen)، توسط کاربر مقداردهی شوند.
1b=imsharpen(a,’Radius’,
24,’Amount’,2);
3figure,imshow(b)
همان طور که در این شکل مشخص است، ویژگیهای تصویر بالا (نظیر اشیاء و لبههای آنها) نسبت به دو تصویر قبلی، به مراتب پررنگتر شده است و به شکل بهتری در تصویر نمایان شدهاند؛ به گونهای که تمایز قائل شدن میان اشیاء در این تصویر به مراتب راحتتر است.
جمعبندی
پردازش تصویر در متلب و توابع موجود در آن، مجموعه وسیعی از روشها، الگوریتمها و تکنیکها را شامل میشوند. فرایندهایی نظیر Image Sharpening، حذف نویز، Deblurring، استخراج لبهها، باینریسازی تصاویر، بهبود کنتراست تصاویر، بخشبندی و برچسبگذاری اشیاء در تصویر، از جمله مهمترین فرایندهای بنیادی پردازش تصویر در متلب هستند که تقریبا در تمامی تکنیکها و الگوریتمهای پردازش تصویر مورد استفاده قرار میگیرند. در این مطلب سعی شده است تمامی این تکنیکها، به همراه ارائه مثال و کدهای پیادهسازی در متلب شرح داده شوند. مطالعه این مطلب، به تمامی کسانی که به حوزه پردازش تصویر دیجیتال علاقهمند هستند، توصیه میشود.
سلام خسته نباشید
کد نویسی های مورد نیاز برای مواردی که گفتید مثل
دقیق کردن و نمایانسازی تصاویر (Image Sharpening)
«حذف کردن نویز» (Noise Removal)
تصحیح لکهها و تار شدگیهای موجود در تصویر (Deblurring)
«استخراج لبهها» (Edge Extraction)
باینری کردن تصاویر (Binarization)
بهبود کنتراست تصاویر دیجیتالی (Contrast Enhancement)
بخشبندی تصاویر و برچسبگذاری اشیاء موجود در آنها (Object Segmentation and Labeling)
در سایتتون هست؟
با سلام و احترام؛
صمیمانه از همراهی شما با مجله فرادرس و ارائه بازخورد سپاسگزاریم.
در زمینه پردازش تصویر در متلب و همچنین با استفاده از سایر فناوریها، دورههای آموزشی مختلفی در سایت فرادرس موجود است و همچنین تاکنون مقالههای مختلفی هم در این زمینه در مجله فرادرس منتشر شده است که در ادامه سعی کردهام مرتبطترین موارد رو فهرست کنم. دورههای آموزشی مرتبط در سایت فرادرس در ادامه فهرست شدهاند:
مطالب مرتبط در مجله فرادرس هم در ادامه آمده است:
علاوه بر موارد فوق میتوانید با جستجوی موضوع مورد نظر خود در سایت فرادرس و همچنین مجله فرادرس آموزشها و مطالب مرتبط بیشتری را پیدا کنید.
برای شما آرزوی سلامتی و موفقیت داریم.
باسلام تشکر از مطالب بسیار مفید
من میخام یک فاصله سنج لیزری بسازم ک توسط دوربین پردازش بشه
میخام فاصله دقیق و در حد صدم میلیمتر هم داشته باشم میخام فاصله دوتا جسم ثابت ک در ظاهر هردو نسبت به لیزر فاصله مساوی ایی دارن تشخیص داده بشه و اختلاف بسیار جزییشونو پیدا کنم
آیا با پردازش تصویر و پیکسلهایی ک گفتید امکانش هست؟؟؟در حد صدم یا دهم میلیمتر اختلاف هم برام مهمه…ممنون میشم اگه کسی مطلبی یا پاسخی داره بدونم…خیلی ممنون از سایت خوبتون؟؟؟امکان همکاری در یک پروژه مهم هم مقدور میباشد…با تشکر
سلام خسته نباشید ممنون از شما مطالب مفیدبود.میخاستم بپرسم که از تصاویر میشه نمودارجابه جایی وزمان رو نیز در متلب بدست آورد .ممنون میشم اگه دستور این بخش رو برام ایمیل کنید
سلام ازآموزش خوبتون ممنونم. من میخوام درتصویر مقیاس خاکستری لایه هاراتشخیص بدم اما چون شدت روشنایی خطوط در لایه ها از رو به زیر کم نمیشه وقانونی نداره نمیتونم ازآستانه گذاری استفاده کنم .چکار باید بکنم؟ آیادر متلب دستوری برای تشخیص عمق در تصویر هست که بتونم هرلایه را باتوجه به عمق قرارگرفتنش در تصویر جداکنم؟
سلام وقت شما بخیر
من میخوام رزولوشن یک تصویر رو تغییر بدم به دلخواه مثلا ۱۲۸در ۱۲۸ بشه رزولوشن ولی ابعاد تصویر تغییر نکنه
چجوری باید از کد resize استفاده کنم؟
سلام. خسته نباشید،خیلی خوب و سریع،بدون حواشی توضیح داده بودید ،ممنون.
من یک سوال داشتم،اکر تعداد پیکسلهای با یک فرکانس خاص را در یک عکس بخوام چه دستوری هست؟
سلام وقت شما بخیر. من میخواستم بر روی عکس های SEM که از سطح خاک گرفته شده، آنالیز تصویر انجام بدم و هدفم تعیین تعداد ذرات موجود در تصویر و تعداد حفرات…همچنین مشخص کردن سطح تماس ذرات با یکدیگر و شکل حفرات میباشد. آیا از طریق کدنویسی در متلب آمکان پذیر میباشد؟
سلام
ممنون بابت مطالب و توضیحات خوبتون. روی یه مقاله کار می کنم که یادگیری حرکات هست از طریق تصاویر.
چند هزارتا تصویر دارم که می خام به عنوان ورودی توی متلب تعریف کنم. ممنون میشم راهنمایی بفرمایید که از چه دستوراتی برای ورود تصاویر استفاده کنم
ممنون
با سلام؛
از همراهی شما با مجله فرادرس سپاسگزاریم. در متلب برای خواندن دادهها از فایلها و به آنها، از توابع import (وارد کردن) و export (صادر کردن) استفاده میشود. اما معمولا هنگامی که کاربر با کلان داده (Big Data) مواجه است یا مجموعه دادهای حاوی فایلهای زیاد و حجیم دارد، معمولا از روشهای وارد کردن تدریجی دادهها استفاده میشود. یکی از این روشها، استفاده از Datastore است. شما میتواند با ساخت Datastoreها در هر مرحله از زمان به بخش کوچکی از دادهها دسترسی داشته باشید. راهکارهای دیگری نیز برای این موضوع (مانند Memory Mapping و MAT-files) وجود دارند که متناسب با شرایط مجموعه داده خود و آشنایی با قابلیتهای متلب، میتوانید از آنها استفاده کنید. مطالعه مطالب زیر نیز در این راستا به شما پیشنهاد میشود.
تقلب نامه (Cheat Sheet) توابع و دستورات متلب (MATLAB)
تقلب نامه (Cheat Sheet) یادگیری ماشین در متلب — راهنمای کاربردی
پیادهسازی سیستم تشخیص چهره در متلب — راهنمای کاربردی
پیروز، شاد و تندرست باشید.
با عرض سلام و خداقوت خدمت اساتید گرامی،چطور میتوان هیستوگرام یک تصویر خاکستری و یا تصاویر دیگر رو با هیستوگرام یک تصویر دیگه تطبیق (image maching) کرد بطوری که هردو یک هیستوگرام رو داشته باشند.کدی که این عمل رو انجام میده رو کجا میتونم دریافت کنم.
باتشکر.
سلام
میخوام در چندین تصویر نقاط زیر را انتخاب کنم:
(x1,y1)
(x2,y2)
(x3,y3)
.
.
.
(xn,yn)
این نقاط ،نقاطی هستن که در نرم افزار paint شروع به رسم کادری میکنند قسمت پایین و راست تصویر رانتخاب میکند،به طوری که نقطه ی شروع سطربالا باید از سطر پایین ار خود بزرگتر باشد به گونه ای که هرنقطه که درکادر تصویر بعدی قرار میگیرداز محدوده ی کادر قبلی خارج نشود،سایز تصاویر باهم برابر نیستن آیا کسی راه حلی برای این مساله دارد؟
چه رابطه بین اندازه های مختلف و نقطه انتخاب شده باشد تا این اتفاق بیافتد(نقاط شروع اولی عقب از دومی و همچنین رومی نسبت به سومی )
ممنون میشم منو راهنمایی کنید
ازبازدیدکنندگان محترم نیز ممنون میشم اگه اطلاعاتی در این زمینه دارند
سلام یه سوال داشتم
علت این که دو تا تصویر باهم متفاوت هستند ولی هیستوگرام یکسانی دارند علت در چیست؟
با سلام؛
از همراهی شما با مجله فرادرس سپاسگزاریم. هر ستون در نمودار هیستوگرام بیانگر آن است که چه تعداد پیکسل در تصویر، دارای مقدار پیکسلی هستند که توسط آن ستون نمایش داده شده است. اما هیستوگرام اطلاعاتی پیرامون موقعیت قرارگیری آن پیکسل ارائه نمیکند. در نتیجه، دو تصویر متفاوت میتوانند نمودار هیستوگرام یکسانی داشته باشند.
شاد، پیروز و تندرست باشید.
سلام.
چگونه میشه تصویری که به صورت ترمال هست یعنی یک تصویر حرارتی هست که شامل طیف های رنگی هست را به تصویر اصلی و قابل مشاهده تبدیل کرد.ممنون میشم اگه جواب بدید.
واقعا عالی بود، بهترین متنی بود که در این زمینه خواندم. ای کاش ویدئوی آموزشی هم برای این درس تهیه کنید، چون به نظر عالی است.
با سلام؛
از همراهی شما با مجله فرادرس و ارائه بازخورد سپاسگزاریم. برای مشاهده آموزش در حوزه پردازش تصویر و ویدئو، مراجعه به مجموعه فیلمهای آموزشی فرادرس از طریق لینک زیر، پیشنهاد میشود:
مجموعه آموزش پردازش تصویر و ویدئو | مقدماتی تا پیشرفته
به طور خاص، یکی از عناوین آموزشی موجود در این مجموعه آموزشی در ادامه آمده است که مرتبط با این مطلب و زمینه مورد نظر شما محسوب میشود. با کلیک روی لینک میتوانید به صفحه آموزش مراجعه و توضیحات بیشتر پیرامون آن را مطالعه کنید.
آموزش پردازش تصویر در متلب
با احترام؛
پیروز، شاد و تندرست باشید.
سلام ممنون از مطالبتون بخشید برای مقاله میشه از این متن استفاده کرد برای پروژه دانشگاهی
سلام، وقت شما بخیر؛
شرایط استفاده از مطالب مجله فرادرس را میتوانید در این صفحه به شکل کامل مطالعه کنید.
سلام ببخشید من یک عکس از خودم گرفتم بعد روی صورتم یک ایموجی قرار دادم بعد نسخه اصلی عکس خودم رو پاک کردم آیا میتونم دوباره ایموجی رو حذف کنم و صورتم دوباره نمایان بشه.کسی میتونه این کارو انجام بده لطفا من راهنمایی کنه
با سلام
اگر دو تصویر رنگی را از هم تفریق کنیم و سپس بخواهیم به حالت اصلی برگردیم باید چه کار کنیم؟
چون در حالت عادی اعدادی که از imsubtract استفاده میکنیم و دوباره جواب بدست آماده را با تصویر کم شده imadd میکنیم دیگر جواب بدست آمده مثل تصویر اصل نمی باشد و دارای نقاطی بسیار روشن یا بسیار تاریک خواهد بود. به عبارتی اعدادی که حاصل تفریق آن کمتر از 0 بوده است را 0 در نظر گرفته است و اعداد بیشتر از 255 را نیز همان 255 در نظر گرفته است و لذا نمیتوانیم به اصل تصویر بازگردیم.
ضمنا این کار را هم با اعداد double امتحان کرده ام و هم با uint8 ولی فایده ای نداشت.
ممنون میشم راهنمایی ام کنید
با عرض سلام و تشکر بابت مطالب خوبی که منتشر کردید.
من سوالی دارم، اینکه پردازش ها در متلب چند بیتی اجرا میشوند؟
آیا 32 یا 64 بیتی هستند یا بسته به نوع تصویر تعداد بیت پردازش ها هم تغییر میکند؟
با سلام؛
از همراهی شما با مجله فرادرس سپاسگزاریم. از ارائه بازخورد و پیام محبتآمیز شما نیز قدردانیم. در پاسخ به این پرسش که آیا لزومی به استفاده از نسخه خاصی از مطلب (۶۴ بیت یا ۳۲ بیت) در پروزههای پردازش تصویر با توحه به عمق بیت تصویر وجود دارد یا خیر، باید گفت: «به طور کلی و در حالت عادی، خیر». در مقالات و پروژه های پردازش تصویری که با متلب انجام میشوند، نسخهای از متلب که استفاده شده است مشخص میشود و دلیل این امر تاثیر نسخههای ۶۴ و ۳۲ بیتی در سرعت و زمان اجرای پردازشها و برخی دیگر از محاسبات سطح پایین است. هر چند به طور کلی در رایانههای جدید به نظر میرسد استفاده از نسخههای ۶۴ بیت گزینه مناسبتری باشد.
۲. آیا بسته به عمیق بیت تصویر، نیاز به استفاده از پردازش خاصی
سلام
عالی بود.
دستتون درد نکنه!