کاهش رنگ تصویر با خوشه بندی | پیاده سازی در R

«خوشه بندی» (Clustering) از تکنیکهای معروف در زمینه «یادگیری ماشین» (Machine Learning) از نوع «بدون نظارت» (Unsupervised) یا غیرنظارتی است. بوسیله روشهای خوشهبندی، بسیاری از تکنیکهای تصویربرداری پزشکی مثل MRI، متحول شده است. به طوری که با استفاده از خوشهبندی، شناسایی تومورها و نواحی مربوط به جراحی تومر تعیین شده و آسیب کمتری به نواحی دیگر اعضای بدن میرسد. در این نوشتار از فرادرس میخواهیم به کمک خوشه بندی یک تصویر را تجزیه و تحلیل کرده و تعداد رنگهای آن را کاهش دهیم. این موضوع میتواند به نوعی، باعث کاهش کیفیت شده ولی در عوض، حجم فایل تصویری را هم کاهش میدهد. اغلب در فشردهسازی تصویر از خوشهبندی نیز استفاده میشود. به این ترتیب موضوع کاهش رنگ تصویر با خوشه بندی را با استفاده از کدهای زبان برنامهنویسی R پیادهسازی کرده و به کمک یک مثال گامهای لازم برای نحوه انجام کار را فرا میگیریم.
برای آشنایی بیشتر با موضوع پردازش تصویر رایانهای بهتر است ابتدا نوشتارهای بینایی کامپیوتر چیست؟ — به زبان ساده و آشنایی با خوشهبندی (Clustering) و شیوههای مختلف آن را مطالعه کنید. همچنین خواندن پردازش تصویر با پایتون — راهنمای کاربردی و JPEG بهتر است یا PNG؟ نیز خالی از لطف نیست.
کاهش رنگ تصویر با خوشه بندی
همانطور که اشاره شد، تکنیک خوشهبندی قادر است نقاط همسان یا شبیه را تعیین کرده و برای آنها یک نماینده ایجاد کند. در اغلب حالتها، روش به کار رفته در خوشهبندی، «خوشهبندی تفکیکی» یا «خوشهبندی افرازی» (Partitional Clustering) و از الگوریتم خاصی به نام k-means یا k-میانگین استفاده میشود. به این ترتیب به عنوان «معرف» (Profile) برای هر خوشه، از میانگین مقادیر یا ویژگیها در هر خوشه استفاده شده و به همین علت نیز نام این الگوریتم را k-میانگین گذاشتهاند.
این الگوریتم اولین بار توسط «جیمز مکوئین» (MacQueen) در سال 1967 به منظور معرفی خوشهبندی تفکیکی طی مقالهای، معرفی شد. بعدها الگوریتم پیشنهادی وی، توسط «استوارت لوید» (Stuart Lloyd)، مورد بازبینی قرار گرفت و برای تبدیل پالس به کد در «آزمایشگاههای بل» (Bell Laboratory) به کار رفت. این الگوریتم به طور مستقل توسط فرد دیگری به نام «ادوارد فورجی» (Edward W. Forgy) نیز ابداع شد و به همین علت گاهی این الگوریتم را به نام «لوید-فورجی» (Lloyd- Forgy) میشناسند.
در این نوشتار میخواهیم به کمک این الگوریتم، عمل کاهش رنگ تصویر با خوشه بندی را انجام دهیم. در حقیقت با این کار رنگهای موجود در یک تصویر کمتر از حالت عادی خواهند شد. در این بین از زبان برنامهنویسی و محاسبات آماری R و بعضی از کتابخانههای آن بهره خواهیم برد. برای انجام این کار، مراحل یا گامهای زیر را طی خواهیم کرد.
- دریافت اطلاعات رنگهای به کار رفته در یک تصویر فرضی (در اینجا از یک تصویر درونی در R استفاده خواهیم کرد).
- خوشهبندی رنگها با توجه به تعداد رنگ درخواستی برای کاهش رنگ (مثلا ۵ رنگ اصلی)
- محاسبه مراکز خوشهها به عنوان رنگهای جایگزین برای طیف رنگهای اصلی
- جایگزین کردن طیف رنگها با رنگهای حاصل از خوشهبندی در تصویر و نمایش تصویر جدید
گام اول: دریافت اطلاعات یک فایل تصویری
ابتدا کتابخانههای مورد لزوم برای انجام این کار را معرفی میکنیم. کد زیر برای نصب کتابخانههای مورد نظر، نوشته شده است. به این ترتیب بسیاری از محاسبات توسط توابع درون کتابخانهها صورت گرفته و کار برایمان بسیار سادهتر خواهد شد.
########################### # Install packages # # Run Once # ########################### install.packages("ggplot2") install.packages("scales") install.packages("jpeg")
البته به یاد داشته باشید که اجرای این بخش فقط یکبار صورت پذیرد، زیرا پس از اجرای این کد، این کتابخانهها روی رایانه شخصی و در نرمافزار R ثبت و کپی شدهاند. به منظور راهاندازی و بهرهگیری از این کتابخانهها نیز از دستورات زیر کمک بگیرد. به این ترتیب، کتابخانههای نصب شده، در حافظه قرار گرفته و توابع مربوط به آنها، در دسترس خواهند بود.
########################### # Load packages # # # ########################### library(ggplot2) library(scales) library(jpeg)
همانطور که میدانید، کتابخانه ggplot2 مربوط به ترسیم نمودارها است. با دستورات مربوط به این کتابخانه، تصویر فراخوانی شده را در دو حالت عادی و کاهش رنگ، ترسیم خواهیم کرد. کتابخانه scales نیز به منظور استفاده از تابع show_col به کار رفته است که «پالت رنگهای» (Color Palette) «قرمز-سبز-آبی» (RGB) را نمایش میدهد. کتابخانه JPEG نیز برای خواندن و نوشتن فایلهای تصویری با پسوند jpg مناسب است.
قطعه کد زیر، برای خواندن فایل تصویری و استخراج رنگهای آن مورد استفاده قرار گرفته است. هر یک از رنگهای RGB در یک بردار به نام R ,G و B ذخیره شدهاند. قرار است این بردارها در خوشهبندی با الگوریتم kmeans نقش داشته باشند.
########################### # Reading JPG File # # Extract its Colors # ########################### painting <- readJPEG(system.file("img", "Rlogo.jpg", package="jpeg")) dimension <- dim(painting) painting_rgb <- data.frame( x = rep(1:dimension[2], each = dimension[1]), y = rep(dimension[1]:1, dimension[2]), #slicing our array into three RGB colors R = as.vector(painting[,,1]), G = as.vector(painting[,,2]), B = as.vector(painting[,,3]) )
قبل از هر چیز بهتر است تصویر و پالت رنگی این فایل را مشاهده کنیم. دستورات زیر به این منظور نوشته شدهاند. تصویر مورد نظر در این متن همان لوگوی نرمافزار R است که به صورت یک فایل سیستمی و تصویری به نام Rlogo.jpg ثبت و در حافظه ذخیره شده است.
########################### # Plot the image # # and colors palette # ########################### ggplot(data = painting_rgb, aes(x = painting_rgb$x, y = painting_rgb$y)) + geom_point(colour = rgb(painting_rgb$R,painting_rgb$G,painting_rgb$B)) + labs(title = paste("Original Image")) + xlab("x") + ylab("y") show_col(rgb(painting_rgb$R,painting_rgb$G,painting_rgb$B),labels = FALSE)
نتیجه اجرای این کد، تصویرهایی است که در ادامه قابل مشاهده است. در تصویر ۱، نمایشی از فایل JPG در مختصات دکارتی را میبینید که قرار است کاهش رنگ تصویر با خوشه بندی روی آن اتفاق بیافتد.

در تصویر شماره ۲، پالت رنگی (الگوی رنگهای به کار رفته در تصویر) را ملاحظه میکنید. مشخص است که تعداد رنگها بسیار زیاد هستند. توجه داشته باشید که شاید این رنگها تکراری به نظر برسند ولی اگر کدهای رنگ آنها را نیز به جدول اضافه کنید، متوجه خواهید شد که با یکدیگر حداقل از لحاظ کد رنگ، تفاوت دارند. به این منظور کافی است در تابع show_col، پارامتر labels=FALSE را به صورت labels=TRUE درآورید. این کار را در پالت رنگی که حاصل از نتایج خوشهبندی است در تصویر 3، انجام دادهایم.

اگر میخواهید در مورد کاهش رنگ تصویر با خوشهبندی بیشتر بدانید، بهتر است فیلم آموزشی فرادرس با عنوان کاهش تعداد رنگ تصاویر با استفاده از روشهای خوشهبندی هوشمند را مشاهده کنید. لینک دسترسی به این فیلم آموزشی در ادامه قرار داده شده است.
- برای مشاهده فیلم آموزش کاهش تعداد رنگ تصاویر با استفاده از روش های خوشه بندی هوشمند + اینجا کلیک کنید.
گام دوم: خوشهبندی رنگها
برای خوشهبندی مقادیر حاصل از چندین مشاهده (یا در اینجا نقطههای تصویر)، از تابع kmeans در R استفاده میکنیم. این تابع در کتابخانه Base قرار گرفته و احتیاج به بارگذاری ندارد. نتایج حاصل از اجرای کاهش رنگ تصویر با خوشه بندی توسط این تابع، میتواند اثر مناسبی در کاهش حجم تصویر داشته باشد. ابتدا مراکز خوشهها (Centers) و همچنین برچسب مشاهدات (cluster) و تعلق به هر خوشه را مشخص میکنیم. در کد زیر این عمل اجرا شده و نتایج مربوط به مراکز و برچسبها در کلاسی به نام k_means ذخیره میشود. توجه داشته باشید که تعداد خوشهها یا تعداد مراکز توسط پارامتر centers=5 برابر با پنج در نظر گرفته شده است پس انتظار داریم از این مرحله، پنج رنگ استخراج شده و تصویر نهایی براساس این تعداد رنگ ساخته شود.
########################### # Clustering Colors # # with kmeans function # ########################### k_means <- kmeans(painting_rgb[,c("R","G","B")], centers = 5, iter.max = 30) str(k_means)
نتیجه را به کمک تابع str به صورت زیر مشاهده خواهید کرد. مشخص است که پنج مرکز با سه مولفه یعنی کدهای R و G همچنین B ذخیره شده است. تعداد نقاط این تصویر نیز ۷۶۰۰ پیکسل است.
List of 9 $ cluster : int [1:7600] 3 3 3 3 3 3 3 3 3 3 ... $ centers : num [1:5, 1:3] 0.404 0.546 0.993 0.743 0.184 ... ..- attr(*, "dimnames")=List of 2 .. ..$ : chr [1:5] "1" "2" "3" "4" ... .. ..$ : chr [1:3] "R" "G" "B" $ totss : num 1709 $ withinss : num [1:5] 17.1 21.23 2.97 9.46 10.78 $ tot.withinss: num 61.5 $ betweenss : num 1647 $ size : int [1:5] 1397 1889 3020 656 638 $ iter : int 4 $ ifault : int 0 - attr(*, "class")= chr "kmeans"
در خروجی بالا مشخص است که این الگوریتم پس از ۴ بار تکرار همگرا شده و نتیجه حاصل از خوشهبندی، بدست آمده است. این مقدار در بخش iter مشخص شده. حال کافی است که مراکز خوشهها و همچنین برچسبها را از متغیر k_means استخراج کنیم.
نکته: یکی از ویژگیهای الگوریتم خوشهبندی kmeans، سرعت در همگرایی است. به همین منظور در اکثر مواردی که احتیاج به خوشهبندی سریع و از نوع تفکیکی یا افرازی داریم، از این الگوریتم بهره میبریم.
گام سوم: استخراج مراکز خوشهها و برچسب گذاری مشاهدات
محاسبه مراکز خوشهها به ما کمک میکند که برآیند یا نمایندهای برای هر طیف از رنگها ایجاد کنیم. به این ترتیب در گام سوم از کاهش رنگ تصویر با خوشه بندی که مرحله استخراج مراکز خوشهها است، عمل جایگزین کردن طیفها با رنگ جدید به عنوان نماینده هر خوشه را انجام داده و تعداد رنگها را کاهش میدهیم. از طرفی باید مشخص شود که هر «پیکسل» (Pixel) از تصویر متعلق به کدام طیف رنگی است. اینجا است که برچسبها یا متغیر cluster نقش ایفا کرده و نقاط مربوط به هر خوشه را مشخص میکنند. قطعه کدی که در ادامه میبینید برای استخراج مراکز و همچنین نسبت دادن برچسبها نوشته شده است.
########################### # Calculate Centers # # and recolor # ########################### kcenters = as.data.frame(k_means$centers) show_col(rgb(kcenters$R,kcenters$G,kcenters$B),labels = FALSE)
همچنین نمایش پالت رنگهای جدید (طیف رنگهای حاصل از خوشهبندی) نیز در تصویر ۳ ظاهر شده است. جایگذاری هر رنگ با رنگ حاصل از خوشهبندی نیز در انتهای کد دیده میشود. رنگهای اصلی به نظر خاکستری تیره، آبی فیلی، سفید، دلفینی و خاکستری تیره است. خانه آخری که در تصویر ۳، شامل رنگ نیست و برای تبدیل پالت رنگها به یک ماتریس کامل ایجاد شده است. به همین دلیل در تصویر آن را به صورت هاشور زده نمایش دادهایم.

گام چهارم: جایگزین کردن رنگها و نمایش تصویر جدید
در آخرین گام لازم است که رنگهای تصویر اصلی با رنگهای حاصل از خوشهبندی جایگزین شود. تصویر نهایی نیز به این ترتیب ساخته و به کمک تابع ggplot ترسیم خواهد شد. نکته مهم در این گام کد زیر است.
kcolors = rgb(k_means$centers[k_means$cluster,])
این تساوی، قادر است رنگ هر یک از نقاط را که بوسیله k_mean$cluster اندیسگذاری شدهاند را با رنگهای مربوط به مراکز خوشهها، جایگزین کند. تابع rgb باعث میشود که کد رنگهای RGB در متغیر kcolors قرار گیرد تا هنگام ترسیم تصویر، از پالت RGB استفاده شود.
########################### # Calculate Centers # # and recolor # ########################### kcenters = as.data.frame(k_means$centers) show_col(rgb(kcenters$R,kcenters$G,kcenters$B),labels = TRUE) kcolors = rgb(k_means$centers[k_means$cluster,])
در ادامه، برنامه و کدهای مربوط به رسم شکل مورد نظر آورده شده است. باز هم از تابع ggplot برای ترسیم تصویر جدید استفاده کردهایم. توجه داشته باشید که پارامترهای دیگری که در این قسمت آورده شده، مربوط به تعیین رنگ نقاط (geom_point) با پارامتر colour و همچنین عنوانها و برچسبهای محورهای نمایش داده شده (xlab , ylab) در تصویر است.
########################### # plot the image # # with reduced colors # ########################### ggplot(data = painting_rgb, aes(x = x, y = y)) + geom_point(colour = kcolors) + labs(title = paste("k-Means Clustering of", k_means$Clusters, "Colours")) + xlab("x") + ylab("y")
در تصویر ۴ میتوانید شکل جدید را مشاهده کنید. مشخص است که تعداد رنگها در طیف رنگی، باعث شده است که کیفیت تصویر کاهش یابد ولی در عوض فضای ذخیره سازی برای تعداد رنگها نیز کاهش خواهد داشت.

معرفی فیلم آموزش کاهش تعداد رنگ تصاویر با استفاده از روش های خوشه بندی هوشمند
در گاهی از اوقات تکنیک کاهش رنگ تصویر با استفاده از خوشه بندی صورت میگیرد. خوشبختانه در یکی از آموزشهای فرادرس در حوزه خوشهبندی و پردازش تصویر، به نام فیلم آموزش کاهش تعداد رنگ تصاویر با استفاده از روشهای خوشه بندی هوشمند، با صرف زمانی حدود یک ساعت و هجده دقیقه، میتوانید با سه الگوریتم معروف خوشهبندی تفکیکی، تکنیکهای کاهش رنگ را تجربه کنید.
کاهش رنگ یا Color Reduction (یا Color Quantization) یکی از راهکارهای کاهش حجم تصاویر نیز هستند. در این آموزش از فرادرس، کاربرد سه سبک یا شیوه خوشهبندی برای کاهش رنگ در تصاویر، به صورت عملی با کدهای متلب آموزش داده میشود. الگوریتمهای خوشهبندی به کار رفته در این آموزش به قرار زیر هستند.
- الگوریتم خوشه بندی k-Means (یا الگوریتم لوید) که یک شیوه خوشهبندی تفکیکی محسوب میشود.
- الگوریتم خوشه بندی فازی FCM که به آن Fuzzy c-means نیز میگویند. این الگوریتم برای هر نقطه، درجاتی از عضویت در یک خوشه محاسبه میکند و هر کس براساس آستانهای که در نظر میگیرد، یک نقطه را به یک خوشه متعلق خواهد کرد.
- نگاشت خود سازمان ده یا SOM که مخفف Self Organizing Map است، یک الگوریتم خوشهبندی است که برمبنای «شبکه عصبی مصنوعی» (Artificial Neural Network) عمل کرده و مقادیر را در دستههای مشخص طبقهبندی و ابعاد مشاهدات را کاهش میدهد.
این آموزش برای کسانی که در حوزه هوش مصنوعی یا بینایی ماشین فعالیت دارند بسیار مناسب و آموزنده است. از طرفی به کارگیری کدنویسی در متلب، ایجاب میکند که فراگیران از قبل با زبان و نحوه برنامهنویسی در محیط متلب (Matlab) آشنایی داشته باشند.
- برای مشاهده فیلم آموزش کاهش تعداد رنگ تصاویر با استفاده از روش های خوشه بندی هوشمند +اینجا کلیک کنید.
خلاصه و جمعبندی
همانطور که در این متن خواندید، کاهش رنگ تصویر با خوشه بندی، امری ساده و برنامه نویسی آن با امکانات زبان برنامهنویسی R به راحتی صورت میگیرد. ولی آنچه مهم است، تعیین تعداد رنگهای مناسب است که کاربران متوجه کاهش کیفیت تصویر ساخته شده نسبت به تصویر اصلی نباشند. بنابراین پارامتر $$k$$ که در این نوشتار به طور ثابت اختیار شد، خود جای بحث و بررسی بیشتر دارد. در بیشتر مواقع تکنیکهای دیگری نیز برای فشرده سازی تصویر و کاهش رنگها به کار میبرند که در قالبهای معروف تصویری مثل JPEG دیده میشود.