پردازش تصویر چیست؟تعاریف و مفاهیم

پردازش تصویر چیست؟تعاریف و مفاهیم

پردازش تصویر چیست؟ #

امروزه پردازش تصویر یکی از پرطرفدارترین موضوعات در حوزه هوش مصنوعی و علوم کامپیوتر بشمار می‌رود.  Image Processing یکی از شاخه‌های هوش مصنوعی است که از مجموعه‌ای از روش‌ها جهت بهبود تصاویر تشکیل شده است. پردازش تصاویر غالباً از الگوهای یادگیری ماشین استفاده می‌کند.

 این فرایند شامل تبدیل یک عکس به فرم دیجیتال و انجام عملیاتی مانند بهبود کنتراست عکس، تغییر روشنایی عکس، تبدیل عکس رنگی به خاکستری، آشکارسازی لبه‌های عکس و… می‌شود. در واقع پردازش تصاویر یک مرحله اساسی در پردازش اولیه داده‌های تصویری محسوب می‌شود که روش‌های از پیش تعیین شده پردازش تصویر را بر روی تصاویر دوبعدی اعمال می‌کند. 

به بیانی ساده روش‌های پردازش تصاویر به دو حوزه منحصر‌به‌فرد تعلق می‌گیرند که عبارتند از: بهبود داده‌های تصویری جهت تجزیه و تحلیل توسط انسان و پردازش داده‌های تصویری برای درک توسط ماشین. لازم به ذکر است؛ در نهایت خروجی نهایی پردازش تصاویر در پروژه‌های مختلف هوش مصنوعی مانند فشرده‌سازی تصاویر، تشخیص چهره و تشخیص اشیا مورد استفاده قرار می‌گیرند.

شما با خواندن این مقاله با کلیات و مفاهیم ماشین ویژن آشنا خواهید شد و در ادامه درباره موارد زیر و بطور مفصل توضیح خواهیم داد.

تصویر چیست؟ #

برای داشتن درکی صحیح از Image Processing بهتر است در ابتدا با مفهوم تصویر آشنا شویم. در حوزه علوم کامپیوتر ابعاد یک تصویر بر اساس تعداد پیکسل‌های آن شناسایی می‌شود. هر پیکسل نقطه‌ای است که میزان تیرگی، سایه و یا رنگ را به خود اختصاص می‌دهد.

 در اولین مرحله فرایند پردازش تصاویر، عملیات ثابت و معینی به صورت پیکسل به پیکسل روی تصاویر اجرا می‌شود و  سرانجام در مرحله دوم مقادیر خروجی عملیات انجام شده بر روی هر پیکسل، قابل اندازه‌گیری است. به طور کلی طیف رنگی تصاویر شامل موارد زیر می‌شود:

تصاویر سیاه و سفید:

تصاویر سیاه و سفید یا  تصاویر باینری معمولاً برای متمایز کردن بخشی از یک تصویر رنگی مورد استفاده قرار می‌گیرند که هر پیکسل آن دارای یک (نماینده سفید) و دو مقدار صفر (نماینده سیاه) است.

پردازش تصویر - سیاه و سفید

تصاویر خاکستری:

شامل پیکسل‌هایی با یک عدد صحیح بین 0 تا 225 است. 0 کاملاً سیاه و 225 کاملاً سفید است.

 

RGB:

این طیف شامل تصاویر رنگی قرمز، سبز و آبی می‌شود و هر پیکسل از سه عدد صحیح بین 0 تا 255 تشکیل می‌شود و این تعداد صحیح نمایانگر شدت این رنگ‌ها هستند.

پردازش تصویر - RGB

RGBA:

شامل RGB به اضافه فیلد آلفا است و نمایانگر میزان شفافیت تصاویر است.

خروجی‌های پردازش تصویر چیست؟ #

طی فرایند پردازش تصویر، عملیات متعددی بر روی تصویر وارد شده اعمال می‌شود و در نهایت یک تصویر استخراج می‌شود؛ انواع خروجی‌های پردازش تصویر عبارتند از:

  • شناسایی و تشخیص یک ویژگی خاص در تصویر
  • ویرایش تصویر
  • بهبود تصویر
  • نمایش یا چاپ تصویر
  • فشرده‌سازی تصویر

تفاوت پردازش تصاویر با بینایی ماشین چیست؟ #

بینایی ماشین Machine Vision یکی از شاخه‌های پیشرفته  هوش مصنوعی و یکی از قابلیت‌های سیستم کامپیوتری برای درک محیط اطراف از طریق چندین چشم دیجیتالی و یک سیستم تحلیلگر قوی است که برای تبدیل آنالوگ به دیجیتال و تحلیل آن مورد استفاده قرار می‌گیرد. اگرچه سیستم بینایی‌ماشین مبتنی بر پردازش تصویر است؛ باید در نظر داشت تفاوت اصلی میان بینایی ماشین و پردازش تصویر، نه در روش‌ها و متدهای این دو تکنولوژی، بلکه در هدف نهایی آن‌ها است.

 هدف بینایی ماشین شبیه‌سازی قابلیت‌های بصری انسان مانند تشخیص اشیا، شناسایی عیوب موجود در سیستم‌های مهندسی، تشخیص انواع بیماری‌ها و… است؛ در حالی که هدف اصلی IP بهبود کیفیت تصاویر برای استفاده‌های دیگر است. 

به طور کلی می‌توان گفت انواع عملکردهای پردازش تصویر شامل تجسم و یافتن اشیای غیر قابل مشاهده در تصویر، تشخیص اشیا در تصویر، ایجاد یک تصویر واضح و پیشرفته‌تر از تصویر اولیه، تشخیص و دسته‌بندی الگوهای موجود در تصویر و در نهایت جستجوی تصاویر دیجیتال در یک پایگاه اطلاعاتی می‌شود.

مهمترین بخش‌های تشکیل‌دهنده پردازش تصاویر چیست؟ #

یک سیستم پردازش تصویر دیجیتال محدوه وسیعی از سخت‌افزارها و نرم‌افزارها را در‌بر‌می‌گیرد. سخت‌افزارهای پردازش تصویر متشکل از یک واحد منطق حسابی است که عملیات حساب و منطقی را به صورت همزمان بر روی تصاویر انجام می‌دهد و نرم‌افزارهای پردازش تصویر از کدهای از قبل آماده شده تشکیل شده‌اند. به طور کلی می‌توان اجزای image processing را در موارد زیر خلاصه کرد:

سنسورهای تصویر:

سنسورهای دوربین با جمع‌آوری نورهای ورودی و تبدیل آن به سیگنال‌های الکتریکی، فرایند اندازه‌گیری و ارائه خروجی را انجام می‌دهند. جهت جمع‌آوری تصاویر دیجیتال توسط سنسورها، دو بخش مورد نیاز است: یک حسگر که توانایی تشخیص انرژی ساطع شده از سوژه مورد نظر را دارد و دیگری یک مبدل دیجیتال است که خروجی دستگاه حسگر را به شکل دیجیتال تبدیل می‌کند.

ذخیره و نگهداری داده:

بخش ذخیره‌سازی جهت حفظ و نگهداری اطلاعات ضروری است که در انواع ذخیره‌سازی کوتاه‌مدت، ذخیره‌سازی آنلاین و ذخیره‌سازی فشرده و با حجم بالا قابل دسترسی است.

چاپگرها :

تجهیزات چاپی که در سیستم پردازش تصویر جهت ضبط تصاویر مورد استفاده قرار می‌گیرند شامل چاپگرهای لیزری، چاپگرهای جوهرافشان، دوربین‌های ضبط فیلم، تجهیزات دیجیتالی و… می‌شوند.

شبکه‌سازی:

یکی از اجزای مهم و اساسی IP شبکه است که جهت ارسال داده‌های بصری مورد استفاده قرار می‌گیرد.

مراحل image processing چیست؟​ #

مرحله اول: دریافت تصویر

تهیه و گرفتن عکس، اولین مرحله از فرایند پردازش تصویر است که در حین آن یک سنسور عملیات تصویربرداری را انجام می‌دهد و اگر خروجی دوربین، یک تصویر دیجیتال نباشد؛ مبدل آنالوگ به دیجیتال تصویر را به تصویری دیجیتالی تبدیل می‌کند.

مرحله دوم: ویرایش و افزایش کیفیت تصویر

در این گام با ویرایش و بهبود تصویر، افزایش کنتراست یا تغییر میزان روشنایی و برجسته‌سازی ویژگی‌های مورد نظر در یک عکس، می‌توان میزان مؤفقیت فرایندهای بعدی پردازش تصویر را به نحو چشمگیری افزایش داد.

مرحله سوم: بازیابی و ترمیم تصاویر

این مرحله متکی بر مدل‌های ریاضی و احتمالات است و به بهبود ظاهر یک تصویر و ترمیم خرابی و پارگی‌های آن می‌پردازد.

مرحله چهارم: پردازش رنگ تصویر​

پردازش رنگ تصویر به دلیل استفاده بالای تصاویر رنگی در اینترنت از اهمیت بسیاری برخوردار است و شامل انواع روش‌های مدلسازی رنگ در زمینه دیجیتال می‌شود.

مرحله پنجم: تقسیم‌بندی و تشخیص اشیا

طی این مرحله تقسیم‌بندی اجزای تشکیل‌دهنده یک تصویر صورت می‌گیرد که یکی از متداول‌ترین بخش‌های آن آستانه‌گذاری باینری است که در آن هر پیکسل یا سیاه یا سفید است و این امر موجب می‌شود اشیا در تصویر طبقه‌بندی شوند.

مرحله ششم: پردازش رزولوشن چندگانه و فشرده‌سازی

در این مرحله تصاویر به بخش‌های کوچکتری جهت فشرده‌سازی اطلاعات و بازنمایی هرمی تقسیم می‌شوند. این کار مخصوصاً زمانی صورت می‌گیرد که تصویر شما برای استفاده در اینترنت در نظر گرفته شده باشد.

پردازش تصویر - پیکسل

مرحله هفتم: دستکاری و پردازش ساختار تصویر

تغییر ظاهر تصویر، حذف یک شی ناخواسته و یا افزورن یک شی که در تصویر موجود نیست بخشی از مرحله پردازش ساختار تصویر است که در آن از تکنیک‌ مدل‌های یادگیری عمیق استفاده می‌شود.

مرحله هشتم: بازنمایی و استخراج تصاویر​

مرحله تولید تصاویر شامل دریافت یک تصویر خروجی و استفاده از نتیجه آن می‌شود.

چه الگوریتم‌هایی در پردازش تصویر مورد استفاده قرار می‌گیرند؟ #

  • تشخیص لبه
  • تقویت کنتراست و رنگ
  • برچسب‌گذاری و شناسایی
  • تقویت نقاط خاص با الگوریتم انتشار خطا
  • جستجوگر Difference map

کاربردهای پردازش تصویر چیست؟​ #

امروزه پردازش تصویر در عرصه‌های گوناگونی مانند صنعت، کشاورزی، هواشناسی، شهرسازی و … مورد استفاده قرار می‌گیرد که از مهم‌ترین این حوزه‌ها می‌توان به موارد زیر اشاره کرد:

کاربرد پردازش تصاویر در صنعت:

در حال حاضر سیستم‌های مجهز به Image processing بخشی جدانشدنی از صنایع و کارخانه‌ها محسوب می‌شوند. بسیاری از عملیات خط تولید مانند تولید، بسته‌بندی محصولات، شمارش تعداد محصولات، شناسایی کالاهای معیوب و … با استفاده از پردازش تصویر در مقیاسی وسیع و با صرف زمان بسیار کم امکان‌پذیر شده است.

کاربرد پردازش تصاویر در شناسایی و تشخیص چهره:

یکی از پرکاربردترین زمینه‌های پردازش تصویر، شناسایی و تشخیص چهره است. جهت انجام فرایند تشخیص چهره توسط پردازش تصویر، الگوریتم‌های یادگیری عمیق مورد استفاده قرار می‌گیرند. بدین ترتیب که ابتدا با بهره‌مندی از یادگیری عمیق، اطلاعاتی مانند فرم صورت، اندازه اجزای چهره، فاصله میان دو چشم و … به ماشین آموزش داده‌ می‌شود؛ پس از آن با انجام مقایسه چهره جدید با اطلاعات موجود در پایگاه داده ، نتیجه نهایی اعلام می‌شود. از جمله کاربردهای تشخیص چهره توسط پردازش تصویر می‌توان به فیلترهای تلفن همراه، امنیت و احراز هویت بیومتریک اشاره کرد.

کاربرد پردازش تصاویر در رباتیک:

Robot Vision یا دیده شدن اشیا توسط ربات با بهره‌مندی از ترکیبی از دوربین‌ها، سخت‌‌افزارها و الگوریتم‌های کامپیوتری امکان‌پذیر است. این قابلیت به ربات امکان شناسایی و پردازش داده‌های بصری را می‌دهد. در تمامی مراحل این فرایند تکنیک‌های پردازش تصویر مورد استفاده قرار می‌گیرند.

کاربرد پردازش تصاویر در بازیابی تصاویر پزشکی:

یکی از حوزه‌های حائز اهمیت که Image Processing کاربرد فراوانی در آن دارد؛ علوم پزشکی است. بهره‌مندی از پردازش تصویر باعث افزایش دقت و سرعت در برنامه‌های درمانی شده است. پردازش تصویر با ارائه الگوریتم‌های منحصر‌به ‌فرد در زمینه تست و ارزیابی، تشخیص و درمان بیماری‌ها بسیار تأثیرگذار است.

کاربرد پردازش تصاویر در فناوری سنجش ترافیک:

در سنجش ترافیک سیستم پردازش تصویر ویدیویی یا VIPS مورد استفاده  قرار می‌گیرد که متشکل از سیستم ضبط تصاویر، سیستم ارتباط از راه دور و سیستم پردازش تصویر است. این سیستم دارای چندین ناحیه معین است که هنگام ضبط ویدیو با ورود و خروج وسیله نقلیه سیگنال‌ها روشن و خاموش می‌شوند.

 این موضوع به تشخیص میزان ترافیک در مناطق خاص کمک می‌کند. از دیگر مزایای کاربرد پردازش تصویر در کنترل ترافیک می‌توان به تشخیص پلاک خودرو به صورت اتوماتیک، تشخیص مشخصات اتومبیل، میزان سرعت خودرو و… اشاره کرد.

کاربرد پردازش تصاویر در صنایع نظامی:

تعیین محل دقیق پرتاپ بمب و موشک با استفاده از پردازش تصویر از مهمترین کاربردهای این فناوری در عرصه صنایع نظامی است. یکی دیگر از کاربردهای قابل توجه پردازش تصویر در صنایع نظامی و دفاعی، استگانوگرافی و پنهان کردن پیام‌های محرمانه در تصاویر است به طوری که هیچ‌کس جز فرستنده و گیرنده پیام به وجود پیام مخفی شک نخواهد کرد.

پردازش تصویر - نظامی

کاربرد یادگیری عمیق در پردازش تصاویر چیست؟ #

در پردازش تصویر برای انجام مواردی مانند حذف نویز از تصاویر، تبدیل و ترجمه عکس به عکس و حذف بک گراند از تصویر ار یادگیری عمیق استفاده می‌شود که از طریق شبکه‌های عصبی مصنوعی صورت می‌گیرد.

مزایای پردازش تصویر چیست؟ #

از مهمترین مزایای استفاده از پردازش تصویر می‌توان به موارد زیر اشاره کرد:

  • امکان انتقال الکترونیکی آسان تصاویر
  • تسهیل ذخیره و بازیابی سریعتر تصاویر
  • تنظیم کنتراست و چگالی پیکسل‌های تصاویر
  • در دسترس قرار دادن تصاویر دیجیتال با فرمت‌های متنوع مانند: عکس نگاتیو، اشعه ایکس و…
  • بهبود تصاویر جهت تفسیر توسط انسان یا درک بوسیله ماشین
  • دقت و سرعت بالا
  • جداسازی بافت مفید از تصویر

استخراج هرچه بیشتر اطلاعات با بهره‌مندی از پردازش تصویر

بهترین زبان‌های برنامه‌نویسی در حوزه پردازش تصاویر کدامند؟ #

  • پایتون Python
  • متلب Matlab
  • جاوا Java با استفاده از کتابخانه Java C

سی C، سی پلاس پلاس C++، سی شارپC#  با استفاده از Open CV

پردازش تصاویر با چه چالش‌هایی رو‌به‌رو است؟ #

شاید بتوان گفت اصلی‌ترین چالش در حوزه پردازش تصویر، دستیابی این فناوری به سطحی از بینایی است که تقریباً با بینایی انسان برابری داشته باشد. این در حالی است که متخصصان در زمینه درک چگونگی سیستم بینایی بشر نیز با مسائل پیچیده‌ای رو‌به‌رو هستند. 

یکی دیگر از مهم‌ترین موانع در توسعه و گسترش پردازش تصاویر در عرصه‌های گوناگون، بالا بودن هزینه‌ها جهت فراهم آوردن میلیاردها سنسوربه منظور دریافت نتایج بسیار دقیق است. از دیگر موانع پیش روی پردازش تصویر حجم بالای داده‌ها و نبود فضای کافی برای ذخیره‌سازی آن‌هاست.

نتیجه گیری #

در حال حاضر با رشد و توسعه شاخه‌های مختلف هوش مصنوعی نظیر یادگیری عمیق و بینایی ماشین، نیاز به استفاده از ابزارها و تکنیک‌های پردازش تصویر در عرصه‌های گوناگون علوم کامپیوتر بیش از پیش احساس می‌شود. از طرفی دیگر با افزایش میزان تقاضا جهت بهره‌مندی از فناوری پردازش تصویر در حوزه‌های مختلف علوم و صنعت، نمی‌توان نقش چشمگیر پردازش تصویر را نادیده گرفت.

 در عصر حاضر با  کاربرد قابلیت‌های IP در حرفه‌ها و صنعت‌های گوناگون شاهد پیشرفت چشمگیری در زمینه علم و تکنولوژی هستیم. در واقع پردازش تصاویر عرصه جدیدی را در رابطه بشر و کامپیوتر بوجود آورده است  و در آینده‌ای نه چندان دور سیستم‌های مجهز به پردازش تصویر جایگزین نیروی انسانی خواهند شد.

منابع #

برای کسب اطلاعات بیشتر و یا دسترسی به منابع این مقاله می‌توانید از لینک‌های زیر استفاده کنید.

https://www.simplilearn.com/image-processing-article

https://veerasense.com/blog/image-processing/

لینک کوتاه این مقاله:
veerayco_admin
veerayco_admin

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *