بینایی کامپیوتر، یک حوزهٔ هوش مصنوعی است که به بررسی و تحلیل تصاویر و ویدئوها با استفاده از الگوریتم‌ها و روش‌های کامپیوتری می‌پردازد. هدف اصلی بینایی کامپیوتر، تأمین قدرت شناخت و تفسیر صحنه‌های دیداری توسط سامانه‌هاست. یکی از چالش‌های اصلی بینایی کامپیوتر، استخراج و تشخیص ویژگی‌های معناداری از تصاویر است.


بینایی ماشین

چگونگی الگوریتم ها

برای تحقق این هدف، از روش‌های متنوعی مانند رفتارگران نورونی، تبدیل فوریه، فیلترهای گابور، و تبدیل هاف استفاده می‌شود. این روش‌ها به کمک عملیات ریاضی و فیزیکی می‌توانند ویژگی‌های مهمی مانند لبه‌ها، نقاط کلیدی، رنگ‌ها، فرم‌ها و قالب‌ها را از تصاویر استخراج کنند. یکی از روش‌های مهم و استفاده‌شده در آن، شبکه‌های عصبی مصنوعی (ANNs) هستند. شبکه‌های عصبی مصنوعی مدلی از ساختار عصبی سامانه زنده انسانی می‌باشند که توسط الگوریتم‌های یادگیری ماشین تقلید شده‌اند.

این شبکه‌ها با تعداد زیادی نورون مصنوعی و لایه‌های مختلف وزن‌ها، ورودی‌ها را پردازش کرده و خروجی مورد نظر را تولید می‌کنند. با آموزش یک شبکه عصبی مصنوعی، آن‌ها می‌توانند الگوها و ویژگی‌های مرتبط با دسته‌های مختلف را تشخیص دهند.

 

 فراگیرترین رویکردهای استفاده شده در بینایی کامپیوتر

 

شبکه‌های عصبی عمیق (Deep Neural Networks) است. این شبکه‌ها، با ساختاری ژرف و تعداد بالای لایه‌ها، توانایی برتری را در تشخیص الگوها و ویژگی‌های پیچیده را دارند.شبکه‌های عصبی عمیق معمولاً با چندین لایهٔ پنهان (Hidden Layers) ساخته می‌شوند. هر لایه، مجموعه‌ای از نورون‌های برنامه‌ریزی‌شده را شامل می‌شود.

در نهایت

با یادگیری این شبکه‌ها با استفاده از مجموعه‌های دادهٔ وسیع و تنوع‌پذیر، می‌توان شبکه‌ها را قادر به تشخیص و شناسایی اشیا، گروه‌بندی دسته‌ها و تفسیر صحنه‌های دیداری نمود. همچنین، بینایی کامپیوتر یک نقش بسیار مهم در حوزهٔ خودرانی (Autonomous Driving) دارد. با استفاده از بینایی کامپیوتر و شبکه‌های عصبی عمیق، امکاناتی مانند تشخیص و علامت‌گذاری خودروها، تشخیص تابه‌واقعیت (Augmented Reality)، قدرت تشخیص عابرانی که در خیابان قصد عبور دارند، و سایر وظایف مرتبط با خودرانی را انجام می‌دهند.