بازیابی تصاویر مرئی زیر آب بااستفاده از الگوریتم YOLO |
کد مقاله : 1162-ICNH |
نویسندگان: |
سارا معتمد *، الهام عسکری گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد فومن و شفت، گیلان، ایران |
چکیده مقاله: |
سابقه و هدف: امروزه تشخیص و بررسی موقعیت اشیاء و موقعیت یابی مکانی و اکتشافات دریایی جزء مهمترین مطالب در مسائل مربوط به ناوبری میباشد. بمنظور بررسی تمامی این مسائل نیاز به استفاده از روشهای یادگیری ماشین خواهد بود. در واقع در این فناوری ماشین تصاویر یا ویدئوها را میبیند و پس از پردازشهای دقیق و مناسب مکان اشیا تعریف شده و کلاس یا دستهبندی آنها را نیز مشخص میکند. لذا هدف از این مقاله ارائه روشهای بازیابی اشیاء خاص در تصاویر است که بیشترین میزان شباهت را در پاسخ به شی مورد جستجو داشته باشد. از دیگر هدفهای این مقاله ارائه روشی کارا با بالاترین نرخ تشخیص و زمان اندک بازشناسی میباشد. مواد و روشها: در این پژوهش از ترکیب الگوریتم YOLO و Fast R-CNN که کاملترین سیستم بلادرنگ در یادگیری عمیق و حل مسائل تشخیص اشیاء میباشد، استفاده شده است. روش کار این الگوریتم بدینصورت است که پس از خواندن تصاویر از الگوریتم YOLO برای حذف پسزمینه و سپس اعمال Fast R-CNN استفاده خواهد شد. بطور خلاصه ترکیب و روش کار این دو الگوریتم باهم بدینصورت است که برای هر باکسی که توسط Fast R-CNN پیشبینی میشود، چک میکنیم که آیا YOLO باکس مشابهی را پیشبینی کرده است یا خیر. درصورت تایید، پیشبینی از طریق احتمال YOLO تقویت میشود و همچنین همپوشانی بین دو باکس محاسبه و بهعنوان باکس نهایی نمایش داده میشود. مدل پیشنهادی در این مقاله بر روی پایگاه داده تصاویر مرئی، که از زیر آب جمع شده اعمال خواهد شد. این پایگاه داده شامل 9700 فریم از تصویر مرئی است که توسط یک وسیله نقلیه زیر آبی خودگردان جمع شده است. مکان تصویربرداری شامل سه غار تک شاخه و چندین تونل در اندازههای مختلف است که بخشی از یک غار وسیعتر در محدوده منطقه کاستا براوا در اسپانیا میباشد. یافتهها: که هرکدام از روشهای YOLO و Fast R-CNN به تنهایی دارای معایب و مزایای خاص خود میباشد، اما ترکیب این دو روش باعث میشود اکثر کاستیهای دو الگوریتم از بین بروند. زیرا الگوریتمYOLO خطاهای پسزمینه کمتری نسبت به Fast R-CNN تولید میکند و همین امر موجب بهبودی نرخ تشخیص خواهد شد. نتیجه گیری: در این مقاله روشی کارا جهت تشخیص موقعیتیابی اشیاء توسط بازیابی تصاویر تهیه شده در زیر آب معرفی شد. در این روش پیشنهادی و بمنظور تشخیص اشیاء در زیر آب ابتدا تصاویر از ورودی خوانده شده و سپس از ترکیب دو الگوریتم YOLO و Fast R-CNN استفاده خواهد شد. بمنظور بررسی عملکرد مدل پیشنهادی، این روش با روشهای مختلف یادگیری عمیق مقایسه شده است. با بررسی و مقایسه نتایج مشاهده میشود که مدل پیشنهادی از دقت بالاتری نسبت به سایر روشهای عمیق برخوردار است. |
کلیدواژه ها: |
تشخیص اشیاء، موقعیت یابی، شبکههای عصبی عمیق، الگوریتم YOLO، الگوریتم Fast R-CNN. |
وضعیت : چکیده برای ارائه به صورت پوستر پذیرفته شده است |