علم و فناوری

راهکاری برای توسعه ربات‌های با قابلیت تشخیص حالت چهره انسان

محققان دانشگاه صنعتی امیرکبیر موفق به تحلیل تصویر چهره با استفاده از فناوری هوش مصنوعی شدند که می‌تواند حالت چهره را به‌صورت مستقل از شخص در تصاویر کنترل‌نشده شناسایی کند و به گفته آنها این روش می‌تواند محققان را در ساخت ربات‌های با قابلیت تشخیص حالت چهره انسان و ارتباط انسان با رایانه یاری کند.

به گزارش ایسنا، دکتر حمید صادقی، فارغ‌التحصیل دانشگاه صنعتی امیرکبیر و مجری طرح “شناسایی حالت چهره مستقل از شخص در تصاویر کنترل‌نشده” با اشاره به کاربردهای تحلیل تصاویر چهره در دنیای امروز،  گفت: یکی از تحلیل‌های مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز می‌کند مانند خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی که با استفاده از یک دوربین و پردازنده می‌توان چهره فرد را همواره به‌صورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد.

وی با بیان اینکه افت کارایی روش‌های موجود در مواجهه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترل‌نشده» از ضعف های این حوزه به شمار می‌رود، اضافه کرد: به همین دلیل، ما در رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترل‌نشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت می‌شود و لزوماً فرد به‌طور مستقیم به دوربین نگاه نمی‌کند.

صادقی اضافه کرد: در این تحقیق، با استفاده از هوش مصنوعی روش‌های جدیدی ارائه کردیم که باعث شد شناسایی حالت چهره هم در تصاویر کنترل‌شده و هم در تصاویر کنترل‌نشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانه‌های موجود انجام شود. روش‌های جدید ارائه‌شده در این تحقیق، محدود به شناسایی حالت چهره نیست و می‌تواند در مسائل مختلف یادگیری ماشین نیز استفاده شود. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیاء) اثبات شده‌است.

مجری طرح با بیان اینکه یکی از مهم‌ترین تئوری‌هایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقه‌بندی ویژگی‌های هیستوگرامی است، گفت: محققانی که در زمینه بینایی ماشین کار می‌کنند، به‌خوبی می‌دانند که ویژگی‌های هیستوگرامی استفاده زیادی در این زمینه دارند و روش ارائه‌شده در حل این مسائل بسیار مؤثر خواهد بود.

صادقی با تاکید بر اینکه چهره‌های تصاویر کنترل‌نشده معمولاً پیچیدگی‌های زیادی دارند، در این باره توضیح داد: مثلاً تغییرات شدید زاویه سر، پوشیدگی بخش‌های مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و … همگی از عواملی هستند که دقت شناسایی حالت چهره را تحت تأثیر قرار می‌دهند. با این توصیف، شناسایی حالت چهره در تصاویر کنترل‌نشده مثل یک مسأله بسیار پیچیده است.

وی با بیان اینکه در یادگیری ماشین، برای حل این مسائل بهتر است که از یادگیری مبتنی بر نمونه استفاده شود، خاطر نشان کرد: بر این اساس می توان از یادگیری متریک به‌عنوان یک رویکرد پیشرفته از یادگیری مبتنی بر نمونه در این نوع مسائل استفاده کرد و با این پیش‌زمینه، رویکرد یادگیری متریک برای شناسایی حالت چهره در تصاویر کنترل‌نشده انتخاب شد.

این دانش آموخته دانشگاه امیرکبیر ادامه داد: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعه‌ای از اطلاعاتی که به آن بردار ویژگی گفته می‌شود، توصیف می‌شود. در ادامه از یک روش یادگیری ماشین برای طبقه‌بندی این ویژگی یا تعیین نوع حالت چهره استفاده می‌شود. ویژگی‌هایی که در بینایی ماشین و پردازش تصویر استفاده می‌شوند معمولاً از جنس هیستوگرام هستند؛ به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقه‌بندی ویژگی‌های هیستوگرامی ارائه کردیم که مبنای ریاضی آن استفاده از فاصله مربع کای است.

وی گام بعدی در این تحقیق را طراحی یک ویژگی قابل یادگیری برای کاربرد مد نظر به‌جای استفاده از ویژگی‌های متداول هیستوگرامی دانست و گفت: برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگی‌هایی از جنس هیستوگرام از تصویر استخراج می‌کند.

وی ادامه داد: این شبکه عصبی از تئوری یادگیری متریک بومی ذکرشده برای شناسایی حالت چهره استفاده می‌کند. با استفاده از این شبکه عصبی، نه تنها بخش طبقه‌بندی، بلکه بخش استخراج ویژگی از تصویر هم قابل آموزش بوده و باعث می‌شود دقت شناسایی حالت چهره افزایش قابل توجهی داشته باشد.

صادقی با اشاره به کاربرد این تحقیقات گفت: تئوری‌های یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارائه‌شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارائه‌شده می‌تواند در طبقه‌بندی سایر ویژگی‌های مبتنی بر هیستوگرام نیز استفاده شود.

وی با اشاره به مزیت‌های رقابتی طرح، گفت: علاوه بر دقت بالاتر نسبت به روش‌های دیگر، در این پژوهش سعی شده‌است که پیچیدگی محاسباتی در الگوریتم طراحی‌شده هم پایین باشد تا پیاده‌سازی آن هزینه زیادی دربرنداشته باشد. به‌عنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناخته‌شده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.

وی با اشاره به کاربردهای این پروژه گفت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام دادیم. اما روش‌های ارائه‌شده برای شناسایی حالت چهره در این تحقیق می‌توانند در کاربردهای مختلفی مانند ساخت ربات‌های با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد و … مورد استفاده قرار گیرند.

بر اساس اعلام روابط عمومی دانشگاه صنعتی امیرکبیر، این طرح با هدایت و راهنمایی دکتر ابوالقاسم اسدالله راعی عضو هیئت علمی دانشگاه صنعتی امیرکبیر اجرایی شد.

انتهای پیام

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.