در دانشگاه امیركبیر محقق شد؛
شناسایی حالت چهره در شرایط كنترل نشده با هوش مصنوعی
به گزارش مداربسته محققان دانشگاه صنعتی امیركبیر موفق به تحلیل تصویر چهره با استفاده از فناوری هوش مصنوعی شدند كه می تواند حالت چهره را به صورت مستقل از شخص در تصاویر كنترل نشده شناسایی كند.
به گزارش مداربسته به نقل از دانشگاه صنعتی امیرکبیر، دکتر حمید صادقی فارغ التحصیل دانشگاه صنعتی امیرکبیر و مجری طرح «شناسایی حالت چهره مستقل از شخص در تصاویر کنترل نشده» اظهار داشت: تحلیل تصاویر چهره در دنیای امروز کاربردهای زیادی دارد. یکی از تحلیل های مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز می کند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته می شود.
وی اضافه کرد: حال سوالی که مطرح می شود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سؤال فرض کنید یک پزشک بخواهد به صورت مداوم در طول شبانه روز شرایط بیمار را ثبت و آمار آنرا بررسی کند.
وی افزود: با استفاده از یک دوربین و پردازنده می توان چهره فرد را همواره به صورت خودکار بررسی، حالت چهره آنرا شناسایی و برای پزشک ثبت کرد؛ حالت درد در چهره، یکی از حالت های چهره ای است که می توان برای این مسأله متصور بود.
به گفته فارغ التحصیل دانشگاه صنعتی امیرکبیر، از این دست نیازها در دنیای اطراف ما بسیار زیاد است.
وی ضمن اشاره به یکی از ضعف های تشخیص حالت چهره اظهار داشت: افت کارایی روش های موجود در مواجه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترل نشده» از ضعف های این حوزه به حساب می آید.
وی افزود: به همین دلیل، ما در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترل نشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت می شود. بعنوان مثال در این تصاویر فرد لزوماً به صورت مستقیم به دوربین نگاه نمی نماید.
وی تصریح کرد: در این تحقیق، با استفاده از هوش مصنوعی روش های جدیدی عرضه کردیم که سبب شد شناسایی حالت چهره هم در تصاویر کنترل شده و هم در تصاویر کنترل نشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانه های موجود صورت گیرد.
وی اظهار داشت: روش های جدید عرضه شده در این تحقیق، محدود به شناسایی حالت چهره نیستند و می توانند در مسائل مختلف یادگیری ماشین هم استفاده شوند. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیاء) اثبات شده است.
وی با اشاره به اینکه یکی از مهم ترین نظریه هایی که در این تحقیق عنوان شد، یک روش یادگیری متریک برای طبقه بندی خصوصیت های هیستوگرامی است، اظهار داشت: محققانی که در زمینه بینایی ماشین کار می کنند، به خوبی می دانند که خصوصیت های هیستوگرامی استفاده زیادی در این حوزه دارند و روش عرضه شده در حل این مسائل بسیار مؤثر خواهد بود.
صادقی اضافه کرد: چهره های تصاویر کنترل نشده معمولاً پیچیدگی های زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخش های مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و... همگی از عواملی هستند که دقت شناسایی حالت چهره را تحت تاثیر قرار می دهند. با این توصیف، شناسایی حالت چهره در تصاویر کنترل نشده مثل یک مسأله بسیار پیچیده است.
وی اضافه کرد: در یادگیری ماشین، برای حل این مسائل بهتر است که از یادگیری مبتنی بر نمونه استفاده گردد. اگر کمی پیشرفته تر به مسأله نگاه نماییم، می توان از یادگیری متریک بعنوان یک رویکرد پیشرفته از یادگیری مبتنی بر نمونه در این نوع مسائل استفاده نمود. با این پیش زمینه، رویکرد یادگیری متریک برای شناسایی حالت چهره در تصاویر کنترل نشده انتخاب گردید.
وی تصریح کرد: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعه ای از اطلاعاتی که به آن بردار خصوصیت گفته می شود، توصیف می شود. در ادامه از یک روش یادگیری ماشین برای طبقه بندی این خصوصیت یا تعیین نوع حالت چهره استفاده می شود.
وی اظهار داشت: خصوصیت هایی که در بینایی ماشین و پردازش تصویر استفاده می شوند معمولاً از جنس هیستوگرام هستند؛ به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقه بندی خصوصیت های هیستوگرامی عرضه کردیم که مبنای ریاضی آن استفاده از فاصله مربع کای است.
وی افزود: گام بعدی در این تحقیق این بود که به جای استفاده از خصوصیت های متداول هیستوگرامی، یک خصوصیت قابل یادگیری برای کاربرد مد نظر خود طراحی نماییم.
وی با اشاره به اینکه برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که خصوصیت های از جنس هیستوگرام از تصویر استخراج می کند، اظهار داشت: این شبکه عصبی از نظریه یادگیری متریک بومی ذکرشده برای شناسایی حالت چهره استفاده می نماید.
به گفته وی، با استفاده از این شبکه عصبی، نه تنها بخش طبقه بندی، بلکه بخش استخراج خصوصیت از تصویر هم قابل آموزش بوده و سبب می شود دقت شناسایی حالت چهره افزایش قابل توجهی داشته باشد.
وی ضمن اشاره به کاربرد این تحقیقات اظهار داشت: نظریه های یادگیری متریک و همینطور شبکه عصبی کانولوشنی عرضه شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده می باشد. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک عرضه شده می تواند در طبقه بندی سایر خصوصیت های مبتنی بر هیستوگرام هم استفاده گردد.
وی ضمن اشاره به مزیت های رقابتی طرح اظهار داشت: علاوه بر دقت بالاتر نسبت به روش های دیگر، در این پژوهش تلاش شده است که پیچیدگی محاسباتی در الگوریتم طراحی شده هم پایین باشد تا پیاده سازی آن هزینه زیادی دربرنداشته باشد. بعنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناخته شده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.
وی ضمن اشاره به کاربردهای این پروژه اظهار داشت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام دادیم. اما روش های عرضه شده برای شناسایی حالت چهره در این تحقیق می توانند در کاربردهای مختلفی مانند ساخت ربات های با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با کامپیوتر، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد و... مورد استفاده قرار گیرند.
به گزارش خبرنگارمهر، استاد راهنمای این پروژه دکتر ابوالقاسم اسدالله راعی عضو هیئت علمی دانشگاه صنعتی امیرکبیر بوده است.
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب