Применение нейросетевого классификатора для оценки эмоционального состояния человека
https://doi.org/10.35266/1999-7604-2025-1-3
- Р Р‡.МессенРТвЂВВВВВВВВжер
- РћРТвЂВВВВВВВВнокласснРСвЂВВВВВВВВРєРСвЂВВВВВВВВ
- LiveJournal
- Telegram
- ВКонтакте
- РЎРєРѕРїРСвЂВВВВВВВВровать ссылку
Полный текст:
Аннотация
Данная работа продолжает исследования авторов в области человеко-машинного взаимодействия. Рассмотрена задача распознавания эмоционального состояния человека в процессе его трудовой деятельности. Разработано программное обеспечение для выявления и классификации эмоций с помощью библиотеки DeepFace. Проведенная апробация программного обеспечения показала возможность его применения для идентификации функционального состояния человека.
Ключевые слова
Для цитирования:
Катаев М.Ю., Брагинский М.Я., Тараканов Д.В., Тараканова И.О. Применение нейросетевого классификатора для оценки эмоционального состояния человека. Вестник кибернетики. 2025;24(1):19-25. https://doi.org/10.35266/1999-7604-2025-1-3
For citation:
Kataev M.Yu., Braginsky M.Ya., Tarakanov D.V., Tarakanova I.O. Implementation of neural network classifier for assessing human emotional state. Proceedings in Cybernetics. 2025;24(1):19-25. (In Russ.) https://doi.org/10.35266/1999-7604-2025-1-3
ВВЕДЕНИЕ
Развитие цифровых фотографических систем (оптика, цифровая матрица, алгоритмы кодирования и системы сжатия) привело к тому, что изображение стало источником информации, важным для различных видов человеческой деятельности. Внедрение цифровых компьютерных технологий, в том числе и цифровой фотографии в разнообразные виды производств приводит к появлению возможностей для решения задач, которых ранее не было.
Одной из таких задач является оценка состояния человека при выполнении различных технологических операций на производстве, что связано с обеспечением качества выполнения работы и сохранности здоровья человека. Характерной чертой работы операторов является монотонная, напряженная работа в различных производственных условиях (пыль, шум, слабое освещение и т. д.), что может привести к эмоциональному срыву, физическому утомлению. В таком состоянии у работника рассеивается внимание, в результате увеличивается количество неточных действий и как следствие, ошибок. Другая задача опирается на встроенные технологии получения изображений и фиксации состояния человека как основы качественного изображения. Встречаются и варианты задач, которые связаны с определением эмоционального состояния человека.
Это состояние издавна интересовало философов, художников, врачей и фотографов, которые с разной результативностью и направленностью пытаются решить эту задачу на описательном или техническом уровне. Возможность получать изображение человека, особенно лица, привела к необходимости разработки различных подходов к оценке эмоционального состояния человека. Для этого необходимо внедрение новых и совершенствование известных методов, позволяющих фиксировать с заданной точностью реакцию человека на определенные события, проявляющуюся на лицевых мышцах. Оказывается, что те или иные эмоции человека приводят к повторяющимся изменениям лицевых мышц, что позволяет фиксировать это событие и идентифицировать типы эмоций.
Учитывая сказанное ранее, целью статьи является разработка подхода обработки изображений на основе нейросетевых методов, подготовка программного обеспечения и проверка его работы, получение результатов и их всесторонний анализ.
Началом использования системного подхода в решении задачи распознавания эмоций человека считают систему кодирования лицевых движений (Facial Action Coding System, или FACS), разработанную в 1978 г. П. Экманом и У. Фризеном [1]. В 90-х гг. ХХ в. появление средств вычислительной техники дало возможность обрабатывать графическую информацию с распознаванием движения различных областей лица [2–5]. В настоящее время наблюдается рост интереса к искусственному интеллекту, машинному обучению и компьютерному зрению. Современная технология OpenCV (Open Source Computer Vision Library) предоставляет набор инструментов для обработки изображений и видео, а Python является одним из популярных языков программирования для разработки приложений с использованием машинного обучения.
Такие приложения с функцией распознавания эмоций человека могут автоматизировать процесс анализа эмоционального состояния кандидата на собеседовании, что может повысить объективность в принятии обоснованных решений. В традиционных собеседованиях рекрутеры оценивают эмоциональное состояние кандидата на основе субъективных и не всегда точных ощущений (особенно с использованием конференц-связи), что может приводить к ошибочным выводам и неоправданным решениям.
Особое внимание заслуживает возможность применения таких систем распознавания эмоций при проведении учебного (тренировочного) процесса, а именно для анализа настроения и вовлеченности обучающихся в учебный (тренировочный) процесс. Актуальность в этой области состоит в том, что зачастую обучение (тренировка) происходит в групповом режиме и преподавателю (наставнику) физически невозможно наблюдать за состоянием обучающихся в каждый момент времени.
Также будет полезно применять такие системы отслеживания эмоций в коллективах, осуществляющих трудовую деятельность. Известно, что для повышения эффективности и безопасности функционирования человеко-машинных систем необходимо уделить особое внимание уровню подготовки операторов технологическими объектами управления. Для этого широко используют как электронные информационно-образовательные среды, так и специализированные компьютерные тренажеры [6–11]. Использование системы отслеживания эмоций в методах обучения позволяет учитывать индивидуальные особенности человека-оператора в плане его эмоциональных реакций в процессе профессионального тренинга.
МАТЕРИАЛЫ И МЕТОДЫ
Аппаратная часть установки включала персональный компьютер с операционной системой Windows 10 с подключенной через интерфейс USB веб-камерой Logitech C270. Эта камера имеет максимальное разрешение 1280×720 пикселей, что достаточно для качественного отображения лиц. При максимальном разрешении скорость видеосъемки достигает 30 кадров в секунду, а угол обзора объектива камеры составляет 55°. В камере реализована автоматическая фокусировка.
Для разработки программного обеспечения на языке программирования Python в качестве инструментальной среды разработки использовалась кроссплатформенная интегрированная среда PyCharm. Для поиска лиц в кадре применялся метод Виолы – Джонса, названный так по именам его разработчиков [12]. В основе данного метода лежит разбиение области изображения на графические элементы (так называемые примитивы Хаара), и в настоящее время многие алгоритмы распознавания образов широко его используют. Сами примитивы Хаара представляют собой прямоугольники, в свою очередь, состоящие из черно-белых геометрических областей в различных комбинациях, как показано на рис. 1.
Позже этот метод был усовершенствован и стал включать примитивы с поворотом на 45°, а также несимметричные примитивы [13][14].
Блок-схема алгоритма программы классификации эмоции показана на рис. 2.
В начале работы программы происходила загрузка каскадного классификатора Хаара для обнаружения лиц – cv2.CascadeClassifier (cv2.data.haarcascades) и инициализация веб-камеры. В случае успешного подключения камеры и считывания кадра производилось преобразование цветного изображения в полутоновое изображение (с оттенками серого). Это изображение выводилось на экран, на котором прямоугольной рамкой выделялась область лица: face = frame [y: y+h, x: x+w]. Затем осуществлялась классификация доминирующей эмоции с помощью библиотеки DeepFace, вывод на экран и запись в массив:
result = DeepFace.analyze (face, actions= [‘emotion’], enforce_detection=False)
emotion = result [0] [‘dominant_emotion’]
print (“Эмоция: “, emotion)
Массив FaceData, содержащий данные о пяти эмоциях: «Happy», «Fear», «Disgust», «Angry», «Neutral», их количестве, координаты лица, а также соответствующие номера кадров использовался для последующего анализа. Обработка кадров видеопотока происходила в цикле в течение одной минуты, затем массив FaceData экспортировался в табличный файл для просмотра в программе Excel (рис. 3).
Рис. 2. Блок-схема алгоритма программы классификации эмоции
Примечание: составлено авторами.
Рис. 3. Массив данных, экспортированный в файл Excel
Примечание: составлено авторами.
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
Разработанная программа была применена для выявления признаков утомления человека в процессе выполнения трудовых функций. В данном исследовании под оптимальным функциональным состоянием понималось состояние условно здорового человека в первый час рабочей смены. Соответственно, под состоянием утомления понималось психофизиологическое состояние этого же человека в конце рабочей смены в тот же день. Испытуемый должен был в течение одной минуты сидеть перед компьютером с веб-камерой для выявления и регистрации эмоций. Несмотря на то что испытуемый в это время не находился в процессе активного решения рабочих задач, в отдельные моменты его лицевые мышцы осуществляли непроизвольные сокращения малой амплитуды, которые были классифицированы системой как базовые эмоции «Happy», «Fear», «Disgust», «Angry» и «Neutral». По полученным данным были построены диаграммы распределения эмоциональных состояний человека, распознанных нейросетевым классификатором, показанные на рис. 4 и 5.
На рис. 4 показана круговая диаграмма соотношения распознанных классов эмоций в оптимальном функциональном состоянии человека, а на рис. 5 – круговая диаграмма соотношения распознанных классов эмоций этого же человека в состоянии утомления. Видно, что в случае оптимального функционального состоянии у человека наблюдается более разнообразная мимика, а в состоянии утомления – более скудная, с возрастанием доли «Angry» с 5 до 11 %.
Рис. 4. Круговая диаграмма соотношения распознанных классов эмоций в оптимальном функциональном состоянии
Примечание: составлено авторами.
Рис. 5. Круговая диаграмма соотношения распознанных классов эмоций в функциональном состоянии утомления
Примечание: составлено авторами.
ЗАКЛЮЧЕНИЕ
В результате проведенной работы была разработана и апробирована программа идентификации и анализа эмоционального состояния человека. Разработанный программный модуль идентификации и анализа эмоционального состояния может быть использован при обучении операторов АСУ ТП и построении компьютерных тренажеров. Использование данного решения может спрогнозировать раннее утомление человека как на этапе обучения, так и в процессе работы, что может повысить качество обучения операторов АСУ ТП с учетом их индивидуальных особенностей и надежность человеко-машинной системы в целом.
Список литературы
↑1. Ekman P., Friesen W. V. Facial Action Coding System: A Technique for the Measurement of Facial Movement. Palo Alto: Consulting Psychologists Press, 1978.
↑2. Ахметшин Р. И., Кирпичников А. П., Шлеймович М. П. Распознавание эмоций человека на изображениях // Вестник технологического университета. 2015. Т. 18, № 11. С. 160-163.
↑3. Бобе А. С., Конышев Д. В., Воротников С. А. Система распознавания базовых эмоций на основе анализа двигательных единиц лица // Инженерный журнал: наука и инновации. 2016. № 9. С. 7.
↑4. Барышев Д. А., Макаревич И. В., Зубанков А. С. и др. Нейросетевой подход к определению эмоций человека по речи // Инженерный вестник Дона. 2022. № 5. С. 183-193.
↑5. Иванов И. А. Проектирование нейросетевого классификатора для решения задачи распознавания эмоций // Решетневские чтения. 2015. Т. 2., № 19. С. 42-44.
↑6. Благодарный Н. С., Кобозев В. Ю., Колмогоров А. Г. и др. Компьютерные тренажеры-имитаторы для обучения персонала безаварийной эксплуатации энерготехнологических котлов // Сборник научных трудов Ангарского государственного технического университета. 2015. Т. 1, № 1. С. 7-14.
↑7. Литвинов В. А. Компьютерные тренажеры как средство эффективного формирования компетенций обучающихся // Вестник Барнаульского юридического института МВД России. 2020. № 1. С. 210-212.
↑8. Брагинский М. Я., Тараканов Д. В. Построение многофункционального тренажера по управлениютеплоэнергетической системой // Вестник кибернетики. 2018. № 2. С. 161-168.
↑9. Арапова Е. А., Крамаров С. О., Сахарова Л. В. Разработка концепции интеллектуальной платформы для реализации индивидуальной траектории обучения с учетом базового уровня знаний и психотипа обучающегося // Вестник кибернетики. 2022. № 1. С. 6-15.
↑10. Брагинский М. Я., Тараканов Д. В. Моделирование взаимодействия коллектива операторов в процессе управления технической системой // Вестник кибернетики. 2018. № 4. С. 100-106.
↑11. Сидоров К. В., Ребрун И. А., Кожевников Д. Д. и др. Диагностика психофизиологического и эмоционального состояния человека-оператора // Инженерный вестник Дона. 2012. № 4-2. С. 27.
↑12. Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // Proceedings of the 2001 IEEE Computer Society Conference “Computer Vision and Pattern Recognition”, December 8-14, 2001, Kauai. IEEE, 2001.
↑13. Lienhart R., Maydt J. An extended set of Haar-like features for rapid object detection // Proceedings of “International Conference on Image Processing”, September 22-25, 2002, Rochester. IEEE, 2002.
↑14. Messom C. H., Barczak A. L. C. Fast and Efficient Rotated Haar-like Features Using Rotated Integral Images // Proceedings of “Australian Conference on Robotics and Automation (ACRA2006)”, 2006. p. 1-6.
Об авторах
М. Ю. КатаевРоссия
доктор технических наук, профессор
М. Я. Брагинский
Россия
кандидат технических наук, доцент
Д. В. Тараканов
Россия
кандидат технических наук, доцент
И. О. Тараканова
Россия
ассистент
Рецензия
Для цитирования:
Катаев М.Ю., Брагинский М.Я., Тараканов Д.В., Тараканова И.О. Применение нейросетевого классификатора для оценки эмоционального состояния человека. Вестник кибернетики. 2025;24(1):19-25. https://doi.org/10.35266/1999-7604-2025-1-3
For citation:
Kataev M.Yu., Braginsky M.Ya., Tarakanov D.V., Tarakanova I.O. Implementation of neural network classifier for assessing human emotional state. Proceedings in Cybernetics. 2025;24(1):19-25. (In Russ.) https://doi.org/10.35266/1999-7604-2025-1-3