Выбрать язык

Влияние светодиодных сигналов и эмоциональных дисплеев в совместных рабочих пространствах человека и робота

Исследование влияния невербальной коммуникации (светодиодные индикаторы и эмоциональные дисплеи) на безопасность, ясность и производительность задач в средах совместной работы человека и робота.
rgbcw.org | PDF Size: 1.9 MB
Оценка: 4.5/5
Ваша оценка
Вы уже оценили этот документ
Обложка PDF-документа - Влияние светодиодных сигналов и эмоциональных дисплеев в совместных рабочих пространствах человека и робота

1. Введение и обзор

Данное исследование изучает критическое узкое место в современной промышленной автоматизации: эффективную коммуникацию в совместных рабочих пространствах человека и робота. В то время как коллаборативные роботы (коботы) преодолели физические барьеры, когнитивный и коммуникационный разрыв сохраняется. Исследование предполагает, что невербальные сигналы — в частности, цветовые светодиодные сигналы на конце-эффекторе робота и анимированные эмоциональные дисплеи на планшете — могут преодолеть этот разрыв, повышая безопасность и эффективность рабочего процесса.

Основная гипотеза заключалась в том, что сочетание функциональных сигналов о намерениях (светодиоды) с социально-эмоциональными сигналами (мимика) превзойдет только светодиоды по показателям предвосхищения столкновений, ясности коммуникации и восприятию пользователя.

2. Методология и план эксперимента

Для строгой проверки модальностей коммуникации использовался дизайн внутрисубъектного эксперимента.

2.1 Роботизированная платформа и модификации

В качестве испытательного стенда использовалась роботизированная рука Franka Emika Panda. Были выполнены две ключевые модификации:

  • Светодиодная лента: Установлена на конце-эффекторе. Цвета сигнализировали о намерениях: Зеленый — безопасно/неподвижно, Желтый — осторожность/медленное движение, Красный — стоп/риск столкновения.
  • Эмоциональный дисплей: Планшет, установленный рядом с основанием робота, показывал анимированное лицо. Выражения лица варьировались от нейтрального до удивленного/обеспокоенного и активировались при приближении к человеку-оператору.

2.2 Экспериментальные условия

Были протестированы три различных условия коммуникации:

  1. Условие A (Только светодиоды): Базовые цветовые световые сигналы.
  2. Условие B (Светодиоды + Реактивный эмоциональный дисплей): Светодиодные сигналы плюс выражения лица, активируемые в ответ на неминуемый риск столкновения.
  3. Условие C (Светодиоды + Упреждающий эмоциональный дисплей): Светодиодные сигналы плюс выражения лица, появляющиеся до потенциального столкновения, сигнализируя о прогнозируемом намерении.

2.3 Участники и сбор данных

N=18 участников выполняли совместную сборочную задачу с роботом. Данные собирались из трех источников:

  • Объективные показатели: Отслеживание положения (время реакции, минимальное расстояние до робота).
  • Субъективные показатели: Анкеты после выполнения задачи (NASA-TLX для оценки нагрузки, специальные шкалы для воспринимаемой безопасности, ясности коммуникации и интерактивности робота).

3. Результаты и анализ

Результаты выявили сложную и несколько неожиданную картину.

3.1 Эффективность предвосхищения столкновений

Ключевой результат: Не было обнаружено статистически значимой разницы в времени предвосхищения столкновения или минимальном расстоянии избегания между тремя условиями. Простой светодиодный сигнал был так же эффективен, как и более сложные эмоциональные дисплеи, в том, чтобы позволить людям избежать робота.

Смысл для графика: Столбчатая диаграмма «Среднее время реакции (мс)», вероятно, показала бы три столбца (для Условий A, B, C) с перекрывающимися доверительными интервалами, что указывает на отсутствие практической разницы.

3.2 Воспринимаемая ясность и интерактивность

Расходящийся результат: Хотя объективная производительность была схожей, субъективные восприятия различались. Данные анкет показали, что условия с эмоциональными дисплеями (B и C) получили значительно более высокие оценки по показателям воспринимаемой интерактивности робота и социального присутствия.

Смысл для графика: Линейный график «Оценка воспринимаемой интерактивности» показал бы явную восходящую тенденцию от Условия A (самый низкий) к Условию C (самый высокий).

3.3 Показатели эффективности выполнения задачи

Ключевой результат: Время выполнения задачи и частота ошибок не улучшились с добавлением эмоциональных дисплеев. Условие только со светодиодами предоставило достаточно информации для эффективного выполнения задачи без потенциальной когнитивной нагрузки от обработки дополнительного эмоционального сигнала.

Ключевой вывод о производительности

Значительного улучшения нет

Эмоциональные дисплеи не улучшили объективные показатели безопасности (предвосхищение столкновений) или эффективности выполнения задач по сравнению с одними только светодиодными сигналами.

Ключевой вывод о восприятии

Повышенная воспринимаемая интерактивность

Условия с эмоциональными дисплеями получили более высокие оценки за интерактивность робота и социальное присутствие, несмотря на отсутствие прироста производительности.

4. Детали технической реализации

Логику системы можно формализовать. Отслеживаются состояние робота и положение человека $p_h$. Поле риска $R(d)$ вычисляется на основе расстояния $d = ||p_r - p_h||$ между роботом и человеком.

Светодиодный сигнал $L$ является прямой функцией от $R(d)$:

$L = \begin{cases} \text{Зеленый} & R(d) < \tau_{safe} \\ \text{Желтый} & \tau_{safe} \leq R(d) < \tau_{warning} \\ \text{Красный} & R(d) \geq \tau_{warning} \end{cases}$

Где $\tau_{safe}$ и $\tau_{warning}$ — эмпирически определенные пороги. Эмоциональный дисплей $E$ в реактивном условии (B) активировался, когда $R(d) \geq \tau_{warning}$. В упреждающем условии (C) он активировался на основе прогнозной модели движения человека, пытаясь сигнализировать о намерении до того, как $R(d)$ достигнет порога предупреждения.

5. Критический анализ и экспертная интерпретация

Ключевое понимание: Эта статья дает важную отрезвляющую реальность для дизайнеров HRI, увлеченных антропоморфизмом. Её центральный вывод — «эмоциональные дисплеи повысили воспринимаемую интерактивность, но не улучшили функциональную производительность» — является поворотным моментом. Это заставляет стратегически разделить цели: мы проектируем для вовлеченности пользователя или для операционной пропускной способности? В совместных рабочих пространствах с высокими ставками и ориентацией на эффективность это исследование предполагает, что сложные социальные сигналы могут быть всего лишь «косметикой для коботов», добавляя когнитивную нагрузку без отдачи по безопасности или скорости. Светодиодная лента, простой, недорогой и однозначный сигнал, оказывается невоспетым героем.

Логика и сильные стороны: Экспериментальный план надежен. Внутрисубъектный подход контролирует индивидуальные различия, а трехчастная структура условий (только светодиоды, реактивный, упреждающий) элегантно изолирует переменную времени подачи эмоционального сигнала. Использование как объективных (отслеживание движения), так и субъективных (анкеты) показателей является золотым стандартом, выявляющим критическое расхождение между тем, что люди чувствуют, и тем, что они делают. Это согласуется с выводами в других областях взаимодействия человека и машины, такими как исследования MIT Media Lab по «спокойным технологиям», которые выступают за дизайн информации, остающейся на периферии внимания, пока она не потребуется.

Недостатки и упущенные возможности: Основная слабость исследования — его масштаб (N=18) и, вероятно, однородный пул участников (академическая среда), что ограничивает обобщаемость на разнообразных промышленных рабочих. Более того, «эмоциональный дисплей» представлял собой 2D-мультфильм на планшете — далеко не интегрированные, тонкие выражения, изучаемые на продвинутых платформах социальной робототехники, таких как Spot от Boston Dynamics или Pepper от SoftBank. Изменил бы результат более физически воплощенный или сложный экспрессивный элемент? Исследование также не изучает долгосрочные эффекты; новизна эмоционального дисплея может исчезнуть, или его полезность может возрасти с привыканием — явление, наблюдаемое в лонгитюдных исследованиях HRI.

Практические выводы: Для практиков в отрасли мандат ясен: Приоритет ясности над харизмой. Сначала инвестируйте в надежную, интуитивно понятную функциональную сигнализацию (например, хорошо продуманные состояния светодиодов), которая напрямую соответствует состояниям действий робота. Только после закладки этого фундамента следует рассматривать добавление эмоциональных слоев, и только с четкой гипотезой об их конкретной полезности — возможно, для снижения долгосрочной усталости, улучшения доверия в сложных задачах или помощи в обучении. Это исследование перекликается с принципом из основополагающей работы «Уравнение медиа» (Ривз и Насс) — о том, что люди относятся к медиа социально, — но добавляет важную промышленную оговорку: социальное отношение не всегда приводит к функциональному улучшению, когда задача процедурная и ориентирована на цель.

6. Аналитическая структура и пример из практики

Структура: «Матрица функционально-социальной коммуникации»

Это исследование вдохновляет на простую структуру 2x2 для оценки модальностей коммуникации HRI:

Высокая функциональная полезностьНизкая функциональная полезность
Высокая социальная вовлеченностьИдеал
Например, жест, который и указывает направление, и ощущается естественным.
Отвлекающий декор
Например, эмоциональный дисплей в этом исследовании — понравился, но не помог в задаче.
Низкая социальная вовлеченностьЭффективный инструмент
Например, сигнал только со светодиодами — ясный, эффективный, но «холодный».
Неэффективный
Например, тонкий звуковой сигнал в шумном цеху.

Пример применения: Рассмотрим сборочную линию в автомобильной промышленности, где кобот передает тяжелые инструменты рабочему.
Светодиодный сигнал (Эффективный инструмент): Зеленый свет на захвате означает «Я надежно держу инструмент, вы можете его взять». Это высокая функциональная полезность, низкая социальная вовлеченность. Задача выполняется безопасно.
Добавление кивающего движения (Идеал): Программирование руки робота на выполнение легкого, медленного «кивающего» движения вместе с зеленым светом. Это могло бы усилить состояние «готов к передаче» (функционально), используя биологически интуитивный социальный сигнал, потенциально снижая когнитивную нагрузку рабочего на проверку. Однако данное исследование предостерегает: необходимо провести A/B-тестирование этого кивка, чтобы убедиться, что он действительно улучшает скорость передачи или снижает частоту ошибок, а не только симпатию.

7. Будущие применения и направления исследований

Это исследование открывает несколько ключевых направлений:

  • Адаптивные и персонализированные интерфейсы: Будущие системы могли бы адаптировать свой стиль коммуникации. Для нового стажера робот мог бы использовать и светодиоды, и эмоциональные дисплеи для усиления уверенности. Для опытного рабочего на повторяющейся задаче он мог бы переключиться в режим только со светодиодами для максимальной эффективности, снижая когнитивную нагрузку. Исследования в области адаптивной автоматизации от NASA и области интеллектуальных обучающих систем предоставляют прочную основу для этого.
  • Лонгитюдные и экологические исследования: Следующий критический шаг — переход от лабораторных краткосрочных испытаний к долгосрочным полевым исследованиям на реальных заводах. Меняется ли ценность социальных сигналов в течение недель или месяцев сотрудничества? Это аналогично лонгитюдным исследованиям калибровки доверия во взаимодействии человека и автоматики.
  • Мультимодальное слияние: Вместо тестирования модальностей по отдельности исследования должны изучать оптимальные комбинации и резервирование. Может ли легкая тактильная вибрация (например, в браслете рабочего) в паре со светодиодным сигналом превзойти каждый из них по отдельности, особенно в визуально загроможденной среде? Область мультимодального взаимодействия, развиваемая такими институтами, как HCII Университета Карнеги-Меллон, напрямую актуальна.
  • Эмоциональные дисплеи для сообщения об ошибках и восстановления доверия: Хотя они не помогают в рутинном избегании столкновений, эмоциональные дисплеи могут быть особенно эффективны для сообщения о неопределенности робота, системных ошибках или необходимости помощи человека. «Озадаченное» или «извиняющееся» лицо после неудачного захвата может быть более эффективным способом запросить вмешательство человека, чем простой индикатор ошибки, способствуя более быстрому восстановлению доверия — серьезной проблеме в HRI.

8. Список литературы

  1. Ibrahim, M., Kshirsagar, A., Koert, D., & Peters, J. (2025). Investigating the Effect of LED Signals and Emotional Displays in Human-Robot Shared Workspaces. arXiv preprint arXiv:2509.14748.
  2. Reeves, B., & Nass, C. (1996). The Media Equation: How People Treat Computers, Television, and New Media Like Real People and Places. CSLI Publications.
  3. Weiser, M., & Brown, J. S. (1996). Designing Calm Technology. PowerGrid Journal, 1(1).
  4. Goodrich, M. A., & Schultz, A. C. (2007). Human-Robot Interaction: A Survey. Foundations and Trends® in Human–Computer Interaction, 1(3), 203-275.
  5. Lee, J. D., & See, K. A. (2004). Trust in Automation: Designing for Appropriate Reliance. Human Factors, 46(1), 50–80.
  6. Breazeal, C. (2003). Toward sociable robots. Robotics and Autonomous Systems, 42(3-4), 167-175.
  7. MIT Media Lab. (n.d.). Calm Technology. Retrieved from relevant project pages.