Войти

Нейросеть перевела текст в жестовую речь

1100
0
0
Нейросеть перевела текст в жестовую речь
Нейросеть перевела текст в жестовую речь.
Источник изображения: Ben Saunders et al. / arXiv.org, 2020

Бринанские разработчики создали нейросетевой алгоритм, который превращает текст в видео с человеком, произносящим тот же текст на жестовом языке. Во время обучения алгоритм проверяет качество своей работы после синтеза видео, что позволило добиться гораздо лучшего результата, чем у предыдущих подобных методов, в том числе по качеству отрисовки кистей рук. Статья об алгоритме опубликована на arXiv.org.

Люди с полной или частичной потерей слуха общаются между собой на жестовом языке. Но подавляющее большинство мероприятий или контента предназначено для слышащих людей. В электронном виде эта проблема решается при помощи субтитров, но при проведении мероприятий или, например, трансляции прямого эфира, приходится использовать сурдоперевод с обычного языка на жестовый. Исследователи не первый год пытаются автоматизировать этот процесс. Изначально они пытались сделать это с помощью анимированных 3D-аватаров, но этот подход давал низкие результаты. В последнее время исследователи переключились на нейросетевой синтез, но до недавнего времени им не удавалось качественно отрисовывать важные детали, в том числе кисти рук.

Разработчики из Университета Суррея под руководством Ричарда Боудена (Richard Bowden) создали алгоритм, который более качественно производит сурдоперевод, в том числе отдельно обучается для качественного синтеза кистей — они крайне важны в жестовых языках. Изначально алгоритм принимает речь в виде текста. Затем текст проходит через кодировщик и декодировщик и превращается в скелетную модель тела, иллюстрирующую жест говорящего. После этого полученная последовательность поз кодируется в вектор. Он объединяется с вектором, полученным от стилевого изображения — фотографии человека, которую необходимо анимировать. Наконец, после этого последовательность поз подается на сверточную нейросеть U-Net, которая производит перенос движений с поз на реалистичное видео.


Схема работы алгоритма

Источник изображения: Ben Saunders et al. / arXiv.org, 2020


Во время обучения дискриминатор работал как со всем сгенерированным человеком в целом, так и отдельно с его кистями. Результат работы нейросети размечался алгоритмом OpenPose, который размечает на человеке его скелетную модель тела. Сравнивая сгенерированную алгоритмом модель тела с той, которая была размечена людьми, алгоритм по ходу обучения совершенствовал свой навык синтеза качественных кадров, на которых хорошо различимы детали.

Авторы обучили алгоритм на датасете PHOENIX14T, состоящем из 386 аннотированных записей работы сурдопереводчиков на немецком телеканале. Они проверили работу алгоритма, использовав несколько метрик, в том числе индекс структурного сходства, показывающий схожесть двух изображений. Индекс рассчитывался для исходного изображения из датасета и синтетического, созданного нейросетью, причем как для всей верхней части тела, так и отдельно для кистей. Сравнение с другими алгоритмами на одинаковых данных показало, что по всем четырем используемым метрикам новый алгоритм превосходит аналоги.


Сравнение нового алгоритма с аналогами по количественным метрикам

Источник изображения: Ben Saunders et al. / arXiv.org, 2020


Также разработчики провели тест на 46 добровольцах (28 процентов из них — носители жестового языка), попросив их оценить реалистичность видео, сгенерированного разными алгоритмами. В этом сравнении также в абсолютном большинстве случаев добровольцы выбирали новый алгоритм.


Доля добровольцев, которые назвали результаты работы нового алгоритма более качественными по сравнению с аналогами

Источник изображения: Ben Saunders et al. / arXiv.org, 2020


Есть и другой подход к автоматизации сурдоперевода. Бельгийские инженеры предложили использовать для этого роборуку, которая умеет показывать различные жесты.

Григорий Копиев

Права на данный материал принадлежат
Материал размещён правообладателем в открытом доступе
  • В новости упоминаются
Похожие новости
11.12.2006
"Рособоронэкспорт" готов модернизировать вооружение и технику советского и российского производства в некоторых странах НАТО
08.12.2006
Пост модернизма
08.12.2006
Модернизируем НАТО
07.12.2006
"Рособоронэкспорт" работает над вопросами модернизации истребителей МиГ-29 и вертолетов "Ми" стран - членов НАТО
21.11.2006
Автомат Калашникова по-прежнему является самым популярным оружием в мире
16.10.2006
Все товары космического назначения будут освобождены от уплаты таможенных пошлин и НДС
04.10.2006
Правительство РФ утвердило перечни международных выставок, на которых в 2007-2008 годах будет представлено российское оружие
Хотите оставить комментарий? Зарегистрируйтесь и/или Войдите и общайтесь!
ПОДПИСКА НА НОВОСТИ
Ежедневная рассылка новостей ВПК на электронный почтовый ящик
  • Разделы новостей
  • Обсуждаемое
    Обновить
  • 20.04 00:43
  • 462
Международные расчеты, минуя доллар, по странам
  • 20.04 00:26
  • 105
Израиль усиливает меры безопасности в связи с опасениями ударов со стороны Ирана
  • 19.04 23:42
  • 919
Без кнута и пряника. Россия лишила Америку привычных рычагов влияния
  • 19.04 21:13
  • 2703
Как насчёт юмористического раздела?
  • 19.04 16:43
  • 0
«Новая Америка». Как западные корпорации осваивают земли «незалежных» индейцев
  • 19.04 16:35
  • 111
В России запустили производство 20 самолетов Ту-214
  • 19.04 16:24
  • 117
Конкурента российского Су-75 из Южной Кореи впервые представили на выставке
  • 19.04 12:18
  • 17
Командующий ВВС США в Европе о роли авиации в боевых действиях на Украине
  • 19.04 11:50
  • 13
Гендиректор ОАК Слюсарь: испытания SSJ New с российскими двигателями начнутся осенью - Интервью ТАСС
  • 19.04 11:40
  • 1
Новый участник в битве за Арктику
  • 18.04 19:22
  • 18
Первую летную ракету-носитель "Ангара-А5" отправили для испытаний на космодром Восточный
  • 18.04 18:25
  • 12
Британская ПВО может и не выдержать первого удара России (The Telegraph UK, Великобритания)
  • 18.04 15:42
  • 1
Сергею Шойгу в парке "Патриот" представили более 30 перспективных образцов вооружения и техники
  • 18.04 15:29
  • 0
Кипящий «котёл» Закарпатья остужать никто не собирается
  • 18.04 13:38
  • 1
Норвегия может приобрести фрегаты класса "Тип-26"