Войти

ИИ от Microsoft уже превосходит людей в понимании людской речи

1149
1
-1
Источник изображения: Christoph Hardt/Geisler-Fotopres/Global Look Press

Модель ИИ Microsoft DeBERTa установила рекорд в тесте SuperGLUE, определяющем уровень понимания естественного языка. Она набрала 90,3 балла, а человек – 89,8 балла. Microsoft добилась таких результатов менее чем за два года, и в ее планы входит дальнейшее совершенствование своего ИИ.

Искусственный интеллект (ИИ) DeBERTa корпорации Microsoft превзошел возможности человека бенчмарке SuperGLUE – тесте на понимание естественного языка. Как сообщили CNews представители Microsoft, он набрал 90,3 балла, тогда как показатели человека находятся на уровне 89,8 балла. Другими словами, отрыв небольшой, но все же он есть.

DeBERTa (Decoding-enhanced BERT with disentangled attention) – это алгоритм понимания естественного языка (Natural Language Understanding, NLU), созданный Microsoft.

Тест SuperGLUE состоит из восьми задач, связанных с пониманием структуры текста, а также его контекста и причинно-следственных связей в нем. При его прохождении DeBERTa (Decoding-enhanced BERT with disentangled attention), помимо прочего, приходилось давать ответы на вопросы по «прочитанному» им абзацу, а также уточнять, правильно ли использовалось то или иное слово, для которого в языке предусмотрено несколько значений, в конкретном контексте.

Например, ИИ прочел фразу «ребенок стал невосприимчивым к болезни» (в оригинале – the child became immune to the disease (англ.)). По ней был задан вопрос «в чем причина этого?» (what’s the cause for this?), и DeBERTa предоставили два варианта ответа на него – «он избежал контакта с болезнью» (he avoided exposure to the disease) и «он получил вакцину от болезни» (he received the vaccine for the disease). Хотя человеку легко выбрать правильный ответ, для модели ИИ это сложно. Чтобы получить правильный ответ, модель должна понимать причинно-следственную связь между предпосылкой и двумя (или несколькими) правдоподобными вариантами ответа.

Сам по себе тест SuperGLUE был разработан группой специалистов в 2019 г., и на момент его релиза самый умный искусственный интеллект отставал от показателей человека почти на 20 баллов. Это означает, что Microsoft потребовалось менее двух лет, чтобы ее DeBERTa не только догнал, но и перегнал людей в понимании естественного языка.

В компании сообщили, что для этого ее специалистам пришлось глубоко модифицировать всю архитектуру ИИ-модели, и теперь в ее составе есть 48 слоев и 1,5 млрд различных параметров. Корпорация собирается сделать саму модель и ее исходный код публичным – вся необходимая информация будет размещена на ресурсе GitHub, которым Microsoft владеет с июня 2018 г.

Помимо полутора миллиардов параметров, у DeBERTa есть важное отличие от других ИИ-моделей, тоже сыгравшее свою роль в получении 90,3 балла в SuperGLUE. Этот ИИ по умолчанию учитывает не только значения слов, но и их позиции и роли в предложении. Для примера, в предложении «новый магазин открылся рядом с торговым центром» (a new store opened beside the new mall» он вполне в состоянии понять, что близкие по контекстному значению слово «магазин» (store) и словосочетание «торговый центр» (mall) играют разные синтаксические роли (подлежащим здесь является именно «магазин»).

Также специалисты Microsoft научили свое детище определять зависимость слов друг от друга. К примеру, DeBERTa понимает, что зависимость между словами «deep» и «learning» гораздо сильнее, когда они стоят рядом (термин «глубокое обучение»), чем когда они встречаются в разных предложениях.

Тот факт, что DeBERTa сумел превзойти человека в бенчмарке SuperGLUE, вовсе не означает, что искусственный интеллект во всех смыслах достиг уровня людей в понимании естественного языка. В Microsoft уточнили, что человек, в отличие от машин, для решения новых поставленных перед ним задач хорошо умеет применять свои знания, полученные им в течение своей жизни при выполнении тех или иных требований и поручений. Данное свойство людей называется «композиционным обобщением». «Поэтому, несмотря на многообещающие результаты DeBERTa в тесте, необходимо продолжить исследования, для того чтобы развить у модели этот навык», – рассказали представители Microsoft.

У корпорации есть план по использованию имеющихся у DeBERTa возможностей. Она собирается интегрировать эту ИИ-модель в следующую версию тьюринговой модели Microsoft Turing (Turing NLRv4).

Microsoft применяет тьюринговые модели в целом спектре своих продуктов, среди которых поисковик бинг Bing, пакет офисных программ и Office облачный сервис Azure Cognitive Services. В них они используются, помимо прочего, чтобы совершенствовать взаимодействие с чат-ботами, предоставление рекомендаций и ответов на вопросы, поиск, автоматизацию поддержки клиентов, создание контента и т. д.

В тесте SuperGLUE ИИ-модель Microsoft действительно обошла человека, заняв первое место, однако люди расположились не на второй, а лишь на третьей строчке рейтинга. «Серебро» получила еще одна модель искусственного интеллекта – T5 + Meena за авторством Google.

Ее результат 90,2 балла, то есть он всего на 0,1 балла ниже, чем у DeBERTa. На момент публикации результатов тестирования в SuperGLUE, пишет портал VentureBeat, Google не раскрывала подробности о своей модели ИИ, и за счет чего ей удалось добиться столь высоких показателей в этом бенчмарке.

Права на данный материал принадлежат
Материал размещён правообладателем в открытом доступе
  • В новости упоминаются
Проекты
1 комментарий
№1
18.01.2021 11:47
Цитата, q
Например, ИИ прочел фразу «ребенок стал невосприимчивым к болезни» (в оригинале – the child became immune to the disease (англ.)). По ней был задан вопрос «в чем причина этого?» (what’s the cause for this?), и DeBERTa предоставили два варианта ответа на него – «он избежал контакта с болезнью» (he avoided exposure to the disease) и «он получил вакцину от болезни» (he received the vaccine for the disease). Хотя человеку легко выбрать правильный ответ, для модели ИИ это сложно.
Упс-с-с... И где же тут ИИ превзошёл человека?!
Цитата, q
в предложении «новый магазин открылся рядом с торговым центром» (a new store opened beside the new mall» он вполне в состоянии понять, что близкие по контекстному значению слово «магазин» (store) и словосочетание «торговый центр» (mall) играют разные синтаксические роли (подлежащим здесь является именно «магазин»).
Надо же, какая сложность - определить члены предложения по их месту в предложении в английском языке или по их окончанию в русском языке! У нас в школе любой учитель любого языка этому всех детей учит...
Цитата, q
DeBERTa сумел превзойти человека в бенчмарке SuperGLUE
Каков тест - таков и результат. Голимая реклама Мелкомягкого на уши потребителей.
-1
Сообщить
Хотите оставить комментарий? Зарегистрируйтесь и/или Войдите и общайтесь!
ПОДПИСКА НА НОВОСТИ
Ежедневная рассылка новостей ВПК на электронный почтовый ящик
  • Разделы новостей
  • Обсуждаемое
    Обновить
  • 24.11 00:12
  • 5860
Без кнута и пряника. Россия лишила Америку привычных рычагов влияния
  • 23.11 21:50
  • 0
И еще в "рамках корабельной полемики" - не сочтите за саморекламу. :)
  • 23.11 12:43
  • 4
Путин оценил успешность испытаний «Орешника»
  • 23.11 11:58
  • 1
Путин назвал разработку ракет средней и меньшей дальности ответом на планы США по развертыванию таких ракет в Европе и АТР
  • 23.11 10:28
  • 2750
Как насчёт юмористического раздела?
  • 23.11 08:22
  • 685
Израиль "готовился не к той войне" — и оказался уязвим перед ХАМАС
  • 23.11 04:09
  • 1
Начало модернизации "Северной верфи" запланировали на конец 2025 года
  • 22.11 20:23
  • 0
В рамках "корабельной полемики".
  • 22.11 16:34
  • 1
Степанов: Канада забыла о своем суверенитете, одобрив передачу США Украине мин
  • 22.11 16:14
  • 11
Россия впервые ударила межконтинентальной баллистической ракетой по Украине. На что способен комплекс «Рубеж»?
  • 22.11 12:43
  • 7
Стало известно о выгоде США от модернизации мощнейшего корабля ВМФ России
  • 22.11 03:10
  • 2
ВСУ получили от США усовершенствованные противорадиолокационные ракеты AGM-88E (AARGM) для ударов по российским средствам ПВО
  • 22.11 02:28
  • 1
Путин сообщил о нанесении комбинированного удара ВС РФ по ОПК Украины
  • 21.11 20:03
  • 1
Аналитик Коротченко считает, что предупреждения об ответном ударе РФ не будет
  • 21.11 16:16
  • 136
В России запустили производство 20 самолетов Ту-214