Восприятие машин улучшится с помощью встроенных локаторов, способных оценивать форму предметов и расстояние до них
Через 10 лет российские роботы будут лучше видеть человека, а также смогут интерпретировать речь нескольких людей, говорящих одновременно. Но во многом они даже превзойдут человека, так как количество воспринимающих приборов, входящих в «начинку» машин, можно расширять бесконечно. По словам представителей ведущих отечественных разработчиков робототехники, в России уже создается вся необходимая техника для будущего рывка, включая радиолокаторы, микрофонные решетки и системы искусственного интеллекта, которые будут использоваться для обработки полученной информации. Вместе с тем роботы вряд ли достигнут того целостного восприятия мира, который имеют люди.
Со второго взгляда
Если человек видит окружающий мир исключительно глазами, то у роботов есть более широкий выбор инструментов для восприятия. В частности, они могут использовать как портативные камеры, так и своеобразное удаленное техническое осязание, которое позволяет оценить дистанцию до объекта и установить его форму.
— Например, для этих целей могут применяться активные системы с фазированными антенными решетками (радиолокаторы), способные предоставить множество данных об окружающем мире в любых погодных условиях, — считает заместитель директора ЦНИИ робототехники и технической кибернетики по научной работе Николай Грязнов. — Последнее отличает их от аналогичных систем, работающих в оптическом диапазоне (например, лидаров), которые заметно теряют эффективность в туман, дождь или снегопад.
Фото: ТАСС/Дмитрий Феоктистов
Источник изображения: iz.ru
По словам эксперта, сочетание камер и радиолокационных систем позволит андроидам и беспилотным автомобилям замечать удаленные предметы в условиях ограниченной видимости, которая снижает безопасность передвижения людей. Ранее фазированные решетки традиционно использовались в авиации, теперь же они постепенно приходят в робототехнику. Это стало возможным из-за увеличения их разрешающей способности (вплоть до нескольких сантиметров) и постепенного удешевления, что может заметно повлиять на рынок.
Фото: ИЗВЕСТИЯ/Дмитрий Коротаев
Источник изображения: iz.ru
Если же говорить о возможностях традиционных видеокамер, то здесь специалисты, наоборот, отмечают отход от стремления к постоянному увеличению разрешения. Вместо этого производители делают ставку на обработку получаемой ими информации. Уже сейчас это привело к тому, что современного робота нельзя ослепить и сбить с толку мощным световым излучением благодаря алгоритмам, которые подавляют слишком яркие области картинки.
В будущем более совершенная обработка также поможет андроидам улучшить распознавание живых существ и предметов, перейдя от их классификации к «узнаванию» конкретного образца. В частности, если сейчас система искусственного интеллекта может отличить велосипед от мотоцикла, то вскоре она научится определять по внешнему облику велосипеда его принадлежность конкретному человеку.
Фото: РИА Новости/Максим Блинов
Источник изображения: iz.ru
— Такого результата поможет достичь внедрение процессов взаимного обучения нейронных сетей, при использовании которых одна система искусственного интеллекта дает всё более сложные задания обучаемой системе, а затем контролирует получившиеся результаты, — пояснил Николай Грязнов. — При этом для масштабирования технологии этот процесс должен проходить с минимальными затратами вычислительных ресурсов, использование которых в настоящее время стараются максимально оптимизировать.
Многоканальный слух
Наряду с машинным зрением российские инженеры не забывают и о развитии звукового восприятия техники, разрабатывая специальные системы из множества разнонаправленных микрофонов. С их помощью роботы могут точно определить местонахождение говорящих с ними людей, а благодаря последующей обработке информации мгновенно распознать речь каждого из них. При этом в отличие от человека робот не пропустит ни одной фразы из группового разговора, поскольку способен воспринимать сразу нескольких собеседников одновременно.
Однако если говорить не о буквальном восприятии роботами речи, а об их понимании ее смысла, то здесь у разработчиков остается большое поле для совершенствования. В частности, в качестве своей следующей цели ученые ставят понимание роботом контекста разговора — для того чтобы видеть истинное значение слов человека, а не просто выполнять стандартные команды. Если эта задача будет выполнена, то в будущем машинам можно будет делегировать намного более сложные задачи.
По словам отраслевых экспертов, в России эти системы активно развиваются и по своим возможностям ничуть не уступают импортным аналогам, но в полную силу их можно будет применять не раньше чем через 10 лет.
Фото: ТАСС/Антон Новодережкин
Источник изображения: iz.ru
— Мы разрабатываем собственную систему распознавания речи, которая дает машинам возможность воспринимать звук в шумных помещениях. Улучшать ее показатели позволяют данные, собранные другими роботами в реальных условиях, — их мы используем при обучении нейросетей, — рассказал технический директор компании «Промобот» Игорь Еремеев. — К тому же у нас есть и собственная аппаратная часть — это микрофонный массив, позволяющий детектировать и локализовать источник звука в пространстве.
Однако, несмотря на весь прогресс, достигнутый в области технологий получения и обработки информации, они пока не могут дать роботам человеческих ощущений.
— Люди — это крайне сложные создания, и в данный момент мы не понимаем и половины аспектов собственного функционирования, что полностью исключает возможность воспроизводства человеческих ощущений с помощью какой-либо техники, — подчеркнул исполнительный директор НПО «Андроидная техника» Евгений Дудоров.
Согласны с этим и другие эксперты, опрошенные «Известиями». Это значит, что в ближайшие десятилетия роботы вряд ли смогут полноценно заменить человека.
Александр Буланов