Наше будущее обещает быть заполненным роботами, выполняющими вместо людей большую часть всей их работы. Но, для того, чтобы роботы смогли выполнять человеческую работу их надо этому научить, и основным направлением в этом деле считается создание самообучающихся систем искусственного интеллекта. К примеру, представьте себе робота, который может "обогатить" свою базу знаний о выполнении бытовых операций, таких, как приготовление пищи, просто "просматривая" обучающие видеоролики, находящиеся на известном сервисе YouTube. Эта идея легла в основу новой самообучающейся системы для роботов , построенной на базе так называемой "глубокой нейронной сети" (deep neural networks), созданной исследователями из университета Мэриленда и австралийского исследовательского центра NICTA.
Целью создания подобной системы является улучшение способности систем искусственного интеллекта к самообучению. Эта система должна превзойти по всем параметрам другие подобные системы, в частности и систему Robo Brain, которой в свое время было "скормлено" более миллиарда изображений, 120 тысяч видеороликов с YouTube и 100 миллионов страниц текста, содержащего практические рекомендации и руководства пользования различной бытовой техникой. На основе всех данных, собранных из этих источников, система Robobrain выяснила-вычислила как лучше захватывать и удерживать различные предметы и инструменты, руководствуясь только изображениями последних.
Создавая новую систему, исследователи столкнулись с массой трудностей. Главной трудностью являлось то, что видеоролики не содержат никакой трехмерной информации, которой манипулируют системы управления роботов. Это, в свою очередь, делает очень трудным составление связей между объектами и действиями, такими, как движения рук, к примеру, при чистке яиц и нарезке овощей.
Но, все эти проблемы были решены путем создания технологии очень "глубокого" самообучения, базой для которой стала технология распознавания объектов на изображении и технология определения совершаемых движений. Именно такой симбиоз позволяет системе изучить какой инструмент используется, какие действия и над каким объектом выполняются в данный момент времени.
Данные, получаемые от сложной системы распознавания, поступают на вход специализированной нейронной сети CNN (convolutional neural network), которая определяет собственно последовательность выполняемых действий, производя на выходе набор инструкций для выполнения этих действий и пополняя новыми данными свою интеллектуальную базу. На этом же этапе, при помощи метода специализированного парсинга (синтаксического и логического анализа) происходит разделение последовательности действий на иерархическую и рекурсивную составляющие.
В ходе испытаний работоспособности новой самообучающейся системы ей была дана возможность анализа 88 обучающих видеороликов в области кулинарии. В результате этого получилась своего рода база команд для роботов, при помощи которых роботы вполне успешно могут справиться с приготовлением тех или иных блюд. А в недалеком будущем исследователи планируют внести изменения в работу системы таким образом, чтобы она смогла самообучаться, наблюдая вживую за действиями людей.