Торговая экспериментальная организация OpenAI, финансируемая Элоном Маском (Elon Musk), сообщила о новом достижении в области формирования ботов. Она сделала метод, который дает возможность человеку учить синтетический разум действиям, делая их в виртуальной реальности. Тут применяется способ разового моделирующего изучения, который дает возможность боту твердить физическое действие, применяя один-единственный образец.
OpenAI предприняла попытку обучить автоматическую руку укладывать комплект многоцветных кубиков. Человек в VR-шлеме совершал нужные действия в онлайн круге. После этого их исследовала нейронная сеть, опытная на базе сотен миллионов ненатурально сделанных фотографий.
Так как сбор настоящих фотографий — очень дорого, сложно и продолжительно, ученые применяли синтетические иллюстрации. OpenAI «скормила» способу онлайн виды стола и кубиков с разными фонами, результатами освещения и структурами. Так синтетический разум осознавал сцену, не видев её прежде.
После этого метод принимал информацию из нейронной сети и посылал её в другую, моделирующею сеть. Она устанавливает намерения действия и повторяет его, предвещая то, что сделал бы человек в этой обстановки. Неприятность состоит в том, что размещение и оттенок кубиков изменялись всякий раз. Однако ПО всё равно получалось возвести 3 столбика — любой из 2-ух кубов.
Боту никогда не продемонстрировали видео либо фото с настоящими образцами действий. «Наш бот обучился делать цель, невзирая на то, что перемещения должны различаться от продемонстрированных в презентации, — пояснил Джош Тобин (Josh Tobin), член команды OpenAI. — При помощи одной презентации цели у нас есть возможность повторить её в общем ряде разных базовых требований. Чтобы научить бота, как возвести другую очередность блоков, необходима лишь одна специальная презентация».
Долговременная цель специалистов — предоставить синтетическому уму вероятность оперативно обучаться свежим действиям и приспособиться к непредвиденным переменам в круге. «Малыши появляются на свет со возможностью пародировать тому, что делают иные люди, — говорит Тобин. — Следование дает возможность людям оперативно учиться свежим действиям. Мы бы планировали, чтобы так могли учиться и наши боты».