Как Grand Theft Auto обучает беспилотные автомобили

Развитием массового рынка автомобилей-беспилотников сейчас не занимается только ленивый. Крупнейшие корпорации, включая General Motors, Volkswagen, Audi, BMW, Volvo, Nissan, Tesla, Google, Cognitive Technologies, активно работают, чтобы создать будущее, в котором дорожное движение происходит без участия человека: безопасно, быстро, вежливо. А бывшие водители тем временем смогут вздремнуть, поработать или посмотреть фильм. Но где роботы-автомобили «получают права»? Кто и как обучает их водить?

pic1
Изображение: Университет Мичигана

Чтобы доверять беспилотным автомобилям, мы должны быть уверены, что они прекрасно ориентируются в пространстве и понимают, что происходит вокруг. Им необходимо распознавать другие машины, грузовики, мотоциклы, велосипеды, людей, светофоры, дорожные знаки и все вещи, которые могут оказаться на дороге или рядом с ней. И всё это беспилотники должны уметь делать при разных погодных условиях и плохом освещении. Поэтому многие (если не все) компании, разрабатывающие такие автомобили, тратят безумное (но необходимое) количество времени и ресурсов, собирая данные о каждой возможной дорожной ситуации.

В большинстве случаев этот метод зависит от людей, которые делают заметки к огромному собранию информации, чтобы научить машины следовать алгоритмам: сотни тысяч сотрудников изучают фото и видео, снятые во время дорожного движения, подписывают и обводят в рамку транспортные средства и дорожные знаки — снова и снова. Но исследователи из Университета Мичигана уверены, что есть способ получше — полностью перенести процесс в симуляцию реальности. И они доказали, что это может быть более эффективно, чем использовать реальные данные, проверенные реальными людьми.

Робототехники обычно опасаются использовать информацию, полученную на основе симуляций, поскольку они упрощают действительность и ситуации, воспроизведенные в программе, могут не проиграться таким же образом в жизни. Особенно если это касается физических законов. Но благодаря индустрии компьютерных игр фотореалистичная графика позволяет достаточно убедительно копировать реальность. Недавно на Международной конференции по робототехнике и автоматизации (IEEE International Conference on Robotics and Automation) ученые из Университета Мичигана решили точно установить, может ли графика в игре Grand Theft Auto V использоваться для обучения беспилотников.

pic2
Изображение: Университет Мичигана Серия скриншотов для распознавания объектов из игры Grand Theft Auto V.

Почему так важно убедиться в эффективности такого метода? Есть 3 главных причины. Во-первых, нет необходимости использовать реальные автомобили для записи видео — это ускоряет процесс и уменьшает затраты. Во-вторых, в симуляции заметки в большинстве случаях делаются автоматически, потому что игра «знает», какие объекты она создает. А в-третьих, можно создавать все возможные условия и ситуации вручную, а не ждать, когда на улице пойдет дождь или сгустится туман. Например, собирать данные на реальных дорогах в Калифорнии очень сложно, так как там почти всегда хорошая погода.

pic3
Изображение: Университет Мичигана В симуляции можно задавать различные погодные условия для одного и того же эпизода.

Чтобы посмотреть, насколько хорошо идет процесс сбора информации в симуляции, исследователи подготовили три группы данных из Grand Theft Auto V, которые состояли из 10,000, 50,000 и 200,000 различных игровых изображений. Программа по распознаванию объектов для беспилотников «обучалась» на каждой из этих групп, а также на выборке из 3000 фотографий Cityscapes, сделанных на немецких дорогах, с вручную проставленными отметками. Затем «обученные» программы должны были распознать определенные объекты на 7500 реальных фотографий — KITTI, — тоже сделанных в Германии, но отличных от первой группы.

Программе, прошедшей тренировку на скриншотах из игры (все три группы), удалось пройти тест лучше, чем программе, которая «училась» на реальных фотографиях. По словам исследователей, получается, что каждый отдельный скриншот не так информативен, как одна фотография, но изображения из игры берут количеством: «В реальности мы встречаем гораздо больше вариантов освещения, цвета и текстуры, поэтому для достижения высокого результата необходимо в разы больше скриншотов. Тем не менее, их создание требует гораздо меньших затрат времени и усилий со стороны человека — все изображения с необходимыми пометками генерирует компьютер».

pic4
Изображение: Университет Мичигана Программа, обученная на симуляции (вверху), распознает «ложные» объекты лучше, чем «выращенная» на реальных фотографиях (внизу)

Дополнительный анализ также показал, что программы, прошедшие обучение на игре, лучше распознают объекты, которые плохо видно из-за расстояния или по каким-то иным причинам. Они также лучше отличают «ложные» объекты от тех, на которые действительно надо обратить внимание. Возможно, это обусловлено тем, что симуляция позволяет создать больше разнообразных дорожных ситуаций, чем те, с которыми мы можем столкнуться, разъезжая на машине по городу туда-сюда. Учитывая результаты исследования, все же надо признать, что игра — это действительно лишь симуляция, и воспроизвести непредсказуемое событие в ней очень сложно. А именно такие ситуации остаются фундаментальной проблемой беспилотных автомобилей. Конечно, всеми любимая с детства игрушка Grand Theft Auto не решит всех проблем, но виртуальные миры имеют реальную ценность в обучении программ наряду с другими, более ресурсозатратными методами. Будем надеяться, что эффективность их будет расти и в будущем мы сможем наслаждаться более безопасными, умными и менее дорогими беспилотниками.

Читать также:

Association for Advancing Automation: автоматизация качественно улучшает рынок труда

Машинное обучение: проблемы и перспективы

Источник

Перевод Дарьи Котенко