Google AutoDraw поможет каждому желающему рисовать красиво

Самовыражение через живопись – достойная цель, но большинство из нас недалеко ушли от детской техники рисования «палка, палка, огуречик, вот и вышел человечек». В стремительный век развития искусственного интеллекта времени и желания оттачивать навыки малевания нет, поэтому щедрая компания Google анонсировала новый сервис, который берет всю сложную работу на себя.

Система AutoDraw выросла из проекта по распознаванию рукописного текста – когда разработчики поняли, что поднаторели в работе с иероглифами и текстом в картинках, они решили пойти дальше. В упрощенной форме это новый механизм автокоррекции вводимых данных, который анализирует что там пользователь накарябал пальцем или курсором, а затем делает «как правильно». Заменяет кривые линии на плавные, а расплывчатые образы на конкретные объекты.

В основе сервиса лежит нейронная сеть, гордость Google, так как в компании без ложной скромности полагают, что первыми в мире не только оценили потенциал систем машинного обучения, но и развернули их массовое использование. Чтобы научиться различать каракули, нейронная сеть «прочла» миллионы записей самыми разными почерками. А теперь ее наследнице «скармливают» тысячи ручных рисунков, чтобы она научилась понимать – как же люди сами изображают то, что имеют в виду?

Google AutoDraw поможет каждому желающему рисовать красиво

Параллельно с распознаванием абстрактных образов система учится составлять закономерности с тем, как люди их называют и описывают. Для того, чтобы уметь нарисовать кошку по запросу «кошка» или назвать существо с ушами-треугольниками и хвостом кошкой, а не мышкой. Для проверки накопленного опыта AutoDraw как-то попросили нарисовать трехглазую кошку, но система дал отрицательный ответ – она уже твердо усвоила, что у «нормальной кошки» только два глаза.

Задача творить, создавать новые рисунки, на данном этапе перед нейронной сетью не ставится вовсе. Скорее всего, первое коммерческое воплощение будет иметь формат надстройки для поисковика или мессенджеров, которая преобразует произвольный рисунок в набор тегов для работы с ними по стандартным алгоритмам. И параллельно придает ему красивый, законченный вид – на радость тем, кто не умеет рисовать.

По материалам techcult