Алгоритмы распознавания лиц используются не только спецслужбами, но и многими компаниями, которые уже давно внедрили данную технологию в нашу с вами повседневность. Сейчас эту технологию можно встретить практически везде: начиная с социальных сетей, где люди автоматически отмечаются на загруженных фотографиях, до мобильных операционных систем, где смартфон узнаёт своего владельца, видя его лицо через объектив фронтальной камеры. Но технология распознавания лиц далека от совершенства. Новый алгоритм, предложенный американскими исследователями, способен опознать человека даже по частичному изображению его лица.
Исследователи Сачин Фарфад и Мохаммед Сабериан из Yahoo Labs, а также Ли Джа Ли из Стэнфордского университета представили миру новый алгоритм распознавания лиц, который значительно проще и эффективнее, нежели все существующие на сегодняшний день аналоги данной технологии. Чтобы понять, как вообще работают такие алгоритмы, нам следует вернуться в 2001 год, когда исследователи Пол Виола и Майкл Джонс совершили прорыв в области распознавания лиц.
Виола и Джонс сумели преодолеть тупик, в котором находилась технология в то время. Их алгоритм отыскивал на изображении светлую вертикальную линию, которая чаще всего являлась носом человека, а также тёмную горизонтальную линию, которой являлись глаза. Их способ оказался весьма эффективным в случае с «портретным» расположением лиц, благодаря чему алгоритм был интегрирован в миллионы различных гаджетов (фотоаппаратов, смартфонов и т. д.) и приложений.
Тем не менее технология Виолы и Джонса далека от совершенства. Она плохо справляется с изображениями людей, которые стоят по отношению к камере под углом или их лицо частично прикрыто чем-либо. И вот здесь мы возвращаемся к теме данного материала. Команда Фарфада, Сабериана и Ли избрала совершенно другой подход при создании своего собственного алгоритма распознавания лиц.
Они создали продвинутую компьютерную нейронную сеть, которая на основе различных фотографий в течение некоторого времени изучала строение человеческого лица, его особенности, отображение под разными углами, при разном освещении и с разным качеством снимков. Другими словами, программа узнала, как должно выглядеть человеческое лицо.
Созданная для обучения нейронной сети база данных насчитывает более 200 000 фотографий лиц, а также 20 миллионов фотографий без изображения на них людей. В ходе обучения было использовано более 50 000 итераций 128 изображений. В результате был получен инструмент, который эффективно способен распознавать лица под разными углами, даже если они по каким-то причинам перевернуты с ног на голову.
Как только технология дорастёт до того, чтобы её начали использовать в потребительской электронике, можно ожидать, что распознавание лиц станет более эффективным и быстрым. Разработчики утверждают, что их алгоритм способен даже искать определённые лица в огромных архивах старых фотографий и видеозаписей, что является настоящим подарком для историков и журналистов, которые на данный момент делают всё это вручную в случае отсутствия какой-либо каталогизации архивных материалов.
Нет комментарий