Нейросеть услышала голоса людей и нарисовала их портреты

Максим Савельев, 02.06.2019

В последнее время нейронные сети удивляют своими умениями — могли бы вы десять лет назад поверить в то, что компьютер сможет «оживлять» портреты Достоевского и Мэрилин Монро? Готовьтесь удивляться дальше, потому что исследователи из Массачусетского технологического института создали нейросеть Speech2Face, которая способна рисовать портреты людей, просто послушав их голоса. Технология пока далека от идеала, но ее способность определять пол, национальность и возраст человека впечатляет.

Для обучения нейросети использовался набор AVSpeech с миллионом коротких видеороликов с тысячами говорящих людей. Дорожки с видео и звуком разделены, поэтому система смогла изучить каждый тип материала максимально подробно. На первом этапе работы, алгоритм VGG-Face изучал фрагменты видео и создавал портреты фигурирующих на них людей в анфас и нейтральным выражением лица. Другая часть алгоритма изучала спектрограмму голоса и накладывала на полученные портреты дополнительные изменения — в итоге получился примерный портрет каждого разговаривающего человека.

Нейросеть для создания портретов на основе голоса — уже реальность

Если сравнить лицо человека с видео и предложенный алгоритмом вариант, то можно найти множество отличий. Впрочем, исследователи уверяют, что они изначально не хотели создать максимально похожий портрет человека — на тон и интонацию человеческого голоса влияют множество факторов, поэтому идеального результата они бы все равно не получили. Зато нейронная сеть отлично справляется с тем, что важно исследователям, а именно с точным определением пола, национальности и возраста.

Авторы работы отметили, что на данный момент алгоритм слабоват при определении возраста, но они в силах повысить точность. Также было обнаружено, что алгоритм лучше воссоздает лица с европейской и азиатской внешностью, но это связано только с тем, что на обучающих видеороликах было не равное количество лиц разных национальностей.

Зачем нужна нейросеть?

Чем же может быть полезна эта технология в будущем? Как вариант, при помощи нее когда-нибудь может быть создан сервис, где виртуальный аватар пользователя создается автоматически, на основе его голоса. Новое исследование также несет большую научную пользу — изучив данные, ученые могут найти взаимосвязь между внешностью человека и его голосом. Послушать голоса и посмотреть на воссозданные на их основе портреты можно на сайте проекта.

По материалам hi-news

видео наука сети

Нет комментарий

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

хайтек агрегатор

новости интернета и современных технологий

Нейросеть услышала голоса людей и нарисовала их портреты

Нейросеть для создания портретов на основе голоса — уже реальность

Зачем нужна нейросеть?

Нет комментарий

Оставить комментарий Отменить ответ

В автомобилях Tesla появится аналог Google Play с играми и приложениями

видео | NVIDIA обновила вышедший 25 лет назад Quake II. Но сыграть в него смогут не все

Движущиеся тротуары: их почти сделали ещё 150 лет назад

Учёные создали новый полимер, который позволит заряжать батареи быстрее и без риска возгорания

Китайский «робот-огнеборец» от Deep Robotics показал на что способен в реалистичных условиях

Фабрика ENGINEAI в Шэньчжэне выпускает одного андроида каждые 15 минут

Нейросеть услышала голоса людей и нарисовала их портреты

Нейросеть для создания портретов на основе голоса — уже реальность

Зачем нужна нейросеть?

Вперед Саблезубые тигры оказались сильнее, чем предполагалось ранее

Назад Оба Galaxy Note 10 лишатся разъёма для наушников и всех физических кнопок

Нет комментарий

Оставить комментарий Отменить ответ