Китайские разработчики научили ИИ говорить человеческим голосом

Максим Савельев, 10.03.2018

Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь. Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени.

Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам.

«Это настоящий прорыв с технической точки зрения, ведь мы смогли решить сложнейшую проблему, синтезировав живую речь со всеми ее особенностями», — говорит Лео Зу, один из авторов проекта.

Создатели алгоритма пояснили, что проект Deep Voice вдохновлён аналогичными разработками, вот только все его компоненты работают под управлением нейронной сети, при этом используя в работе довольно простые функции, что делает их алгоритм весьма адаптивным — голоса можно подстроить «под себя», наделив систему новыми акцентами и другими особенностями.

«Глубокое обучение привело к революции в различных областях, таких как компьютерное зрение и распознавание речи, а сейчас настало время и голосового синтеза. Мы рады, что смогли добиться таких результатов, и будем работать дальше, чтобы сделать систему «текст-голос» ещё более реалистичной», — приводит Motherboard цитату разработчиков.

Не забывайте про наш телеграм-чатик!

По материалам hi-news

сети

Нет комментарий

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

хайтек агрегатор

новости интернета и современных технологий

Китайские разработчики научили ИИ говорить человеческим голосом

Нет комментарий

Оставить комментарий Отменить ответ

В автомобилях Tesla появится аналог Google Play с играми и приложениями

видео | NVIDIA обновила вышедший 25 лет назад Quake II. Но сыграть в него смогут не все

Движущиеся тротуары: их почти сделали ещё 150 лет назад

Учёные создали новый полимер, который позволит заряжать батареи быстрее и без риска возгорания

Ученые обучают роботов не выполнять приказы

В Китае готовится к открытию первый отель с полностью роботизированным персоналом

Китайские разработчики научили ИИ говорить человеческим голосом

Вперед Как нам не утонуть в полиэтиленовом мусоре

Назад В России стартуют официальные продажи Nokia 6.1 и Nokia 7 Plus

Нет комментарий

Оставить комментарий Отменить ответ