Яндекс создал впечатляющую функцию — запустил закадровый переводчик видео
Яндекс создал впечатляющую функцию — запустил закадровый переводчик видео
Нет, речь не про субтитры, как вы могли подумать, а про полноценный перевод с двухголосой закадровой озвучкой, созданной нейросетями. Всё это уже можно затестить в их браузере. Вот образец готового перевода на примере фрагмента лекции Джимми Уэйлса в Яндексе.
А вот собственно оригинал этого видео:
Яндекс: Мы хотим, чтобы голоса у спикеров были разными: так проще воспринимать речь. Мы планируем адаптировать синтезированный голос к голосу спикера. Но на текущем этапе у нас более простое решение: мы определяем пол говорящего для каждой части текста, чтобы озвучивать их мужским или женским голосами.
Машинный перевод
Теперь пора переводить. Тут в целом всё происходит достаточно стандартно, но с одной важной особенностью: мы передаём в модель переводчика ещё и информацию о спикерах, об их поле. Это нужно для того, чтобы в переводе разные спикеры говорили о себе или обращались к другим с корректным согласованием местоимений, глаголов и прилагательных.
Синтез речи
Переходим к синтезу голоса. Сейчас у нас два голоса, дальше станет больше. Но самая большая сложность вовсе не в этом. Тексты на русском языке длиннее, чем на английском. Разница может составлять в среднем от 10 до 30%. Это значит, что при длительном воспроизведении мы рискуем словить существенный рассинхрон между тем, что говорит спикер на английском, и тем, что мы произносим на русском. Значит, нужно синхронизировать два потока речи. И нет, мы не стали фиксированно ускорять одну дорожку относительно другой.
Вот наглядная схема всего процесса перевода видео:
Сейчас перевод видео доступен для английского языка и популярных сервисов. Он работает в Яндекс.Браузере для десктопа и Android, а также в приложении Яндекс для Android и iOS.
Только представьте, какие двери открывает возможность сделать из любого англоязычного ролика понятный видос на русском.
0 комментариев