OpenAI представила новую модель Voice Engine, которая позволяет трансформировать текст в голос. Для клонирования голоса человека достаточно всего 15-секундного аудиообразца, утверждается на сайте компании.
Отличие разработки OpenAI заключается в том, что для работы модели достаточно короткого аудиофайла и текста, который нужно озвучить.
Эксперты из OpenAI советуют использовать эту технологию для восстановления голоса у людей, лишенных этой возможности. Они также подчеркнули риски, связанные с современными генеративными моделями, и предложили способы их преодоления, включая отказ от биометрической аутентификации по голосу.
Разработка Voice Engine началась в конце 2022 года, при этом для обучения модели использовались как лицензированные, так и открытые данные. Пока неизвестно, когда сервис станет доступен широкой публике.
Понравилась новость? Добавьте в избранное Дзен Новости, присоединяйтесь к нашим сообществам Вконтакте и Одноклассники и нашему Telegram-каналу.