Новости

Компания Бекмамбетова начала "клонировать" голоса знаменитостей

Компания Бекмамбетова начала "клонировать" голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий.

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

30.10.2019

на печать


Комментарии

Написать комментарий

 Проверочный код

Анализ рынков

Архив

Пн Вт Ср Чт Пт Сб Вс

Рассылка

Подписка на рассылку

E-mail:
 

Также нашу рассылку вы можете получать через

E-mail:  

на правах рекламы

Есть мнение ...

Уже 42% москвичей полностью игнорируют телевизорУже 42% москвичей полностью игнорируют телевизор
За последние семь лет каждый десятый москвич перестал включать телевизор. По данным свежего опроса Superjob, в 2025 году почти половина горожан его уже полностью игнорируют.
Личный бренд - это тренд: публичный имидж развивают 40% российских...Личный бренд - это тренд: публичный имидж развивают 40% российских...
Развитие личного бренда постепенно превращается в неотъемлемую характеристику успешного руководителя. Как выяснили эксперты hh.ru и коммуникационного агентства FAVES Communications, сразу 40% управленцев разного уровня уделяют внимание своей публичности и имиджу в профессиональной среде. Еще 28% хотели бы это делать, однако пока к этому не приступили по разным причинам.
Медиаинфляция в fashion-индустрии: за последний год стоимость клика...Медиаинфляция в fashion-индустрии: за последний год стоимость клика...
E-Promo Group представила ежеквартальный отчет по динамике уровня медиаинфляции в performance-каналах в разрезе фешн-направления (одежда, обувь, аксессуары).
Бьюти-рынок столкнулся с ростом затрат на рекламуБьюти-рынок столкнулся с ростом затрат на рекламу
E-Promo Group представила ежеквартальный отчет по динамике уровня медиаинфляции в performance-каналах в разрезе косметики и парфюмерии.
ИИ-видео: как искусственный интеллект меняет производство рекламыИИ-видео: как искусственный интеллект меняет производство рекламы
ИИ-видео революционизируют рекламу! Узнайте, как нейросети создают низкобюджетные ролики с высоким качеством

Книги по дизайну

Загрузка ...

Репортажи

Психологическая гибкость: почему без нее бизнесу не выжитьПсихологическая гибкость: почему без нее бизнесу не выжить
Advertology побывал на выступлении бизнес-психолога Евгении Хижняк на конференции SM Network 2025 и рассказывает, как оставаться успешным в мире постоянных перемен.
Дизайн под грифом "секретно"Дизайн под грифом "секретно"
На чем раньше ездили первые лица страны? Эскизы, редкие фотографии и прототипы уникальных машин.
"Наша индустрия – самодостаточна": ГПМ Радио на конференции..."Наша индустрия – самодостаточна": ГПМ Радио на конференции...
Чего не хватает радио, чтобы увеличить свою долю на рекламном рынке? Аудиопиратство: угроза или возможности для отрасли? Каковы первые результаты общероссийской кампании по продвижению индустриального радиоплеера? Эти и другие вопросы были рассмотрены на конференции «Радио в глобальной медиаконкуренции», спикерами и участниками которой стали эксперты ГПМ Радио.
Форум "Матрица рекламы" о технологиях работы в период...Форум "Матрица рекламы" о технологиях работы в период...
Деловая программа 28-й международной специализированной выставки технологий и услуг для производителей и заказчиков рекламы «Реклама-2021» открылась десятым юбилейным форумом «Матрица рекламы». Его организовали КВК «Империя» и «Экспоцентр».
В ЦДХ прошел День социальной рекламыВ ЦДХ прошел День социальной рекламы (4)
28 марта в Центральном доме художника состоялась 25-ая выставка маркетинговых коммуникаций «Дизайн и реклама NEXT». Одним из самых ярких её событий стал День социальной рекламы, который организовала Ассоциация директоров по коммуникациям и корпоративным медиа России (АКМР) совместно с АНО «Лаборатория социальной рекламы» и оргкомитетом LIME.

Форум

на правах рекламы

15.12.2025 - 13:16
RSS-каналы Advertology.RuRSS    Читать Advertology.Ru ВКонтактеВКонтакте    Читать Advertology.Ru на Twittertwitter   
Advertology.Ru - все о рекламе, маркетинге и PR
реклама

Вход | Регистрация