Нейросеть рисует портреты по голосу

Опубликована 28.05.2019 в 9:08
Изменена 23.02.2022 в 14:03

Ученые института штата Массачусетс разработали искусственную нейронную сеть, способную по спектрограмме (запись в компьютерной обработке) речи "нарисовать" примерное изображение лица говорившего. Новая нейросеть получила название "Речь@Лицо" (Speech2Face)

Ее обучали на миллионах записей лиц говорящих людей, разделенных на три группы по половому, расовому и возрастному признакам. Каждое видео было предварительно разделено на аудио- и видеодорожки.

Во время тестирования, как говорится в отчете, размещенном на сайте arXiv. org — специализированном портале для публикаций научных статей — ученым на текущий момент не удалось добиться получения точного портретного сходства с говорящим по звучания голоса. На сегодня нейросеть 100% точно определяет пол и расу. А вот с возрастом еще придется поработать.

Впрочем, ученые отмечают, что главное в работе Speech2Face — не создание портрета человека по его голосу, ведь он не дает информации о, например, величине и форме носа. А вот выделить некие отличительные черты — нейросети вполне по силам.

Фото: litsovet. ru

Астрологическая реальность: какие опасности могут скрыться за многократными браками Овна, Близнецов и Скорпиона?

Как покорить мужское сердце и не сделать ошибок в отношениях: психолог делится секретами о мужчинах

Как пережить неожиданный разрыв

Нейросеть рисует портреты по голосу

Рекомендуемое