Новости психологии

Нейросеть рисует портреты по голосу

Ученые института штата Массачусетс разработали искусственную нейронную сеть, способную по спектрограмме (запись в компьютерной обработке) речи "нарисовать" примерное изображение лица говорившего. Новая нейросеть получила название "Речь@Лицо" (Speech2Face)

Ее обучали на миллионах записей лиц говорящих людей, разделенных на три группы по половому, расовому и возрастному признакам. Каждое видео было предварительно разделено на аудио- и видеодорожки.

Во время тестирования, как говорится в отчете, размещенном на сайте arXiv. org — специализированном портале для публикаций научных статей — ученым на текущий момент не удалось добиться получения точного портретного сходства с говорящим по звучания голоса. На сегодня нейросеть 100% точно определяет пол и расу. А вот с возрастом еще придется поработать.

Впрочем, ученые отмечают, что главное в работе Speech2Face — не создание портрета человека по его голосу, ведь он не дает информации о, например, величине и форме носа. А вот выделить некие отличительные черты — нейросети вполне по силам.

Фото: litsovet. ru