«Прoрыв в тexнoлoгияx»: Сoздaнa программа, которая может голосом рисовать внешность
Услышав незнакомый голос по телефону или радио, любой человек сразу начинает представлять внешние данные говорящего. Но, оказывается, что этот процесс может происходить не просто в головах людей, но и в памяти машин. Сегодня автоматизировать визуализацию по голосу вполне реально.
Ученые из MIT CSAIL представили на суд обывателей способ, который может совершить этот процесс. Конечно, внешность человека пока получается усредненная, но близкая к реальности. Для этого процесса используется нейросеть. Она обработала миллионы видео на платформе Ютуб. Были просмотрены записи более 100 тыс.чел. Нейросеть оценивала граждан по акцентам, языку, интонации. Модель смогла сравнить речевые особенности и сопоставить их с физическими данными, например, этнической принадлежностью, возрастом, полом. Именно этот анализ позволил нейросети определить строение лица, форму губ, носа, разрез глаз и т.д. После этого программа прослушивала аудио и уже изображала тех, кто по ее мнению, произносит ту или иную речь.
Авторы проекта говорят о том, что воссоздание точных характеристик человека, произносящего речь, не стоит в их планах. Они, скорее, желают выявить примерные особенности внешности человека. Если говорить о том, как работает программа, то она усредняет статистику и уже на результатах такого анализа выдает внешность людей. Ведь можно предположить, что в течение жизни человек неоднократно меняет цвет волос, стиль в одежде, позволяет татуировки. Такие нюансы программе вывить пока не под силу.
Автоматизированная нейросеть, безусловно, сделает выводы, если, например, миллион человек имеет определенный акцент и обладает определенной прической. Это, конечно, в итоге повлияет на результат. Несложно придумать практическое применение для такой программы. Например, модель могла бы визуализировать преступников, позвонивших по телефону. Возможно, что подобная программа впоследствии будет усовершенствоваться и получит свое непосредственное применение в органах.