Создание музыкальных треков с помощью искусственного интеллекта, в которых имитируются голоса известных исполнителей, основано на технологиях клонирования голоса. Об этом RT рассказал председатель совета по противодействию технологическим правонарушениям КС НСБ России Игорь Бедеров.
По словам специалиста, процесс начинается с анализа большого массива аудиозаписей оригинального голоса. Нейросеть разбивает их на микрофрагменты и изучает особенности тембра, высоты тона и произношения, формируя цифровую модель голоса.
Затем оригинальная музыкальная композиция также делится на части, после чего алгоритм подбирает и заменяет звуки на элементы, соответствующие «слепку» нужного голоса. Итоговая запись дополнительно обрабатывается эффектами — добавляется реверберация, шум зала и другие элементы, создающие ощущение живого исполнения.
Эксперт отметил, что современные ИИ-голоса становятся всё сложнее для распознавания, однако некоторые признаки подделки остаются — например, неестественные паузы, «пустая» эмоциональность и цифровые артефакты.
По его словам, технологии уже достигли уровня, когда различить оригинал и синтез для большинства слушателей становится крайне сложно, особенно в коротких фрагментах или на фоне фонового шума.
