Компания OpenAI, известная своими нейросетями ChatGPT и Sora, теперь взялась за музыку. По данным The Information, разработчики работают над инструментом, который сможет генерировать музыку по текстовому или голосовому запросу. Идея проста — вы описываете, что хотите услышать, например - «мягкая гитарная мелодия под вечерний влог» или «энергичный бит для ролика», а ИИ создает трек с нуля. Можно будет добавить фон к видео, сделать музыкальный аккомпанемент к вокалу или просто вдохновиться новыми звуками. Как это может работать Пока OpenAI не раскрывает деталей, но эксперты предполагают, что инструмент будет встроен прямо в ChatGPT или видеогенератор Sora — чтобы пользователь мог создавать видео сразу с подходящей музыкой. Известно, что OpenAI сотрудничает со студентами Джульярдской школы — одного из лучших музыкальных вузов мира. Они помогают разметить партитуры и обучающие данные, чтобы модель понимала структуру и настроение музыки. Для OpenAI это не дебют в музыкальном ИИ. В 2020 году компания уже запускала проект Jukebox, который мог писать песни в стиле известных исполнителей. Но с развитием ChatGPT и аудиомоделей (например, для синтеза речи) внимание сместилось в другие области. Почему это важно для OpenAI Рынок музыкальных ИИ растет как на дрожжах. Уже есть мощные конкуренты — Google со своим MusicLM и стартап Suno, который позволяет создавать полноценные треки по описанию. OpenAI явно не хочет отставать и готовится предложить свой инструмент — скорее всего, с фокусом на качество и интеграцию в экосистему ChatGPT. Если всё пойдет по плану, OpenAI сможет перевернуть музыкальный мир так же, как когда-то изменила подход к текстам и изображениям. Ведь теперь музыку можно будет не писать — а просто описывать.