Создание музыки в считанные минуты: айтишники создали новую нейросеть

Девушка слушает музыку. Иллюстративное фото: pixabay

В компании Stability AI решили запустить новый ресурс, благодаря которому можно превратить текст в песни или фоновое радио. Ранее специалисты разработали одну из самых известных в мире нейросетей для того, чтобы генерировать изображения по текстовому запросу, а именно Stable Diffusion.

Об этом говорится на сайте Stability AI.

Особенности нейросети

Для нового сервиса используется последняя модель Stable Diffusion. Однако ее изучали не на изображениях, а на массиве аудиофайлов, а именно:

  • музыке;
  • звуковых эффектах;
  • звучании в отдельных музыкальных инструментах.

С примерами того, как работает нейросеть, можно ознакомиться на сайте Stability AI.

Как работает нейросеть. Скриншот: Stability AI

Сколько это будет стоить

Stable Audio будет иметь три пакета:

  • бесплатный: до 20 песен в месяц продолжительностью до 45 секунд;
  • профессиональный ($11,99 в месяц): до 500 песен в месяц продолжительностью до 90 секунд;
  • корпоративный: условия тарифа оговариваются в индивидуальном порядке.

Как это работает

"В отличие от большинства схожих моделей, превращающих текст в аудио, Stable Audio способна генерировать музыкальные треки разной продолжительности, без фиксированной длины. Таким образом, у создателей есть больше контроля над тем, насколько длинной будет композиция", — говорится в сообщении.

Для того, чтобы зарегистрироваться на веб-сервисе, необходим только адрес электронной почты. Чтобы сделать из текста песню или фоновое аудио, нужно описать текстом желаемый результат и указать продолжительность аудиодорожки.

Напомним, израильская компания Magos Systems разработала радарную систему с искусственным интеллектом. Она может распознавать любые дроны. Радар Magos AR-300 официально представят через неделю, на выставке в Далласе (США).