Создание музыки в считанные минуты: айтишники создали новую нейросеть

15 сентября 2023 10:14

Девушка слушает музыку. Иллюстративное фото: pixabay

Карина Бовсуновская

редактор

В компании Stability AI решили запустить новый ресурс, благодаря которому можно превратить текст в песни или фоновое радио. Ранее специалисты разработали одну из самых известных в мире нейросетей для того, чтобы генерировать изображения по текстовому запросу, а именно Stable Diffusion.

Об этом говорится на сайте Stability AI.

Особенности нейросети

Для нового сервиса используется последняя модель Stable Diffusion. Однако ее изучали не на изображениях, а на массиве аудиофайлов, а именно:

музыке;
звуковых эффектах;
звучании в отдельных музыкальных инструментах.

С примерами того, как работает нейросеть, можно ознакомиться на сайте Stability AI.

Как работает нейросеть. Скриншот: Stability AI

Сколько это будет стоить

Stable Audio будет иметь три пакета:

бесплатный: до 20 песен в месяц продолжительностью до 45 секунд;
профессиональный ($11,99 в месяц): до 500 песен в месяц продолжительностью до 90 секунд;
корпоративный: условия тарифа оговариваются в индивидуальном порядке.

Как это работает

"В отличие от большинства схожих моделей, превращающих текст в аудио, Stable Audio способна генерировать музыкальные треки разной продолжительности, без фиксированной длины. Таким образом, у создателей есть больше контроля над тем, насколько длинной будет композиция", — говорится в сообщении.

Для того, чтобы зарегистрироваться на веб-сервисе, необходим только адрес электронной почты. Чтобы сделать из текста песню или фоновое аудио, нужно описать текстом желаемый результат и указать продолжительность аудиодорожки.

Напомним, израильская компания Magos Systems разработала радарную систему с искусственным интеллектом. Она может распознавать любые дроны. Радар Magos AR-300 официально представят через неделю, на выставке в Далласе (США).

Читайте Новини.live!