Meta разработала модель ИИ, что воспринимает информацию как человек

Meta разработала модель ИИ, что воспринимает информацию как человек
Рука робота и рука человека, тянущиеся друг к другу. Фото: freepik.com

Компания Meta разработала новую модель искусственного интеллекта ImageBind, которая может имитировать человеческое восприятие. Модель способна связывать текст, изображения, видео, аудио, 3D-измерения, данные о температуре и движении.

Об этом сообщает Portaltele.

Читайте также:

ИИ, что учится как человек

Так, ImageBind предлагает комплексное понимание, сочетающее разные аспекты информации. Например, система искусственного интеллекта Make-A-Scene, предназначенная для преобразования текста в изображение, от Meta может использовать ImageBind для создания изображений на основе аудио, например, тропические леса или шумные рынки. Кроме того, ImageBind лучше понимает содержание, модерацию и креативный дизайн, которые может революционизировать благодаря сочетанию 3D-сенсоров и инерционного измерительного устройства (IMU).

Таким образом, ImageBind демонстрирует потенциал целостной интерпретации содержимого, позволяя разным модальностям взаимодействовать и устанавливать значимые связи без предварительного совместного обучения. Кроме того, во время процесса ImageBind учится и совершенствуется самостоятельно, подобно тому, как человек познает мир через изображения и звуки.

Чем может быть полезен ImageBind

Благодаря самостоятельному обучению и использованию минимальных учебных примеров модель раскрывает новые возможности в области обработки данных. Особо следует отметить ее способность связывать аудио и текст, а также прогнозировать глубину на основе изображений, превосходя модели, обученные исключительно на этих типах данных.

ImageBind упрощает процесс визуального проектирования в виртуальных играх и позволяет создавать анимации на основе изображений и звуковых файлов. Также он может облегчить восприятие мира людьми с физическими недостатками путем создания мультимедийных описаний в реальном времени.

Это свидетельствует о высокой эффективности и универсальности модели ImageBind, способной успешно работать с различными типами данных и добиваться чрезвычайно точных результатов в различных задачах обработки информации.

ImageBind создаст изображение на основе картинки и звука. Фото: imagebind.metademolab.com

Напомним, что искусственный интеллект, в частности ChatGPT, не может похвастаться высокой нравственностью или безопасными советами, ведь может давать довольно жестокие ответы. Поэтому группа исследователей разработала ИИ на основе правил безопасности и прав человека.