«Imagine with Meta AI» превращает запросы в изображения, обучаясь на данных Facebook.
В среду Meta выпустила бесплатный независимый веб-сайт генератора изображений ИИ «Imagine with Meta AI», основанный на модели синтеза изображений Emu. Meta использовала 1,1 миллиарда публично доступных изображений Facebook и Instagram для обучения ИИ-модели, которая может создавать новые изображения по письменным запросам. Ранее версия этой технологии Meta, использующая те же данные, была доступна только в приложениях для обмена сообщениями и социальных сетях, таких как Instagram.
Если вы пользуетесь Facebook или Instagram, вполне возможно, что фотография вас (или сделанная вами) помогла обучить Emu. В некотором роде старая поговорка «Если вы не платите за это, вы — продукт» приобретает совершенно новый смысл. Хотя с 2016 года пользователи Instagram ежедневно загружали более 95 миллионов фотографий, поэтому набор данных, который Meta использовала для обучения своей ИИ-модели, был небольшой частью ее общей фотобиблиотеки.
Поскольку Meta заявляет, что использует только публично доступные фотографии для обучения, установка ваших фотографий как приватных в Instagram или Facebook должна предотвратить их включение в обучение будущих ИИ-моделей компании (если, конечно, она не изменит эту политику).
Imagine with Meta AI
Подобно Stable Diffusion, DALL-E 3 и Midjourney, Imagine with Meta AI генерирует новые изображения на основе того, что ИИ-модель «знает» о визуальных концепциях, изученных из обучающих данных. Для создания изображений на новом веб-сайте требуется аккаунт Meta, который можно импортировать из существующего аккаунта Facebook или Instagram. Каждая генерация создает четыре изображения размером 1280×1280 пикселей, которые можно сохранить в формате JPEG. Изображения включают небольшой логотип водяного знака «Imagined with AI» в левом нижнем углу.
«Meta рада слышать от пользователей о том, как они используют функцию генерации изображений из текста ‘Imagine with Meta AI’ для создания забавного и креативного контента в чатах,» — говорится в пресс-релизе Meta. «Сегодня мы расширяем доступ к imagine за пределами чатов, делая его доступным в США на imagine.meta.com. Этот независимый опыт для творческих хобби позволяет вам создавать изображения с использованием технологии Emu, нашей основной модели изображений.»
Авторы провели неформальные тесты нового генератора изображений ИИ Meta, используя «варвара с CRT-монитором» и «кошку с пивом» в качестве протоколов синтеза изображений и обнаружили новаторские результаты. Они заметили, что при генерации изображений людей с Emu многие из них выглядели как типичные посты моды в Instagram.
Также авторы провели тестирование на противостояние. Генератор, по-видимому, фильтрует большинство сцен насилия, ругательств, сексуальных тем и имен знаменитостей и исторических личностей, но разрешает коммерческих персонажей, таких как Эльмо (да, даже «с ножом») и Микки Мауса (но не с пулеметом).
Почти Midjourney, но не совсем
Модель Meta в целом создает фотореалистичные изображения хорошо, но не так хорошо, как Midjourney. Она может обрабатывать сложные запросы лучше, чем Stable Diffusion XL, но, возможно, не так хорошо, как DALL-E 3. Кажется, она не очень хорошо справляется с рендерингом текста и дает смешанные результаты при обработке различных медиа, таких как акварель, вышивка и рисунок ручкой и чернилами. Ее изображения людей, кажется, включают разнообразие этнических фонов. В целом она кажется средней по сегодняшним меркам синтеза изображений ИИ.