OpenAI обновила генератор изображений по текстовому описанию DALL-E

3 years ago 216

Некоммерческая организация OpenAI представил новую версию генератора изображений по текстовому описанию, создающего реалистичные картинки в более высоком разрешении и с меньшей задержкой, чем оригинал.

Our newest system DALL·E 2 can create realistic images and art from a description in natural language. See it here: https://t.co/Kmjko82YO5 pic.twitter.com/QEh9kWUE8A

— OpenAI (@OpenAI) April 6, 2022

В DALL-E 2 пользователи могут выбирать и редактировать определенные области существующих изображений, добавлять или удалять элементы вместе с их тенями, создавать коллажи и вариации готовых рисунков.

Нейросеть генерирует картинки с разрешением 1024 пикселя — в четыре раза выше, чем у оригинальной модели.

Сервис DALL-E (сочетание имен художника Сальвадора Дали и мультипликационного персонажа ВАЛЛ-И) основан на модели компьютерного зрения OpenAI CLIP, анонсированной в 2021 году.

«Оригинальная модель просто брала подход GPT-3 из языка и применяла его для создания изображения: мы помещали изображения в набор слов и научились предсказывать, что будет дальше», — рассказал исследователь OpenAI Прафулла Дхаривал.

На сегодня DALL-E 2 доступна тестировщикам, зарегистрировавшимся в листе ожидания. Пользователям недоступно создание непристойных и экстремистских изображений, а также материалов, связанных с «текущими геополитическими событиями».

Напомним, в январе инженер машинного обучения создал генератор покемонов на основе модели DALL-E.

В августе 2021 года энтузиаст разработал уменьшенную версию генератора рисунков из текстового описания от OpenAI.

Подписывайтесь на ForkLog в TikTok!

Read Entire Article