Лучшая нейросеть для рисования: cравнили шесть вариантов
Анастасия Хорошева
Собрала коллекцию артов с котами и холодильниками от нейросетей
Протестировали шесть нейросетей, которые умеют создавать изображения по текстовому описанию. C каждой поиграли в капризного заказчика и дали по заданию. Потом сравнили результаты и на их основе составили мини-рейтинг.
Как искусственный интеллект создает картинки
Нейросеть анализирует сотни тысяч изображений в интернете, разбивает их на отдельные элементы и систематизирует. Когда программа получает задание, она подбирает подходящие кусочки и складывает из них картинку.
Например, чтобы нарисовать ноутбук в стиле художников эпохи Возрождения, сервис сначала вычисляет признаки, по которым зритель поймет, что перед ним ноутбук. Потом то же самое проделывает со стилем — отбирает характерные черты живописи той эпохи. И затем уже соединяет результаты анализа и выдает картинку.
По сути, это математический алгоритм, который обучает сам себя. Чем больше заданий и реакций на качество своей работы он получает, тем объемнее база данных и тем быстрее и точнее сервис находит решения. Поэтому чем чаще люди обращаются к нейросети, тем правильнее и интереснее результаты ее работы.
Что тестировали
- Midjourney — нейросеть, которая появилась в открытом доступе в июле 2022 года. Ее работы регулярно вирусятся в соцсетях, например подборка картинок «Российские города глазами нейросети» и аналогичные ей. Программа умеет создавать картинки по текстовому запросу, подгонять готовые изображения под нужную стилистику и «смешивать» два изображения.
- Шедеврум — разработка Яндекса. Ее презентовали в апреле 2023 года. Пока нейросеть доступна в виде приложения. Оно работает по принципу соцсети: можно не только генерировать картинки по текстовому описанию, но и делиться ими с другими пользователями и лайкать их работы.
- Kandinsky 2.1 — программа, которую представил Сбербанк в апреле 2023 года. Она умеет генерировать картинки по описанию, соединять два изображения, дорисовывать и удалять элементы с фото, создавать иллюстрации по мотивам референса. Программе можно задавать стили, под которые она подстроит результат.
- DALL·E — продукт, который разработала некоммерческая организация OpenAI при финансовой поддержке Microsoft. Первую версию программы показали еще в 2021 году. Она генерировала изображения по текстовому описанию. В феврале 2022-го разработчики добавили функцию редактора, чтобы можно было сразу вносить правки в картинку. Например, удалять лишние детали.
- Bing Image Creator — инструмент от компании Microsoft, в основе которого лежит нейросеть DALL·E. Его запустили в марте 2023 года. Фишка этой нейросети — фотореалистичные изображения, которые она создает на основе текста.
- Deep Dream Generator — эту нейросеть создал в 2015 году Google. Особенность сервиса заключается в том, что в нем много подсказок, которые касаются стиля и качества будущего изображения. Можно задать не только стиль художника и жанр, но и эффект, например «красочный» или «милый».
Как тестировали
Придумали два задания.
Первое — задание на точность. С его помощью проверили, насколько точно нейросети понимают описания. Придумали базовый запрос — промт, а потом усложнили его — сначала добавили детали, а потом указали еще больше нюансов и задали стиль:
- Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот.
- Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается.
- Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество.
Второе задание — более творческое, чтобы узнать, насколько хорошо искусственный интеллект справится с короткими абстрактными запросами. Прошлись по каталогу Ситилинка и нашли интересную фразу в отзыве к наушникам: «Мир вокруг становится в 10 раз тише». Ее и использовали для теста.
В итоге каждый сервис нарисовал по четыре картинки — показываем, что получилось.
Midjourney
- Где попробовать: в Discord
- Язык: английский
- Доступ: у нейросети нет бесплатного доступа, а подписку нельзя оплатить с российской карты
Нейросеть Midjourney работает на базе чата Discord, поэтому нужна учетная запись в этом мессенджере. Чтобы получить изображение, можно загрузить картинку-референс или сформулировать подробный текстовый запрос. Если ввести его на русском, то нейросеть сначала переведет его через онлайн-переводчик, а потом уже возьмет в работу.
Чтобы сгенерировать картинку, надо дать боту команду /Imagine и напечатать запрос
На каждый запрос сервис генерирует четыре арта. Перед тем как скачать готовое изображение, пользователь может:
- Выбрать одно, чтобы Midjourney сделала апскейлинг — добавила детали и улучшила качество. Такой вариант подходит, если вас сразу устроил результат. Чтобы указать нейросети на нужный арт, нажмите на одну из кнопок: U1, U2, U3 или U4. Цифры обозначают номер изображения.
- Создать вариацию одной из картинок. Такую тактику используют, когда нравится идея изображения, но хочется ее доработать. За это отвечают кнопки V1, V2, V3 и V4.
Под каждой порцией изображений есть два ряда кнопок — для детализации и создания вариаций
На каждое действие сервису нужно по минуте.
Вот как Midjourney справилась с тестом.
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
Midjourney поместила в центр композиции не холодильник, а кота. Наверное, потому что он получился очень красивым
Иллюстрация вышла очень реалистичной: в дверце холодильника отражается кухня, кот выглядит как настоящий. В отличие от других нейросетей эта выбрала нестандартный сюжет для арта. В центре картинки кот, но холодильник тоже угадывается без проблем.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
Судя по фото, третья передняя лапа помогла коту освоить прямохождение
С этим описанием нейросеть справилась чуть хуже, чем с предыдущим. Холодильник получился слишком маленьким, на дверце есть лишняя ручка. Зато кот большой и прямоходящий. Для этого он даже отрастил пятую лапу.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Самая правдоподобная часть картинки — плита, а у кота лишний хвост
На холодильнике принт под Ван Гога и картина в его же стиле. Холодильник правдоподобный, размеры реалистичные. У гарнитура хаотично расположены ручки, зато есть деревянная столешница. Лучше всего получилась плита: форма, дисплей, вентили выглядят как надо. Немного непонятно, что делает на кухне гитара.
Мир вокруг становится в 10 раз тише
Качество изображения завораживает, но замысел сложно считать
С первого взгляда сложно считать, при чем тут тишина, но сама композиция интересная: хочется рассматривать и горы, и лес, и расположение континентов, и их отражение в воде.
Шедеврум
- Где попробовать: в приложениях для iOS и Android
- Язык: русский
- Доступ: приложение полностью бесплатное, в нем нет лимитов на количество картинок
Шедеврум — мини-соцсеть, где можно генерировать картинки, делиться ими с другими пользователями и лайкать их работы. Аккаунт привязан к Яндекс ID. Чтобы его получить, нужно использовать почту на Яндексе.
Сервис умеет подражать художникам и делать картинки в разных стилях — от фотореализма до аниме. Главное — указать все пожелания через запятую.
В текстовом поле надо указать все пожелания: стиль фото, качество, освещение
Программа обрабатывает запрос за 1–2 минуты, а затем выдает 4 картинки, чтобы вы выбрали лучшую и опубликовали ее в своем аккаунте. После этого нужно подождать еще 10–15 минут — нейросеть повысит качество изображения, вы сможете сохранить его на смартфон.
Вот что Шедеврум сгенерировал по нашим запросам:
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
У кота странное строение тела, нет носа и глаз, зато холодильник выглядит как настоящий
От картинки двоякие впечатления. С одной стороны, кухня светлая, холодильник, окна и остальные предметы похожи на настоящие. Но кот получился настолько странным, что невозможно понять, с какой стороны у него голова.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
У кота проблемы с прикусом — он похож на кроличий. Уши и хвост тоже вызывают недоумение
Начнем с плюсов: кухня светлая, холодильник стоит около окна, кот рыже-белый и пушистый. В деталях Шедеврум наделал ошибок. Холодильник получился слишком маленьким, а кот — чересчур большим, со странной мордочкой и непонятной кисточкой то ли на хвосте, то ли на лапе.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Видимо, нейросеть не знает, как Ван Гог нарисовал бы кота, поэтому просто убрала его из сюжета
Лучше всего у Шедеврума получилось окно и цветок на подоконнике. У остальных элементов есть недостатки. У красной тумбы что-то случилось с ножками, у холодильника пропала боковая стенка, а дверцы склеились, кота вообще нет. С кухней есть сомнения, так как по рисунку сложно определить, деревянная она или нет.
Мир вокруг становится в 10 раз тише
Шедеврум связал тишину и природу и выдал умиротворяющий пейзаж
Пейзаж выглядит так, что хоть сейчас снимай «Властелин колец»: горы, река и красивое небо. Природа удается нейросети от Яндекса лучше, чем коты и холодильники. Тема с животными не отпускает искусственный интеллект: каменные глыбы справа подозрительно напоминают сидящих собак, гориллу в желтой футболке и голову лошади.
Kandinsky 2.1
- Где попробовать: на официальном сайте, в телеграм-боте
- Язык: русский, но нейросеть понимает еще 100 языков, в том числе и английский.
- Доступ: на сайте можно только генерировать картинки, а чтобы использовать полный набор функций, нужно запустить телеграм-бота от официального разработчика.
В этом сервисе не надо регистрироваться. Достаточно открыть сайт или запустить бота. На сайте можно удалять предметы с фото и генерировать изображения по описанию. Чтобы создать арт, введите описание, выберите стиль и нажмите «Создать». Через минуту сервис выдаст результат.
Kandinsky 2.1 создает за раз только одно изображение
У бота больше возможностей. Он умеет генерировать арты по описанию, совмещать два изображения, дорисовывать элементы на фото, делать несколько вариаций одной иллюстрации.
Бот дает подсказки, когда отправлять фото, а когда вводить текст и выбирать стиль
Скорость и качество работы сервиса не зависит от платформы. Что в боте, что на официальном сайте картинку нужно ждать 1–2 минуты.
Переходим к результатам теста.
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
Сразу в глаза бросается хвост, который гуляет сам по себе
Очень яркий арт, но не без ошибок. Хвост отправился куда-то в батарею, у его хозяина выросло третье ухо. Возможно, именно из-за этого у кота такая странная морда. Зато с питанием все было отлично — животное выросло минимум на метр. К холодильнику тоже много вопросов. Например, как закрывается красная створка и почему в нем стоит ваза. Зато термос на столе ставим плюс — душевная деталь.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
Нейросеть страдает кошачьей гигантоманией и не умеет рисовать хвосты
Сервис точно изобразил вазы на окне и банки на полочке. Холодильник на картинке не угадывается. С котом задача выполнена на треть: пушистость и окрас совпадают с заданием, но само животное размером с тигра и не умывается, а высматривает что-то в окне. Видимо, ищет сбежавший хвост.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Программа применила стиль Ван Гога выборочно — снова получился дизайнерский холодильник
С точки зрения деталей, это изображение получилось худшим из всех трех. Нейросеть Kandinsky 2.1 явно знает, что такое стиль Ван Гога, но почему-то постеснялась применить его ко всей картинке. За деревянную кухню сервис выдает стул странной формы и пару картин с левой стороны картинки. На дверце холодильника какая-то странная вмятина. Такое ощущение, что пельмени пытались выбраться из морозилки и открыть ее ломом.
Нашелся один из пропавших хвостов с предыдущих артов, а кот обзавелся третьим ухом и научился парить над полом.
Мир вокруг становится в 10 раз тише
После ярких котов эта композиция выглядит особенно мрачной
Если не брать в расчет пугающую форму пальцев и птиц в небе, получилась атмосферная картинка. Складки на рукавах и капюшоне выглядят как настоящие. Удивляет цветовая гамма — после ярких артов с рыжими котами она выглядит слишком депрессивной.
DALL·E
- Где попробовать: на официальном сайте
- Язык: английский
- Доступ: чтобы зарегистрироваться в нейросети, нужны зарубежные сим-карта, банковская карта и VPN; сервис не делает бесплатные изображения — нужно оплатить пакет генераций
Удобнее всего пользоваться этой нейросетью тем, у кого есть аккаунт в ChatGPT — оба сервиса работают на единой платформе.
В DALL·E простой интерфейс: окно для промта и кнопка «Сгенерировать»
На каждый запрос программа делает четыре картинки и предлагает три действия:
- выбрать одну и сохранить ее, если результат полностью устраивает;
- добавить детали на одну из иллюстраций;
- сделать еще четыре вариации одного изображения.
На создание арта нужно 1–2 минуты. Пока идет ожидание, программа покажет примеры удачных работ вместе с промтами. Можно почерпнуть какие-то хитрости и использовать их потом в своих запросах.
У готовых изображений в правом нижнем углу есть набор из цветных квадратиков — водяной знак. Убрать его нельзя.
Посмотрим, как нейросеть справилась с заданиями.
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
Нейросеть решила изобразить открытый холодильник, но не рассчитала пропорции дверей
Сервис как будто нарисовал кота и бутылку акварелью. На особенности техники можно списать внешний вид животного и особенно выражение его мордочки. С холодильником программа тоже справилась не до конца. Он среднего размера и со странной дверью. Она как будто двойная, но второй створки не видно.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
Кот опять выглядит так, как будто его наспех дорисовали кисточкой
Батарея, окно и холодильник — как настоящие. Кот выбивается из этой реалистичной картины. Хвост у него выглядит как мочалка, очертания неясные. Еще один странный предмет — бутылка. Она выглядит так, как будто неумелый дизайнер добавил ее на изображение с помощью фоторедактора.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Судя по движению передней лапы, кот умывается
На картинке есть деревянные детали на кухне, холодильник и кот, который даже как будто бы умывается — тянет переднюю лапу к мордочке. Проблемы кроются в деталях. Ножки и ручки гарнитура кривые, двери холодильника странной формы. Животное больше похоже на мятый бумажный пакет.
Мир вокруг становится в 10 раз тише
Нейросеть как будто намекает, что на картинке затишье перед бурей
По абстрактному запросу DALL·E создал горный пейзаж. И небо, и склоны выглядят так, как будто их писали с реальной панорамы где-нибудь в Непале. Явных ошибок нейросеть не допустила.
Bing Image Creator
- Где попробовать: на официальном сайте
- Язык: английский.
- Доступ: сервис бесплатный, но внутри программы есть монетки — бусты, с которыми сайт генерирует картинки за 15 секунд. Когда бусты заканчиваются, скорость падает и приходится ждать дольше. В России сервис работает только через VPN
Чтобы создавать изображения в Bing Image Creator, понадобится учетная запись Microsoft. На регистрацию уйдет пара минут: надо указать адрес электронной почты, придумать пароль, добавить дату рождения и ввести код из письма, которое придет на почту. После этого можно переходить к созданию картинок.
Bing Image Creator работает только с текстовыми описаниями. Интерфейс программы очень простой: есть поле для запроса и кнопка «Создать». В результате получаются четыре картинки с водяным знаком в нижнем левом углу — его нельзя убрать. Готовые арты можно скачать.
В Bing Image Creator нет встроенных подсказок, поэтому все требования к картинке надо перечислить в текстовом запросе
Платформа хранит последние 20 запросов каждого пользователя. Можно в любой момент открыть сгенерированные иллюстрации и сохранить их.
Еще одна особенность нейросети — кнопка «Удивите меня». Если нажать на нее, программа случайно выберет запрос и нарисует по нему четыре картинки.
Проверяем, насколько точно нейросеть выполнила наши задания.
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
Холодильник вместительный, с охладителем воды — современная модель, одобряем
Картинка отвечает всем требованиям: есть холодильник, кот, окно, кухня тоже угадывается. У животного правильное количество ушей и хвостов, это успех. Холодильник выглядит как настоящий — есть даже охладитель для воды, створки одинаковые, во всю высоту прибора.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
В этот раз кот похож на настоящего, а у холодильника появились проблемы с дверцами
Здесь нейросеть упустила важную деталь: кот должен умываться, а не просто сидеть. Еще немного странно выглядит глаз и положение передней лапы, но они получились лучше, чем в предыдущей попытке. С холодильником возникли проблемы. Дверцы разного размера, их нельзя открыть из-за странного расположения ручек. Еще впечатление от картинки портит странное смазанное пятно в нижнем левом углу.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Стиль Ван Гога угадывается, но нейросеть снова не смогла заставить кота умываться
Со стилем Ван Гога программа справилась. Характерные мазки легко угадываются, цветовая гамма тоже похожа. Деревянную кухню видно, окно есть, света много. Недостатки те же, что и в предыдущей попытке: кот и двери холодильника. В этот раз животное разглядывает духовку, а двери склеились в одну.
Мир вокруг становится в 10 раз тише
Bing Image Creator угадал, что фраза относилась к наушникам. Интересно
Фразу из задания мы взяли из отзыва к наушникам. Нейросеть каким-то чудом отгадала товар и выдала очень атмосферный арт. Девушка явно наслаждается музыкой и не слышит шума вокруг. Возможно, именно из-за этого у нее выросло настолько большое ухо и лишняя фаланга на мизинце. Непонятные свечения в районе носа и глаза можно списать на огоньки на фоне.
Deep Dream Generator
- Где попробовать: на официальном сайте
- Язык: английский.
- Доступ: чтобы генерировать картинки, нужно купить подписку, но ее нельзя оплатить с российских карт
Чтобы воспользоваться сервисом, надо зарегистрироваться на сайте — указать электронную почту, придумать имя пользователя и пароль. На почту придет письмо со ссылкой для подтверждения регистрации. Чтобы начать создавать запросы, нужно пройти по ней.
Deep Dream Generator работает по принципу соцсети. Пользователи оценивают и обсуждают работы друг друга.
В нейросети есть две «валюты»: энергия и вдохновение. Вы получаете по баллу вдохновения, когда кто-то лайкает вашу работу в ленте. За каждые 50 баллов программа выдает 100 единиц энергии. Их можно потратить на создание картинок. Чем сложнее описание, тем дороже выходит иллюстрация. Энергию можно копить с помощью лайков, а можно купить пакет или оформить подписку.
Чтобы создать картинку, сформулируйте запрос на английском языке. Для более точного результата используйте модификаторы — это подсказки самой программы. Например, стили будущего изображения, жанр, качество, эффекты.
По умолчанию создание картинки стоит 5 энергий, за дополнительные параметры нужно доплатить еще от 1 до 5
Нейросети понадобится примерно минута, чтобы создать иллюстрацию. Ее можно скачать, опубликовать в галерее на сайте нейросети или использовать как основу для создания другой картинки.
Мы перевели задания для сервиса на английский с помощью онлайн-переводчика. Вот как нейросеть проиллюстрировала их.
Большой холодильник стоит в светлой кухне около окна, рядом сидит рыжий кот
Издалека иллюстрацию можно принять за рекламу дизайнерского холодильника, но если присмотреться, становятся заметны ошибки
На этой картинке все прекрасно, особенно цвет холодильника. А какой пейзаж за окном! Правда, есть вопросы к внешнему виду кота. Он слишком маленький, на морде не хватает глаз. Зато на окне красуются еще два рыжика. Двери холодильника выглядят неправдоподобно: непонятно, сколько створок и как они открываются.
Большой холодильник стоит в светлой кухне около окна, рядом сидит пушистый рыже-белый кот, умывается
Кот не желает умываться, но зато на холодильнике появилась миска с едой
Нейросети нравятся красные стены и панорамное остекление дверей, а вот с масштабом беда. Холодильник уменьшился до размеров кота, на дверце появилась решетка, которой там быть не может. Кот не умывается, а просто сидит. Левый глаз выглядит странно — он красный и больше правого.
Большой белый холодильник стоит в светлой кухне c деревянным гарнитуром, рядом с холодильником окно, перед холодильником сидит рыжий кот, умывается. Картинка в стиле Ван Гога, высочайшее качество
Программа решила, что рыжик скучает, поэтому добавила ему друга
В третьей версии картинки нейросеть допустила сразу две грубые ошибки: потеряла холодильник и не нарисовала кухонный гарнитур. Зато вместо них на картинке возник еще один кот. Сложно сказать, умывается он или строение тела такое — животное под окном не очень похоже на настоящее. От Ван Гога на арте только цветовая гамма и подсолнухи.
Мир вокруг становится в 10 раз тише
Качество и детализация арта впечатляют
Красиво, но непонятно, что это за блестящий шар посреди леса. Возможно, это метафора или скрытое послание от искусственного интеллекта. Похвалим Deep Dream Generator за креативность и композицию.
Что в итоге: какая нейросеть справилась с заданием лучше
У всех нейросетей из нашего теста есть проблемы с изображением деталей: то морда кота какая-то странная, то дверцы холодильника разной ширины, то руки выглядят по-инопланетному. Есть сложности и с пропорциями предметов. Например, у Kandinsky 2.1 получился неправдоподобно большой кот, а у Deep Dream Generator, наоборот, крохотный. С абстракциями лучше всего справились Шедеврум, DALL-e, Bing Image Creator и Deep Dream Generation.
Мы выбрали такую тройку победителей:
На первом месте сервис — Bing Image Creator. У него получились самые правдоподобные коты и холодильники, да и стиль Ван Гога программа передала хорошо. Нейросеть поняла смысл трех базовых запросов без дополнительных уточнений, создала атмосферный арт для абстрактного задания.
Нейросеть нарисовала лучших котов с нужным количеством лап и хвостов
На второе место ставим Midjourney. Этот сервис выбрал интересный ракурс для первой иллюстрации, выдал картинки хорошего качества в остальных случаях. Были неточности в деталях — лишние ручки у мебели и техники, хвосты у котов. Чтобы их избежать, нужно научиться правильно общаться с нейросетью — писать более подробные и точные запросы, добавлять референсы. При таком подходе программа с большей вероятностью справится с задачей.
Этот сервис хорошо справился с первой задачкой, но допустил небольшие ошибки в остальных
Третье место отдаем сервису Deep Dream Generator. Красный холодильник и пейзаж покорили нас. Арты яркие, с интересными деталями — их хочется рассматривать. Правда, огрехи тоже есть — например, проблемы с масштабом и строением котов.
Программа порадовала яркими артами, но учла не все нюансы заданий: нарисовала лишнего кота и забыла о холодильнике
Наш эксперимент показал, что нейросети понимают простые фразы, но ошибаются в деталях. Если хотите получить картинку точь-в-точь как в промте, добавляйте в описание ключевые слова, используйте подсказки сервисов — модификаторы, пробуйте запросы разной длины.
Даже по четырем картинкам видно, что у каждой нейросети есть свой стиль и свои фишки. Пользуетесь ли вы сервисами генерации изображений и какой вам больше нравится?
Напишите, что вы думаете, или поделитесь своим опытом.
Чтобы оставить комментарий, нужно зайти в личный кабинет, у журнала и Ситилинка он общий.