Гид по нейронным сетям для дизайнеров и не только
Рассмотрим инструменты для решения рабочих задач наглядно с примерами
Введение
Материал рассказывает о нейросетях с низким порогом вхождения, которые полезны для дизайнерских и художественных задач, включая:
- Генерацию изображений (референсы, концепты);
- Работу с готовыми изображениями (доработка, масштабирование и т.д.);
- Создание видео/анимаций;
- Дизайн (интерфейсы, мокапы).
Также даются советы по формулировке запросов и рекомендации по использованию нейросетей с учётом их особенностей.
Знакомство
Для базового понимания нейросетей можно изучить бесплатный курс от Т—Ж. В нём рассказывается, что такое нейросети, на каких принципах они работают и как формулировать запросы эффективно. В курсе рассматриваются текстовая нейросеть ChatGPT (бесплатно) и графическая — Midjourney (бесплатно 25 картинок в день).
Полный курс занимает 3,5 часа, но для работы с изображениями достаточно изучить Введение, а также 1, 9 и 10 уроки (всего 1,5 часа).
Запросы
Всё общение с нейросетями происходит через промты (запросы) и их развитие в диалоге. Качество генераций и то, насколько они оправдают ожидания, зависит именно от них. Лучше всего формулировать запросы на английском языке.
Промт (или запрос) в контексте генерации контента — это текстовое описание или инструкция, направляющая модель на создание конкретного результата. Цель промта — максимально точно и детально объяснить, какой результат ожидается.
При формулировании запроса стоит придерживаться следующего плана: цель + задача + контекст и детали + ограничения.
Пример запроса: "напиши мне промт (задача) на английском языке (ограничение) для генерации реалистичного изображения (цель) с четырьмя бегущими солдатами с оружием в шлемах и в дыму (контекст и детали)".
Лайфхаки по написанию
Дополнительный способ получения промта — закинуть в любую графическую нейросеть изображение-референс, которое она разобьет на ключевые слова. Так можно понять, как нейросеть видит такое изображение.
Image AI — нейросети, которые могут генерировать изображение по запросу
Krea.AI
Инструмент — Flux
Хорошая альтернатива популярной нейросети Midjourney, которая вышла недавно и доступна бесплатно и без ограничений (на данный момент). Генерирует фотореалистичные изображения в формате 1024x1024, есть возможность масштабирования (Enhance).
В режиме подписки открывается коммерческая лицензия на генерации и возможность их скрытия от сообщества.
Инструмент — Logo Illusions
Небольшой инструмент для генерации изображений, основанных на одной иконке или символе с белым фоном. Хорошо смотрится издалека в небольшом разрешении.
Полезен для генерации изображений определённой формы, можно использовать в соцсетях, обложках чатов, брендинге.
Midjourney
Инструмент — Text To Image
Нейросеть для генерации изображений на основе текстовых описаний с добавлением изображений-референсов. Она пользуется большой популярностью благодаря высокому качеству и художественности созданных изображений.
В настоящее время открыта для бесплатного доступа. Ранее работа в ней велась только через Discord-сервера, но теперь выпущена удобная веб-версия для генераций и просмотра библиотек.
Подписки начинаются от 10 долларов. На стандартном плане открывается коммерческая лицензия на генерации, а на Pro-плане доступна скрытая генерация (без отображения в общих библиотеках).
Также есть YouTube-канал с полезной информацией о нейросети.
DreamStudio
Инструмент — Text / Image To Image
Нейросеть использует Stable Diffusion как движок для генерации изображений и имеет удобные инструменты для работы, включая управление параметрами. Изображения генерируются за кредиты (10 долларов = 5 тысяч изображений), они не общедоступны и имеют некоммерческую лицензию. Качество изображений не превышает 1500 пикселей по ширине.
Работа с этой нейросетью хорошо решает задачу создания референсов и концептов, но не готовых изображений.
Нейросеть хорошо работает с основой в виде изображения, превращая цвета, атмосферу и силуэты в реалистичные фигуры.
Dzine AI
Инструмент — Image to Image.
Нейросеть позволяет загрузить скетч любого качества и на его основе создать генерацию. Отлично подходит для быстрого создания референсов по композиции, атмосфере и позам. Желательно прописывать промт, чтобы нейросеть лучше уловила ход мыслей и учла нюансы (например, цветовые пожелания).
Доступен импорт PSD-файлов.
Минус нейросети — в ней нельзя рисовать. Понадобится дополнительный графический редактор для рисования или ручка с чистым листом бумаги (она воспринимает клетку как линии).
Dzine условно бесплатная (7 картинок в день) и недорогая (10–60 долларов в месяц) для безлимитных генераций. Выгружать изображения не рекомендуется, так как это тратит кредиты — лучше делать это через PrtSc.
В режиме подписки доступна коммерческая лицензия на генерации, и они будут скрыты от всех в сообществе.
Invoke
Это профессиональная нейронная сеть, заточенная на работу арт-отдела. Все действия и выстраиваемые процессы в ней распространяются на всех участников пространства. В чём её преимущества:
Гайдлайны
Можно задать определённые требования к артам по цветам, формам и качеству для поддержания их консистентности. Таким образом, вся команда будет генерировать арты с заданным профилем.
Кастомные модели
Нейросеть можно «обучать» на существующих артах, чтобы на их основе создавать новые генерации.
Контроль над генерацией
Работа по слоям и элементам, использование референсов для генерации конкретных объектов.
Права
Генерации скрыты от других и имеют коммерческую лицензию. Invoke не обладает на них никакими правами.
Бесплатных генераций у нейросети нет, но для организаций можно запросить демо-версию. Это отличная возможность опробовать её на своём проекте с коллегами. Выглядит многообещающе.
Design AI — нейросети, которые помогают в работе с готовыми изображениями, мокапами, сайтами и удобны для быстрых задач по редактированию
Recraft
Нейро-доска, предоставляющая все необходимые инструменты в одном пространстве. Интерфейс похож на Miro, можно работать совместно с коллегами (только в платной версии для команд), создавать несколько досок для разных проектов или типов задач. Возможности:
Удаление фона изображения:
Ресайз изображений:
Удаление деталей изображения:
Генерация изображений:
Генерация мокапов:
И все это в рамках одной доски:
В бесплатной версии генерации новых изображений (за исключением таких инструментов, как ресайз, мокап, удаление фона и т.д.) общедоступны и отображаются в библиотеке, но нет ограничений на количество действий. В платной версии (от 20 долларов в месяц) генерации скрыты от других.
Framer AI
Быстрая генерация лендингов (менее минуты) сразу под несколько разрешений с заданной тематикой. Удобное редактирование элементов, настройка сеток, выбор цветов и шрифтов. Можно настраивать локализацию и публиковать сайт. Выглядит как более удобная и продвинутая альтернатива Tilda.
Хорошо подходит в качестве сайта-портфолио — после публикации ссылка доступна другим людям, и всё это бесплатно на домене framer.ai с аналитикой. Если нужна большая аудитория и видимость в поисковых системах, подписки начинаются от 5 €.
Нейросеть также может помочь с вдохновением для верстки, палитр и шрифтовых пар.
Дополнительные инструменты — упрощённые нейросети, которые выполняют одно конкретное действие
Не нужна регистрация, нет требований к правам и лицензиям.
Upscaler
Удобный и быстрый способ увеличить разрешение изображения на 200% (2k) или 400% (4k). Подписка необходима, если требуется повысить качество изображения до 16k.
Remover
Быстрое удаление деталей с изображения разрешением до 3k.
AI for Video - нейросети для работы с видео
Runway
Инструмент — Text / Image To Video
Позволяет создать видео или оживить готовое изображение через текстовый запрос. Длительность видео — от 4 до 10 секунд. Полезен для задач, требующих небольших анимаций, GIF-изображений или движущихся задних планов.
Части изображения можно выделять кистью, что позволяет задать разные виды анимаций и плановость. Например: розовая кисть — движение вправо, зелёная — влево, синяя — дрожание/шум.
Примеры работ с готовыми изображениями:
Результат анимации — один слой арта.
Результат анимации — мужчины и фон на разных слоях.
В бесплатной версии доступно урезанное качество с водяным знако��. Генерация одной итерации занимает более 10 секунд. Для лучшего результата стоит разбивать объекты на разные слои, так как нейросеть не может оставить некоторые объекты неподвижными. Результат Runway можно совмещать с неподвижными слоями в видео-редакторе (например, в After Effects).
По сравнению с After Effects, этот инструмент позволяет решать задачи быстро и просто, добавляя больше естественности. Например, он хорошо работает с освещением, бликами на поверхностях и «дорисовыванием» объектов.
Тарифы начинаются от 15 долларов в месяц и влияют на качество и длительность видео.
Все генерации подходят под коммерческую лицензию, Runway не обладает правами на них, и они скрыты от других пользователей.
Больше примеров работы нейросети можно найти в этом видео.
Vidu AI
Инструмент — Text / Image To Video
Аналог нейросети Runway с более упрощёнными инструментами. В бесплатной версии доступна генерация видео длиной 4 секунды, подписки с коммерческой лицензией начинаются от 10 долларов в месяц.
Из удобного:
- Можно делиться ссылкой на сгенерированное видео.
- Чем проще запрос, тем качественнее получается генерация.
- При генерации из текста можно выбрать стилистику General (реализм) и Animation (2D/Anime).
Пример анимации в стилистике General на основе изображения.
Пример анимации в стилистике Animation на основе текста.
Итого
Все текущие нейросети хорошо работают с казуальными изображениями, но сложнее с реалистичными и требуют дополнительной доработки руками опытного художника, если их планируется использовать в продакшене. Для удобства работы можно применять нейросети для создания референсов, пожеланий к техническому заданию, обсуждения видений, улучшений и обработки существующих изображений.
В данном документе не рассматривалась популярная Stable Diffusion, так как у неё высокий порог вхождения: она требует мощного ПК и значительного времени для изучения. Для тех, кому она интересна, есть хорошая статья.
Такие нейросети, как Dzine, Recraft, Runway и Krea, имеют в своём арсенале множество инструментов, которые не были упомянуты в этом документе. Это связано с тем, что они не прошли проверку на адекватность, и было непонятно, как их можно использовать в рабочих задачах. Многие нейросети работают "для фана", чтобы генерировать что-то красивое, а не для решения задач. Однако это можно проверить самостоятельно и, возможно, найти что-то интересное.
Удачи!
Изучала нейросети и написала статью UX/UI-дизайнер Astrum Entertainment Настя Фильченко.