Уже полгода мы в «Михайлов и Партнёры» используем нейрогенерации как основной инструмент иллюстрирования контента у себя на сайте и в Telegram-канале. Мы обучили генеративную нейросеть на контенте со своим фирменным стилем. Теперь она умеет создавать почти идеальные изображения, соответствующие требованиям нашего брендбука. Затрачиваемое на создание визуального контента время сократилось в несколько раз, а с дизайнеров снята «головная боль» по созданию рутинных иллюстраций. Дизайнер по-прежнему вовлечен в процесс, но в качестве куратора.
Визуалы получаются очень яркие, «живые», и, что самое главное, в нашем уникальном стиле.
Создание одного такого визуала занимает примерно 5 минут времени промпт-инженера и 5 минут дизайнера (20 минут, если это анимация). Как мы это сделали — расскажем в этом кейсе.
Благодаря этому и последующим проектам в области создания изображений с фирменным стилем при помощи нейросетей мы разработали новый продукт. Его рабочее название — «Книга промптов». Это большой документ со специально созданными под различные задачи клиентов промпт-запросамы. То есть по сути кастомные шаблоны промптов, позволяющие генерировать иллюстрации и другие изображения для соцсетей, Telegram, внутренних коммуникаций и других повседневных несложных коммуникационных задач. Клиенту остается только вставить, что именно он хочет видеть на изображении, и нейросеть сразу же выдаст визуал в его уникальной стилистике.
Этот продукт мы уже разработали для нескольких наших постоянных партнеров. Если вы тоже его хотите – пишите в Telegram нашему руководителю службы маркетинга Виктору Чукову @vchukov. Ну или на почту tenders@m-p.ru
С чего все началось
В сентябре прошлого года к 30-летию «Михайлов и Партнёры» наши коллеги из МиП Дизайн представили новую айдентику компании (о ней отдельный кейс).
На ее основе решили протестировать возможность потокового создания генеративных иллюстраций. Одно дело — генерить любой запрос в плюс-минус одной стилистике. Другое — следовать гайдлайнам и фактурному визуальному стилю МиП.
В качестве основной платформы генерации визуального контента мы выбрали нейросеть Midjourney. В данный момент для наших задач она наиболее удобна и выдает изображения оптимального качества.
Сама айдентика МиП и ее визуальные приемы вдохновлены ризографией — техникой печати, где слой за слоем формируется конечное изображение. Поэтому в наших иллюстрациях необходимо создавать эффект наложения геометричных форм и элементов друг на друга с текстурой, имитирующей ризографию.
«Основная задача, поставленная передо мной как промпт-инженером в этом кейсе — разработать единый базовый промпт с основными чертами фирменного стиля компании. Этот промпт должен использоваться для генерации иллюстраций, сопровождающих весь внешний контент МиП. Проще говоря, надо было создать такой промпт, который бы генерировал картинки, максимально соответствующие фирменному стилю МиП — набору и сочетанию цветов, паттернам и текстурам».
Лина Кочетова, промпт-инженер МиП
Шаг №1. Выбираем нейросеть
Как известно, нейросети обладают собственными алгоритмами обучения и уникальным пониманием запросов. Все три основных гиганта картиночных генераций, безусловно, имеют схожее понимание запроса, но для каждой нужен собственный подход. Поэтому сперва мы определялись, в какой нейросети будем генерировать картинки.
От Dall-e отказались в самом начале. Ее результаты в основном не отвечали нужному запросу, а на время начала проекта Dall-e 3 еще не было. Stable Diffusion XL оставили на скамейке запасных. Задумывалось, что если не получится с составлением промпта, то обратимся к Stable за обучением на наших готовых изображениях айдентики.
Midjourney стал основным инструментом в этой задаче. Еще были мысли и об Adobe Firefly, но после нескольких тестов нейросеть не смогла дать нужную реалистичность картинки.
Проект реализовывался летом 2023 года, и с тех пор другие нейросети также стали выглядеть более перспективно.
Шаг №2. Определяем цветовую палитру
Важным акцентом всей айдентики было смешение основных цветов: розового, красного, синего, белого и фиолетового. Они переходят друг через друга с помощью градиента и наложения. Выглядит очень красиво и гармонично. Но научить нейросеть их правильно сочетать – задача непростая. Все эти детали были вписаны в предварительный запрос.
Шаг №3. Проводим первые тесты
Чтобы не усложнять задачу созданием промпта с нуля, основное изображение с айдентикой было отправлено в функцию Describe. Время от времени эта штука может подсказать некоторые интересные токены, основываясь на оригинальной картинке. В этот раз, конечно же, это не помогло. Пригодились разве что названия цветов, но они были и так очевидны.
Шаг №4. Передаем стиль потертости и ризографа
Пожалуй, самый важный момент: сделать так, чтобы изображение передавало ощущение потертой бумаги, точек и градиента. Началось тестирование того, может ли нейросеть воспроизвести такой стиль. По простому промпту Paper Noise texture grainy paper pattern a purple and pink получаем эффект, больше похожий на человеческую кожу. Но на изображении уже появился рельеф, поэтому результат можно считать удовлетворительным. Дорабатываем запрос токеном ризограф и присвоением токену Paper Noise texture веса 3 для более заметного эффекта. Уже лучше!
Шаг №5. Создаем стиль плаката
Строение всей генерации должно отражать стилистику плаката с современными иллюстрациями. Чтобы добиться этого, нужно было сразу добавить в запросы стандартные токены: плакат, графический дизайн, современная иллюстрация, геометрия, наложение. Поскольку определенная стилизация у оригинальной айдентики присутствовала, то на помощь пришли несколько ярких референсов, которые были дружно отправлены на разбор нейросети через Describe.
Оказалось, что понимание Midjourney оставляет желать лучшего, но в этот раз было предложено несколько имен знаменитых иллюстраторов, что навело на мысль поискать авторов в такой стилистике и добавить их к основному запросу. Методом перебора по именам и стилям удалось выяснить ближайших к нам по тону и типу авторов. Это оказался Memphis design, придуманный итальянской дизайнерской и архитектурной группой Memphis Milano, и английский художник, иллюстратор XX века Ivan Chermayeff. Смесь их имен в запросе начала выдавать нужный консистентный результат.
Шаг №6. Получаем первые пригодные результаты
Собрав все подобранные токены воедино и расставив их по важности, пытаемся создавать первые изображения. Получился такой запрос: modern illustration of {a man speaking through a megaphone} in style creative poster, typography paper risograph, Paper texture Noise grainy paper pattern, by Ivan Chermayeff, 4 colour: paper beige, red, purple, dark purple, bold graphic pattern, Memphis design.
Что имеем на картинке: нужные нам цвета, но не в тех оттенках, также не хватает объема и большей геометрии. Из плюсов: ощущение бумаги проявилось, но все еще недостаточно.
Шаг №7. Дорабатываем запрос
Чтобы генеративное изображение больше походило на айдентику, отправляемся в любимые базы токенов. Наш промпт-инженер использует несколько – на гитхабе и на сайте, посвященном Midjourney. Уже знакомым методом перебора подбираются необычные токены, которые меняют изображение к лучшему: multi-overlay, intentional primitivism, layered textures, shapes, bold block prints, neue sachlichkeit, bold graphic pattern, mage noise, neo-concrete art.
Соединяем с первоначальным запросом, перемещаем названия оттенков поближе к началу, отключаем гладкость для уверенного эффекта бумажной текстуры и, наконец-то, получаем подходящую стилистику: modern geometric multi-overlay illustration of a pink, purple, red, and white man in a jacket enters the meeting room, in style creative poster, typography paper risograph, Paper Noise texture::3 Noise grainy paper pattern, intentional primitivism, layered textures, shapes, bold block prints, neue sachlichkeit, by Ivan Chermayeff, bold graphic pattern, Memphis design, image noise, neo-concrete art –no even smooth texture, smoothness –ar 3:2.
Шаг №8. Делаем выводы
Процесс воссоздания айдентики занял около 25 часов. Из них большая часть ушла на перебор всевозможных токенов со стилистиками и авторами. Заменить эти этапы с использованием вспомогательных сайтов для генерации промптов оказалось довольно сложной задачей. Даже сама Midjourney, после множества попыток, с трудом определяла, как воспроизвести оригинальную айдентику.
Наш промпт-инженер Лина говорит, что это была одна из самых интересных задач за весь опыт работы с визуальными генеративными нейросетями. Воссоздание крепкого и стильного дизайна показалось головоломкой с перспективной проекцией. Правильно подобранные токены смогли собраться в нужную картинку словно стороны кубика-рубика. В результате получились довольно эффектные изображения, которые хорошо вписываются в общую концепцию, а алгоритмы нейросети добавили необычности к общей тональности.
Что дальше?
Благодаря этому и последующим проектам в области создания изображений с фирменным стилем при помощи нейросетей мы разработали новый продукт. Его рабочее название — «Книга промптов». Это большой документ со специально созданными под различные задачи клиентов промпт-запросами. То есть по сути кастомные шаблоны промптов, позволяющие генерировать иллюстрации и другие изображения для соцсетей, Telegram, внутренних коммуникаций и других повседневных несложных коммуникационных задач. Клиенту остается только вставить, что именно он хочет видеть на изображении, и нейросеть сразу же выдаст визуал в его уникальной стилистике.
Этот продукт мы уже разработали для нескольких наших постоянных партнеров. Если вы тоже его хотите – пишите в Telegram нашему руководителю службы маркетинга Виктору Чукову @vchukov. Ну или на почту tenders@m-p.ru