Как (не) сгенерировать нейроарт за 1 минуту
Многие видели множество примеров чудесного нейроарта, с сочными цветами, отличной детализацией и интересным дизайном персонажей (включая фурри), здесь, на любимом реакторе.
Но когда смотришь подборки нейроарта паками, начинаешь замечать некоторую шаблонность:
1. Персонаж часто стоит в полу/полный рост в кадре, строго на переднем фоне, строго по середине.
2. Персонаж обычно имеет нейтральное или "игривое" выражение лица.
3. "Руки" персонажа или в нейтральной позиции или держат какой то предмет.
4. Персонаж всегда смотрит на "зрителя".
5. Задний фон не имеет никакой ценности - он или размыт или заполнен чем получится (в лучшем случае это будет пейзаж или будет использована лора для создания толпы).
Я не умоляю заслуг тех кто потратил время и силы и сгерировал данные изображения - пожалуйста продолжайте в том же духе (я - дерьмовый нейронщик и большую часть своих работ отправляю в корзину).
В 2023 существует несколько инструментов которые позволяют не просто делать бесконечные паки с портретами персонажей, а реализовывать целые сюжеты, так же как это сделал художник в классическом понимании этого слова.
Правда это намного сложнее чем кажется и чаще всего ничего кроме фрустрации чувствовать вы не будете.
К тому же результат скорее всего окажется среднего или низкого качества по сравнению со священным, простым и предпочтительным путем которым является подгонка промта, набора лор/ликорисов и текстуальных инверсий (боже храни masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shaded - даже если половина из этого не делает ничего).
Если у вас все выходит и без выкрутасов ниже - вы очень удачливый и скорее всего настоящий мастер нейрогенерации, надеюсь у вас есть канал на ютубе и приватный дискорд с курсами, пожалуйста киньте мне ссылку в комментариях.
Начну с того, что так же как классический художник должен делать стадики, учить анатомию и разные виды проекций, не забывая рисовать в любое свободное время, так и нейронщик должен делать ровным счетом тоже самое и извлекать опыт даже же из дерьмовых работ. Разница лишь в том что нейронщик может ошибаться быстрее.
Название/тема нейроарта - "Корпоратив"
Условия - несколько персонажей в кадре в разных позах, взаимодействие персонажей, общая идея (сюжет) изображенного.
Это будет странно, но когда я думаю о корпоративах единственный образ который у меня возникает в голове Stańczyk (он же "Шут в красном"). Почему бы не использовать это как референс? Нам лишь надо придумать как обыграть дополнительных персонажей и создать хоть какое то слабое подобие конфликта происходящего на холсте шедевра на который мы ссылаемся.
Пусть наша вариация шута в красном будет также в полном отрешении от вечеринки (корпоратива) происходящего вокруг него. Пусть для контраста с ним в комнате будет кто-то еще кто дух безудержного веселья поддерживает целиком и полностью и как бы противопоставляет его персонажу слева.
Мое грубое приближение этого описания вышло таким
В ретроспективе это было ошибкой - нужно было использовать latent couple и объединить 2 (пара празднующих) и 3 (кухня как задний фон) просто поделив изображение на две зоны и создав два подзапроса через AND. Возможно бы тогда даже вышло inpaintнуть всего шута или разбить на 3 зоны вместо двух и добавить еще один подзапрос. Но я решил что 3 отдельных изображения будет легче контролировать, ведь всё слепить на одном холсте в редакторе и потом заапскейлить не составит труда. Я ошибся и я признаю это.
Технические детали и процесс.
Модель - yiffymix v34
Семлер DPM++ 2M Karras, 50 шагов
Первое изображение "шута" далось довольно легко.
2 control net unit:
1. Изображение шута кропнул и загнал в препроцессор openpose_hands - с "сидеть" проблем не было, а вот в районе пальцев вышло месило, удалил их, создал болванки и переделал вручную, заняло минут 10 - 15.
2. Reference, сила 0.45, balanced, тот же кропнутый шут что и в первом юните.
Результаты почти сразу вышли +- приличными Промт позитивный: uploaded on e621, 1girl, solo, female fox, office lady, white body, white fur, ((black long hair)), ((red blouse)), spread legs, dark red thighhighs, zettai ryouiki, black shoes, high heels, fluffy tail, ((sad)), sitting, wooden brown chair, small breasts, cleavage, (((simple background))), masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shaded
Промт отрицательный: deformityv6, bwu, boring_e621_v4, multiple tails, blur, depth of field
(первые три это текстуальные инверсии).
Второе изображение "празнующие" было еще проще поскольку тут хватило промта, я потратил некоторое время на различные комбинации лор для поцелуя, потому что бедные никак не попадали друг другу в рот, но в итоге лучшие версии вышли без них просто через сотню мусорных изображений.
Промт позитивный: uploaded on e621, 2girl, ((female furry fox)), standing, full body, yuri, side view, looking at each other, kissing, french kiss, braid, couple, office lady, white shirt, red skirt, santa hat, claws, detailed fluffy fur, neck tuft, ((barefoot)), cleavage, groping, (((simple background))), masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shaded, no humans
Промт негативный: deformityv6, bwu, boring_e621_v4, multiple tails, blur, depth of field, human, human ears
Изображение три: долгая и мучительная подборка промта, попытки использования других моделей для интерьеров, я так с ним замучился что даже не сохранил промты.Модель упорно рисовала каких то людей, фурей, химер - они пили кофе, сидели в венчике из гирлянд, везде были раковины и какие то артефак так что никакой инпейт или удаление не помог бы.Таким образом имея 3 картинки в своих мерзких человеческих руках я пошел совершать военное преступление и объединять это все в photopea.
Даже неискушённый может указать на сколько плохо это получилось.
Пара выглядело плоско, они стояли не под тем углом, на них неправильно падал свет, единственный их плюс была не такая отвратительная обводка как у шута, заинпейтинная шапка тоже была ни туда ни сюда, задник не сочетался с персонажами... Вероятно в этот момент нужно было отправить все в корзину и начать за нового уже с latent couple, да чёрт с ним пусть будет 4 под запроса еще и шапку через зону сделаем!
Но я решил продолжить и выставив denoising streight где то в районе 0.5 принял волевое решение использовать oil medium, oil painiting в img2img с ultimate upscale s/d скриптом в надежде что ну вот щас изображение побьется по плиточкам, каждая плиточка апскельнится, применится новый стиль и все само станет хорошо и все сразу впишется. В реальности такого не произошло и пришлось около 3х часов делать различные варианты такого апскейла и руками править артефакты постоянно то добавляя то удаляя стиль художников и насилуя denoising streight полнузок.
Апскейл тайлами упорно ничего не делал где хотелось бы, изменял или перевирал детали, но отступать было уже не куда.
Где то 2 часу страданий я понял что пара в дальнем углу всегда будет выглядеть неверно с точки зрения перспективы чтобы я не делал, поэтому я подвинул их в ближний угол, это не слишком уж помогло но имело хоть какой то эффект на общую композицию.
Что по итогу?
Довольно странная картинка которую можно было сделать намного легче.
(хотя я всё ещё считаю что фотобаш и img2img работают довольно эффективно если применены прямыми руками).
Мне довольно стыдно за качество этой работы, но не жаль потраченного времени.
Это дерьмовый арт, но это все равно мой "Деловой (нейро) стиль - Корпоратив"
Подробнее
длиннопост,нейросетевые фурри,сгенерировал сам,фэндомы,нейроарт,нейронные сети,furry f,furry art,furry,фурри,furry fox,furry canine,furry mammal,furotica,фурротика,нейроарт с исходниками
а парочка получилась криво-косо уже из-за твоей вставки, надо было масштабировать нормально
Насчет диалоговых нейронок - есть плагин multidiffusion-upscaler, а конкретно раздел regional propmt control но опять же, я тупой и просто не понимаю как он работает - вместо того, что бы генерировать условные части тела условной лисице он почему то генерирует ей маленьких лисиц,хотя в его промте прописаны уши.
Поэтому пользуюсь исключительно дефолтным промтом.
Кстати, изучая чужие промты я заметил что большинство просто игнорируют положение наблюдателя (ну или камеры) предпочитая оставлять выбор нейронке, максимум поворачивая объект в кадре. Как бы камера (наблюдатель) - это тоже участник композиции и от его положения может зависить восприятие (а так же итоговый набор тегов в посте, если камера расположена под правильным углом :))
И еще работа со светом тоже часто игнорируется. Элементарное расположение, цвет и мощность источника света может здорово изменить весь арт.
Тело объекта (если мы говорим про фуротику) тоже не должно оставаться без внимания. Промт позволяет тонко настроить размеры тела под любой вкус, мех красится, ему можно придать пушистость или грубость, он может отражать свет. Уши можно поворачивать, сделать их прижатыми например. Руки можно удачно положить на колени, бедра, грудь, шею и голову, причем если повезет то можно прописать и сгенерировать положения отдельно для каждой руки.
Поворот объекта в кадре тоже не ограничивается тремя положениями перед/бок/зад есть еще повороты две трети и три четверти а так же их задние производные. При генерации позы важно учитывать какие обьекты нейронка будет прорисовывать - например если вы хотите дакимакуру со скайлар зеро то необходимо убрать из промта любые упоминания пейзажей, неба и строений, остается только то на чем она лежит, игаче она у вас будет лежать только на боку. Саму позу тоже можно тонко настраивать промтом, указывая положения ног, коленей и рук, так же есть отличия между лежанием на спине и сидением откинувшись назад - в первом случае руки свободны, во втором они всегда будут опорой и будут иметь определенное положение.
Также важно помнить про соотношение сторон экрана. Если персонаж должен стоять в полный рост от макушки до пяток то очевидно, что в картинку 3:4 он просто не впишется или будет стоять в отдалении.
Это здорово, что есть инструменты и у кого то они работают, я же в силу своей тупости вынужден ебаться исключительно с промтом и то далеко не всегда получается то что хочу.