Раз уж пошла такая свистопляска то я тоже поделюсь концентрацией своего двухмесячного опыта в генерации собак.
Это руководство для тех, кто поставил себе Stable diffusion и хочет разобраться в построении промта, а так же узнать "почему вон у того чувака такие красивые собаки а у меня какая то херня?". Предполагается наличие базовых знаний интерфейса.
Не претендую на истину в последней инстанции, просто показываю как это делаю я (и да, я управляю только промтом. Не считая ADetailer и Hires.fix. Я прост тупой, не смог разобраться как пользоваться другими инструментами :) хотя если их освоить то можно добиться куда лучших результатов и тратить меньше времени). Поехали.
Все ресурсы были взяты с Civitai.com
Все ключевые слова либо подобраны самостоятельно, либо подсмотрены в чужих промтах, либо взяты из тегов e621.
Прежде всего расскажу про модели, которыми пользуюсь:
- Omega mix: с этого начинал. Отличная модель, при отрисовке склоняется ближе к мультяшной анимешности. К сожалению автор больше не развивает ее но я не теряю надежды на будущие обновления.
- Furryrock: более точная в отрисовке модель. Активная в поддержке, почти все свои картинки я генерировал на версии 6.0, недавно появилась версия 7.0
- BB95 Furry Mix: прекрасная модель, с невероятным диапазоном стилей прорисовки - от пиксаровской мультяшности до строго реализма. На ней я и буду показывать пример построения промта.
Запускаем webui-user.bat, входим в браузер, смотрим поле настроек генерации:
Sampling method: я буду использовать UniPC
Sampling steps: я буду использовать 75 шагов.
Width и Height: 600х800, портретный формат 3:4
CFG Scale: всегда использую 7 но рекомендую экспериментировать.
Начинаем прописывать промт.
(Напоминаю, что все параметры должны быть односложными и без отрицаний. Все параметры разделяются запятой, можно акцентировать внимание нейросети на конкретном параметре с помощью (скобок), ((двойных скобок)) и ((силы параметра)):0.1-1. Так же с помощью скобок можно объединять общие параметры в единый блок (например параметры, описывающие только лицо))
Я хочу сгенерировать одну маленькую стройную мохнатую девочку собачку.
a tiny slim furry girl ((dog)) solo
a tiny slim furry girl ((dog)) solo,posing,
Неплохо но выглядит как мальчик, давайте добавим женских деталей.a tiny slim furry girl ((dog)) solo,posing,choker,nude,small breasts,large nipples,
Теперь это точно девочка. Позиция рук рандомна, давайте положим их ей на бедра и заодно пропишем детали.
a tiny slim furry girl ((dog)) solo,posing,choker,nude,small breasts,large nipples,hands on hips,fingers,finger claws,
a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,small breasts,large nipples,hands on hips,fingers,finger claws,short hairstyle,fluffy detailed fur,
Отлично но нет экспрессии, это девочка просто позирует. Добавим настройки камеры.
low-level angle,close-up,a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,small breasts,large nipples,hands on hips,fingers,finger claws,short hairstyle,fluffy detailed fur,
Я знаю у такого ракурса есть любители :3
Сменим угол и посмотрим что получится.
Обратите внимание, несмотря на то, что мы прописали параметр short hairstyle, он не применился, прически нет. Давайте акцентируем внимание нейросети на нем.
high-level angle,close-up,a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,
Такое себе. Давайте добавим первую волшебную фразу.
high-level angle,close-up,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,
Оцените разницу самостоятельно.Добавим в негативное поле текстовые инверсии - это концентрат тегов, которые умещаются в небольших файлах, что бы не надо было их регулярно прописывать. Они запрещают нейронке рисовать в низком качестве, контролируют анатомические, физические и прочие ненормальности и мутации, не являясь однако панацеей. Гуглите названия в сети, все в свободном доступе.
high-level angle,close-up,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,
Negative prompt: bad-artist,boring_e621_v4,
Отлично. но самой картинке чего то не хватает. Антуража ей не хватает.
high-level angle,close-up,red sunset beach,clouds,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,
Negative prompt: bad-artist,boring_e621_v4,
Прекрасный закат, я люблю закаты и рассветы. Интересно, отличает ли их нейронка? Попробуйте поэкспериментировать сами.
Я хочу подвинуть девочку ближе к себе. Для этого я предпочитаю запрещать нейронке рисовать определенные части тела, отдаляющие объект в кадре из-за увеличения высоты.
high-level angle,close-up,red sunset beach,clouds,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,
Negative prompt: legs,knees,bad-artist,boring_e621_v4,
Работает, не всегда но работает. Но наша собака постоянно крутится, давайте повернем ее прямо. И раз уж она стоит прямо давайте придадим качества ее глазам и направим взгляд прямо на нас.
high-level angle,close-up,red sunset beach,clouds,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,front view,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,perfect shiny eyes,long eyelashes,looking at viewer,
Negative prompt: legs,knees,bad-artist,boring_e621_v4,
high-level angle,close-up,red sunset beach,clouds,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,front view,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,perfect shiny brown eyes,long eyelashes,looking at viewer,
Negative prompt: legs,knees,bad-artist,boring_e621_v4,
Width и Height: 900х1200, портретный формат 3:4
По красоте, но можно сделать еще лучше! Добавим лору освещения и напишем вторую волшебную фразу. Гуглите название в сети, все в свободном доступе.Кроме того есть инструмент ADetailer. Я использую его для прорисовки лиц. Пожалуй единственный инструмент который я активно использую из-за его простоты. Давайте включим его.
ADetailer - жмем галочку и в первой вкладке выбираем mediapipe_face_full, во второй mediapipe_face_mesh_eyes_only. Все
<lora:光影:1>,high-level angle,close-up,red sunset beach,clouds,cinematic lighting, bright lighting,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,front view,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((short hairstyle)):1,fluffy detailed fur,perfect shiny brown eyes,long eyelashes,looking at viewer,
Negative prompt: legs,knees,bad-artist,boring_e621_v4,
Как видите, дополнительное освещение делает магию. Но все это время у собаки отсутствовал один очень важный компонент - хвост! К тому же сохраняется проблема с волосами. Давайте отредактируем параметр, отвечающий за прическу. И пусть наша собака улыбается, Не бойтесь экспериментировать.<lora:光影:1>,high-level angle,close-up,red sunset beach,clouds,cinematic lighting, bright lighting,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,front view,posing,choker,nude,medium breasts,large nipples,hands on hips,fingers,finger claws,((long hairstyle)):1,fluffy detailed fur,perfect shiny brown eyes,happy smile,fangs,long eyelashes,short fluffy tail,looking at viewer,
Negative prompt: legs,knees,bad-artist,boring_e621_v4,
Указанные в начале поста модели умеют имитировать стиль художников без всякой дополнительной программной обвязки.
При добавлении ников художников в промт их стили смешиваются, давая порой совершенно уникальную прорисовку. Причем если добавлять одних и тех же художников но в разной последовательности, стиль может меняться. Без понятия, как это работает.
Помните фильм "Парфюмер" 2006 года? Мэтр Джузеппе Бальдини обучает молодого Гренуя азам смешения запахов для получения качественных ароматов. Здесь я вам покажу как я смешиваю стили разных художников на конкретном примере. Промт в картинках не меняется, только добавляются художники.
Помните, что добавление художника в промт неизбежно меняет генерацию, даже при условии использования конкретного сида.
Прежде идет основа, то что задаст всей картинке стиль. Я выберу красивый и очень сильный стиль ewgengster, он легко доминирует над остальными стилями, имитируя рисовку от руки.
art by ewgengster
Далее идет основа, тело рисунка. Буквально, я использую стили тех художников, в чьих рисунках тело прекрасно построено с точки зрения анатомии.Добавим wamudraws, этот стиль сделает линии и формы мягче, увеличит глаза, сделает общий стиль мультяшным.
art by ewgengster wamudraws
fluffkevlar напротив, уплотнит общую стилистику, придаст лицу строгость линий, улучшит анатомию.art by ewgengster wamudraws fluffkevlar
iskra прорисует мышцы, рельеф тела, добавит аккуратный плоский животик, придаст лицу симметричность и форму.art by ewgengster wamudraws fluffkevlar iskra
personalami покрасит все в своем неповторимом стиле, придаст лицу человечности, дополнительно улучшив освещение на теле.art by ewgengster wamudraws fluffkevlar iskra personalami
Дальше идет блок с полировкой. Здесь я применяю стили художников, чьи навыки в рисовании мелких деталей вроде шерсти или чешуи, волос или детального заднего плана достигают совершенства.art by ewgengster wamudraws fluffkevlar iskra personalami honovy hioshiru foxovh
"И дополнительная нота, один финальный штрих, который будет царить над всеми прочими!"silverfox5213 добавит мультяшности и пушистости, улучшит прорисовку волосам, повысит детализацию глаз.
art by ewgengster wamudraws fluffkevlar iskra personalami honovy hioshiru foxovh silverfox5213
Круто? Мне нравится. Пишите свое мнение в комментах.
Эта картинка была не только сгенерирована в разрешении 900х1200, она была проапскейлена при помощи дефолтного инструмента Hires.fix, вот его параметры:
Upscaler: 4x-UltraSharp
Denoising strength: 0.1
Upscale by: 1.5 (выходное разрешение 1350х1800)
Итоговый промт:<lora:光影:1>,high-level angle,close-up,red sunset beach,clouds,cinematic lighting, bright lighting,art by ewgengster wamudraws fluffkevlar iskra personalami honovy hioshiru foxovh silverfox5213,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,front view,posing,choker,nude,small breasts,large nipples,hands on hips,fingers,finger claws,((long hairstyle)):1,fluffy detailed fur,perfect shiny brown eyes,happy smile,fangs,long eyelashes,short fluffy tail,looking at viewer,
Negative prompt: ,bad-artist,boring_e621_v4,
Steps: 75, Sampler: UniPC, CFG scale: 7, Seed: 3690777701, Size: 900x1200, Model hash: 2bb2c42192, Model: bb95FurryMix_v120, Denoising strength: 0.1, ADetailer model: mediapipe_face_full, ADetailer confidence: 0.3, ADetailer dilate/erode: 4, ADetailer mask blur: 4, ADetailer denoising strength: 0.4, ADetailer inpaint only masked: True, ADetailer inpaint padding: 32, ADetailer model 2nd: mediapipe_face_mesh_eyes_only, ADetailer confidence 2nd: 0.3, ADetailer dilate/erode 2nd: 4, ADetailer mask blur 2nd: 4, ADetailer denoising strength 2nd: 0.4, ADetailer inpaint only masked 2nd: True, ADetailer inpaint padding 2nd: 32, ADetailer version: 23.10.1, Hires upscale: 1.5, Hires upscaler: 4x-UltraSharp, Lora hashes: "光影: ae8ec1b28b09", TI hashes: "bad-artist: 2d356134903e, boring_e621_v4: f9b806505bc2", Version: 1.6.0
То что я выбрал именно этих художников не значит что работают только они, как и не означает того, что вы не можете сделать комбинацию длиннее или короче. Просто это моя любимая комбинация на данный момент, с ней я публикую свою лисичку в твиттере. Открывайте сетевые ресурсы, исследуйте стили художников и экспериментируйте с комбинациями ников, я показал вам лишь мизер возможностей.
И разумеется, что с этими комбинациями можно использовать лоры.
art by w4g4 skygracer AuranCreations Pakwan008 Bonifasko (промт тот же)
З.Ы. Самые внимательные наверное заметили, что в промте так то указан high-level angle, что соответствует наблюдению "сверху вниз", тогда как все картинки имеют прямой угол обзора, что соответствует medium-level angle. Попробуйте предположить, отчего так произошло и как это можно исправить.
Подробнее
VI/HlV ш. _ж. Шк \J
длиннопост,очень длиннопост,нейросетевые фурри,furotica,фурротика,furry,фурри,фэндомы,furry canine,furry art,furry dog,shiba inu,нагенерил сам,Stable diffusion,нейронные сети,руководство
небесполезно, благодарю
от себя добавлю:
0) есть хороший базовый гайд по промтам, https://aituts.com/stable-diffusion-prompts/, на аглицком
1) кроме круглых скобок, есть ещё [квадратные], работают так же но не повышают внимание модели к параметру, а понижают.
2) есть зависимость от положения параметров в промте, двигая набор параметров по промту можно менять генерацию, особенно важно когда это касается деталей.
SD оказывает больше внимания параметрам в начале промта, и параметры стоящие в конце иногда могут даже совсем проигнорироваться
3) у моделей могут быть разные теги которые они знают. и если пытаться модель заставить рисовать art by ewgengster, о котором она не в курсе то ничего не выйдет.
к действительно хорошим моделям идёт файлик со списком тегов (ключевых слов) на которых их обучали
4) использование режима txt2img это хороший старт для пользования SD, но всё таки советую постепенно переходить в img2img. вот неплохой видеос по теме
5) в img2img можно "перерисовывать" существующие картинки, например - https://furry.reactor.cc/post/5603601
6) или добавив туда понравившийся арт из секретных разделов и нажав кнопку "Interrogate DeepBooru" получит готовый промт, который с точки зрения нейросети, описывает картинку
и уже редактировать его, добавляя/удаляя параметры
7) можно использую режим inpaint перерисовывать только часть картники, например ТОЛЬКО пальцы (будь они прокляты), или только лицо.
полезно когда всё остальное устраивает, но вот 3 или 6 пальцев это явный перебор, или недобор. ну или только лицо.
8) в выпадающем списке Scripts есть такая очень полезная вещь как X/Y grid, позволяет рисовать таблицы на которых наглядно видно влияние того или иного парамера генерации на результат.
например можно указать несколько моделей и посмотреть какая на этом промте даст лучший результат, или как параметр CFG scale вам улушит картинку.
если поставить парочку расширений можно даже части промта визуально сравнивать.
9) удачи! :)
1) не понимаю зачем они нужны
2) дело не в этом, просто чем больше параметров тем сильнее нейросеть путается, но положение всегда можно спасти скобками и объединением параметров в блоки, главное не объединять параметры с разных частей тела, например уши и руки. Нейросеть качественно генерирует при использовании до 100 поинтов в счетчике промта. И даже так, если обратишь вниманине, в посте к финальной версии промта ряд параметров был не соблюден, например поза, взгляд, положение рук. Все это можно исправить скобками и силой параметра.
3) я писал про конкретные фурри модели, не про все.
4) я не использую референсы для генерации, img2img применяю исключительно для апскейла особо удачных картинок.
5) впечатляющий результат но это референс.
6) об этом даже не догадывался, что можно нейросеть попросить посмотреть картинку и выдать промтом то что она на ней видит. На днях полностью снес весь програмный обвес что бы заного поставить все в чистую, что бы завести у себя на компе kohya-ss для обучения lora в домашних условиях. Хочу собственную версию fixhand и попытаться сделать pretty paws, уже начал собирать датасет, этот совет с deepbooro кажется сильно упростит мне работу.
7) на днях меня обучили базовым приемам ретуши, пора мне отодвинуть в сторону убеждение что все должно быть исключительно результатом генерации.
8) выглядит малопонятно но я попробую разобраться.
9) ;3
8) вот например модель от денойзинга
http://clip2net.com/s/4jFuGbF
Дело в том, что несмотря на то что это продукт нейросети, эта картинка все равно подчиняется оптическим законам. Угол обзора объектива камеры (или глаз наблюдателя) не может охватить все указанные в промте параметры и при этом сохранить угол наклона.
Не получится одновременно снять шикарное закатное небо с облаками, мягкий песок пляжа и при этом всю девочку до колен, да еще сверху вниз и с близкого расстояния, чем то придется пожертвовать, в данном случае углом положения камеры и наличием небольшого искажения по типу fish-eye.
Но все можно исправить с помощью правильно подогнанных значений промта!)
<lora:光影:1>,high-level angle,close-up,red sunset light,beach,shiny sand,cinematic lighting, bright lighting,art by ewgengster wamudraws fluffkevlar iskra personalami honovy hioshiru foxovh silverfox5213,a beautiful and detailed portrait of a tiny slim furry girl ((shiba inu dog)) solo,two thirds view,posing,choker,nude,small breasts,large nipples,((hands on hips)),fingers,finger claws,((long hairstyle)):1,fluffy detailed fur,perfect shiny brown eyes,happy smile,fangs,long eyelashes,short fluffy tail,((looking at viewer)):1,
Negative prompt: sky,clouds,legs,knees,bad-artist,boring_e621_v4,
Теперь все как надо.
зачем ты ставишь :1 после скобок?
(скобки) увеличивают вес параметров в них умножая на 1.05
ставя 1 ты убираешь этот эффект, умножая на 1, т.е. оставляя без изменений
>Sampling steps: я буду использовать 75 шагов.
>Width и Height: 600х800, портретный формат 3:4
>прост тупой, не смог разобраться как пользоваться другими инструментами
Да и с этими тащемта тоже...
Семплер UniPC специально создан для того, чтобы делать удовлетворительные результаты за малое число шагов, к тому же, он нормально не работал например с Tiled Diffusion. Я уж не говорю про то, что больше шагов =/= лучше.
Размер по бОльшей стороне 800, когда все модели тренятся 768 максимум - это вообще победа.
Рендерю базовое изображение в 900х1200, апскейлю до 1350х1800. 75 шагов нашел для себя оптимальным, если меньше шагов то выше шанс мутаций, больше 75 разницы нет. Рендерить в 512х768 не вижу смысла, мелкие детали вроде глаз или шерсти превращаются в мыло, в сети полно примеров таких высокоскоростных рендеров.
Просто рукалицо. Все три модели, что ты упоминаешь не XL, а миксы, которые ВСЕ произрастают корнями либо из SD 1.5 у которой квадрат 512х512, либо из NAI, у которой квадрат 768х768.
А ещё меня очень улыбает, когда ты сначала пишешь про "портретный 3:4", при этом сам генеришь не портрет, а персонажа до середины бёдер и поэтому получаются разные наклонённые позы.
>выше шанс мутаций
Мутации (двойные персонажи, неестественно вытянутые тела и т.д.) у тебя как раз и произрастают из того, что ты заставляешь нейронку генерить базовую картинку в разрешении большем, чем она обучена. Она не умеет бить на тайлы без Tiled Diffusion, который вообще уже давно должен быть по умолчанию в UI от Аутоматика.
>мелкие детали вроде глаз или шерсти превращаются в мыло
Так а тебе и не надо в базе чтобы было сразу красиво. Ты просто делаешь батч из 6-10 картинок, выбираешь подхоящую по композиции *в целом* и уже тогда её по номеру сида гонишь через Hirez.fx либо апскейлишь с небольшим денойзом в img2img.
Ещё из советов: выкинь ADetailer нафиг, он меняет стиль на применяемых частях тела, а все косяки правь через инпеинт. Скачай любой энхансер деталей и подбирай нужную силу для своей модели, тогда и будет тебе красивый мех. Проштудируй хотя бы вики от Аутоматика, там много базовой инфы. Научись пользоваться BRAKE для разделения промпта.
Касательно инструментов и документации - интересно, попытаюсь изучить на досуге.
И в чем рука-лицо генерировать в 900*1200 если это выходное разрешение после Хайреза в 1,5 раза, если входное у него 600*800? Это конечно больше рекомендованных 512-768 в базе, но всё таки.
А во избежание дублирования вполне сойдет себе Regional Prompter, нужно ток правильно сделать.
Апскейл с денойзом через img2img для себя обрисовал как неудачный опыт, ибо видно склейки тайлов при апскейле х4, если подскажешь как пофиксить - будет круто.
>Это конечно больше рекомендованных 512-768 в базе, но всё таки.
Именно что больше.
>Апскейл с денойзом через img2img для себя обрисовал как неудачный опыт, ибо видно склейки тайлов при апскейле х4, если подскажешь как пофиксить - будет круто
Tiled Diffusion, качается из экстеншенов. Ну и х4 - это уже какой-то оверскейлинг, нафига тебе это? Ты там картинку на плакат во всю стену делаешь?
Просто я делаю 512*768, затем сразу хайрез делаю ибо видюха позволяет, после отбор и затем делаю апскейл того что понравилось.
И в чем неправильность такого подхода, до сих пор не вдупляю.