Здравствуйте друзья Итак сегодня мы с вами начнём разбор функций нейросети stable Di Fusion которая реализована в Боте еса и бот в мессенджере Telegram включается очень просто у нас внизу есть кнопка stable Fusion при нажатии вы переходите в режим генерации изображений под текстовым промтом который вы пишете в блоке сообщений Разумеется можно не заморачиваться какими-то настройками просто писать какой-то запрос например девушка идущая по парку в стиле аниме тут сразу можно обратить внимание на то что бот создает описание для генерации Что это значит Это значит что у вас уже включен режим синхронизации stable de Fusion 5 об этом чуть попозже поподробнее расскажу но сейчас давайте посмотрим на результат скорость генерации зависит от того насколько нагружен сервис в среднем занимает от 10-20 секунд до 1,2 минут вот мы видим уже первую генерацию здесь видно что девушка идет по парку но не только в стиле аниме А еще и ночью Дело в том что еще выбран сти ль Dark Как это работает тоже чуть попозже расскажу это находится в настройках стилей разумеется если Этот стиль отключить то скорее всего будет день или то что вы напишите в самом промте например день пальмы там свет яркость солнца и все такое то есть ваш промт текстовый запрос напрямую определяет то как будет это изображение нарисовано а стили накладывают дополнительные эффекты Кроме того дополнительный эффект накладывается с помощью настроек сейчас мы как раз начнем разбирать чтобы перейти к основным настройкам Нажмите на кнопку настройки SD Не пугайтесь такого большого полотна настроек на самом деле все очень просто сейчас разберем по порядку первые пять кнопок отвечают за так называемый чекпоинты иначе можно их характеризовать как ядра нейросети Ядра включает себя основную информацию об окружающем мире людях Сколько у людей ножек ручек пальцев глаз котят щеночков слонов стульев столов солнца Марса планеты так далее это по сути мозг нейросети каждый из ядер отличается тем как у вас будет изображение нарисовано они могут включать мир стиле как вот к примеру так суши Это как раз стиль аниме чтобы не быть голословным Давайте я лучше покажу как это выглядит каждый из этих ядер собрано кем-то из авторов Вы можете найти их на сайте цвета и. com Вот как раз здесь в топе находится релебейт Как видно тип это checkpoint как раз таки мы и говорим о том что чекпоинта являются ядрами по сути можно на сайте tvtoi посмотреть как будет рисовать каждый из этих чекпоинтов уже по фотографиям понятно что чекпоинт либерает создан Для максимально детализации то есть видно вот допустим по изображению если нажать что У этой женщины прорисованы даже мелкие детали кожи неровности морщинки и так далее достаточно высокая детализация и реализм Именно для этого рекомендуется использовать чекпоинт релиберает следующий чекпоинт из настроек называется dellyberate в объем его поиске вот собственно и он нажмем для просмотра примеров Как видно здесь реализм также на высоком достаточно уровне но детализация тех же элементов кожи уже пониже Однако этот чекпоинт также подходит для неплохой реализации различных артов каких-то объектов которых не существует природе там например комиксов аниме и прочего это не значит что чекпоинт релебейт для этого не подходит Просто этот чекпоинт подходит для этого чуть лучше но как говорится все познается на практике поэтому вы лучше всего Сравните сами переключайте чекпоинты между собой и вводите похожие запросы а потом Сравните разницу тогда вам будет понятно сто процентов следующий чекпоинт RPG нажмем его здесь теперь найдем его на TV то и его полное название азовья rpgus также полистаем несколько примеров уже в принципе очевидно что этот чекпоинт предназначен для рисования артов Хорошо подходит например для создания визуальных образов персонажей игр Поехали дальше следующий чекпоинт Dram shaper найдем его на себе Тай Когда вы проведете всего несколько тестов вы поймете В чем разница этот чекпоинт подходит неплохо и для рисования Вполне себе реалистичных изображений так и для артов кстати говоря очень важно отметить что при нажатии на изображение вы можете увидеть примеры которые привел сам автор здесь помимо изображений справа находится промты которые использовал автора при генерации изображений можете скопировать этот провод и вставить его сюда для генерации у вас должен получиться примерно такой же результат пока мы этого делать не будем Давайте закончим сначала чекпоинтом Итак последний который у нас есть списке называется Dark Sushi здесь в принципе все понятно если коротко это аниме причем достаточно хорошего качества Это чекпоинт хорошо проработан автором поэтому рекомендую его использовать кстати обращу еще раз внимание Вы можете рисовать аниме и на других чекпоинтов то есть можете выбрать тот же delibrate написать девушка стиль аниме и вы все равно получите стиль аниме но выглядеть результат будет совершенно по-другому нежели Если вы сделали то же самое при использовании чекпоинта Dark Sushi Но вот собственно и пример у нас выбрана модель указан стиль аниме изображение Вполне себе анимешное то есть на самом деле не ограничивает вас так сильно Как вы можете подумать Но вы это поймете когда протестируете далее У нас расположены еще четыре кнопки я перечислю all-ray dpm + + 2мка раз dpm + sdeco раз и unipc это так называемые сэмплеры каждый из них является определенной математической моделью которая интерпретирует шум из которого нейросеть создает ваше изображение звучит сложно но на самом деле вам не придется копаться в этих тонкостях Вы можете выбрать просто один из них потом следующий потом следующий потом следующий и сравнить результаты Но если коротко то Every Ray это оптимальный вариант он подходит для рисования практически любых объектов dpm плюс 2м к раз больше подходит для рисования артов dpm + SD Ras классно оптимизирован дает большую нагрузку но зато на выходе дает более стабильные результаты в частности у людей например меньше мутации например не по шесть по семь пальцев А как надо по 5 возможно иногда придется подольше подождать если вы используете именно этот сэмплер unipc достаточно быстро оптимизированный сэмплер со встроен с диктором но при его использовании рекомендуется выбирать 35 steps то есть 35 шагов сэмплинга Почему Потому что при низком количестве шагов сэмплинга unipc может давать больше косяков на изображение но опять же Это не правило Это скорее закономерно ну и мы подошли к количеству шагов сэмплинга 24 шага и 35 оптимальное значение 24 шага не думайте что меньшее количество шагов даст вам худшие результаты Что такое сэмплинг Это количество итераций которые наносить переобдумывает изображение то есть самом начале регенерации у вас находится Шум Шум это такое хаотическое изображение состоящее из множества разнообразных точек которые просто ничего из себя не представляют ничего внятного так сказать Так вот потом с каждым следующим шагом или итерацией нейросеть пытается шума создать то что вы написали в промте то есть написали девушку будут пытаться нарисовать девушку так вот как показывает практика 24 ша Вполне себе достаточно для большинства задач более того если вы поставите 35 шагов не думайте что у вас детализация сильно вырастет да В некоторых случаях она может вырасти Но в ряде случаев может оказаться что сделают только хуже например детализация той же одежды может оказаться сверхдетализированной Извините за тавтологию Но это именно так появится элементы которых там быть не должно особенно хорошо это видно при использовании стилей типа киберпанк плюс мы в отдельных видео это все покажем Далее идет три кнопки с изменением разрешения в пикселях 640 на 640 640 на 840 и 840 на 640 Это соответствует Квадратное изображение книжное и альбомное сразу разберем тот факт что тут как вы видите Нет каких-то там 2К 4К разрешений Дело в том что нейросети генерирует изображение по другому принципу не нужно сразу генерировать большие достаточно сгенерировать маленькие а потом понравившиеся увеличить зарплатам или три или четыре раза это гораздо оптимальнее чем сразу генерировать большие изображения Потому что при генерации больших изображений процесс будет занимать много времени просто нет смысла ждать плюсу этого есть ряд других причин которые мы сегодня Пока разбирать не будем просто запомните что этих разрешений вполне достаточно для получения хороших результатов на выходе дальше мы видим три кнопки CF gscale 5 7 и 9 если говорить простым языком не вдаваясь подробности то это можно назвать насыщенностью изображения Да конечно разные люди говорят по-разному по-разному описывают эту функцию но я пока говорю простым языком чтобы не забивать вам голову при CF G5 у вас будет достаточно реалистичные цветовые гаммы например Хорошо функция будет подходить для фото качество То есть когда вам не нужно какое-то повышенный контраст или что-то такое cf9 в частности даст больше насыщенность что может появиться на изображении в этом случае какие-то дополнительные крышки Света какие-то более яркие элементы одежды то есть если коротко CF G5 можно использовать для реализма а SF G9 можно применять для артов далее классная функция одна копия и 3 копии Что такое 1 копия 3 копии в принципе Объяснять долго не буду и так наверное понятно по названию в случае если будет выбрана одна копия и вы забьете какой-то промт например там жираф Идущий по пустыне то у вас появится одно изображение с этим жираф Если вы выберете пункт 3 копии то вместо одной генерации вы получите сразу три и потом из этих трех жирафов сможете выбрать более подходящего например для увеличения изображения эта функция очень хорошо экономит время дальше мы видим 6 кнопок Дэнс 01 020405. 0608 это длиной функция которая позволяет грубо говоря видоизменять ваши изображения эти шесть кнопок не влияют на простые генерации они больше касаются модификации существующих изображений поэтому этот пункт разберем попозже дальше мы видим кноп плюс gpt эта функция может быть либо включена либо отключена соответственно когда зеленый шарик значит включена крестик значит отключена в принципе эта функция может демонстрировал когда она активирована ваш запрос система передает нейросети gpt То есть это такое своеобразный симбиоз между stable defusion 5 который мы реализовали в нашей системе вам достаточно написать простым человеческим языком Что вы хотите нарисовать например девушка идущая по парку как мы это делали в одном из примеров там можете там добавить какие-то элементы например на фоне зеленых деревьев в парке много людей система передаст запрос gpt gpt сформулирует из этого простого выражения на русском языке там каком-то еще языке в язык понятный Fusion тут уже подбираемся немножко к понятию промтинга stable de Fusion промты пишется не так в чат gpt Тут видно что он перечисляет различные слова через запятую fmail 2D аниме и так далее То есть stable defusion объекты и субъекты и окружения перечисляются через запятую так и вы правило Давайте коротко приведу один пример но отдельно мы это будем разбирать в другом видео правильный промо будет выглядеть примерно так девушка идет по парку на фоне зеленые деревья в парке много людей сюда же можно Дописать какой-то стиль но не будем далеко уходить раз начались ним это так и напишем стиле они важно запомнить одно правило то что вы пишете самом начале это ваш основной Объект который будет размещен на изображении А все остальное это его элементы например элементы одежды окружения фон и так далее В конце пишете стиль Почему в конце потому что то что находится в конце влияет на все предыдущие блоки разделенные запятыми в частности в парке много людей повлияет на предыдущие и так далее а соответственно в стиле аниме повлияет вообще на весь промт а девушка идущая по парку которая стоит самом начале будет являться основным изображаем объект на тему промкингов stable defusion будем разбирать отдельно тема очень интересная Почему интересно но просто потому что там абсолютно безграничное Поле для фантазии здесь мы видим еще одну опцию на этот пром эта тема также относится к промтингу то есть написанию текстовых запросов для генерации мы ее разберем в отдельном ролике вместе с промтингом она заслуживает отдельного внимания У нас осталось еще одна кнопка называется настройки стилей это дополнительные инструменты для стилизации ваших изображений как следует из названия Если выбрано No Style то никакие дополнительных стилей к вашим промтам добавляться не будет Также вы можете выбрать Случайный вариант в этом случае наша система будет подставлять какое-то Случайный стиль из этого списка можете порисовать стилями journey Да той самой которую я не очень рекламировал до этого но у нее тоже есть определенные характеристики которые в принципе делают и уникальной стимпанк киберпанк аниме и так далее Все это можно применять для рисования в нужных вам стиле тут не буду сильно задерживаться потому что все это работает путем тестирования вы сами сможете кликать и посмотреть Чем отличаются каждый стиль обращу Ваше внимание лишь на функционал в данном случае Вы можете убирать несколько стилей при этом Порядок в котором вы их выберете определит степень их влияния допустим вы сначала Нажали на фото у этого стиля будет максимальное влияние потом на Space второстепенная влажность и Готика будет находиться на третьем месте Хотя тут надо пояснить Сначала я нажал миджоне Да и забыл об этом соответственно будет максимальный вес потом фото потом Space и годик я не рекомендую совмещать много стилей как правило достаточно одного двух также есть стили которые могут мешать друг другу Дарк и Лайт Dark это низкий ключ Light это высокий ключ Что такое низкий высокий ключ Dark все будет затемнено помните вначале девушку рисовали которая идет по парку и она оказалась как будто бы ночью Light это обратная сторона соответственно все будет засветлено это так и называется фотографов низкий и высокий ключ с этим разберетесь сами Я вас уверяю ничего сложного у нас осталось галерея нажимаем на эту кнопку и смотрим Что это такое Лора это особый тип моделей для stable defusion вот Помните я вам рассказывал самом начале про чекпоинта про ядра нейросети на которые нейросеть опирается для того чтобы рисовать какие-то объекты так вот Лора это как дополнительный библиотеки к основному ядру я вам расскажу такой пример stable defusion базовые модели не умеет рисовать какие-нибудь объекты Пусть это будут сказочные создания единороги так вот с помощью библиотек Лора это можно исправить то есть с помощью Лора можно сделать так чтобы нарастить научилась рисовать этих единорогов Ну или еще что-то там каких-то например героев из мультфильмов каких-то актеров чтобы их лицо получалось максимально правдоподобным здесь можно выбрать Лоры став галерея и выбрать что-то из того что вам понравится но Давайте сначала расскажу где брать эти Лоры возвращаемся на сайт цвета и выбираем фильтрацию здесь нажимаем лора и sd15 все теперь можем выбрать ЛОР который хотим использовать нажимаем на лору листаем работы автора если Лора нам понравилось можем добавить в систему копируем ссылку отправляем ее нашему боту он сообщает нам что скоро поставят эту лору А если она уже и системе то об этом сообщит вам сразу же ее можно будет использовать обращу Ваше внимание на то что у каждой Лоры автор как и в случае с чекпоинтами прикладывает свои работы и здесь есть промт который можно стащить и попробовать повторить что-то подобное можно посмотреть какой он использовал сэмплер и какую модель в данном случае модель это чекпоинт как правило установка Лора занимает 1-2 минуты Вот как раз нашем случае Прошла всего одна Теперь когда лору установлены можем ее использовать Итак как использовать лору вставляем Сообщение вот такого формата Лора двоеточие номер а потом после двоеточия идет вес единица зачастую это слишком большой вес для тестов предлагая поставить 0.
8 номер в данном случае 6603. 0 берется и ссылки Из основной ссылки на лору Вот этот номер далее мы кликаем изображение Смотрим как автор предлагает использовать его лору вставляем его промт и видим что в конце написан Лора с именем а не с номером нам нужно это исправить то что он написал мы удаляем кстати обратим внимание что здесь поставил 09 мы сделаем также меняем нашу 0. 8.
09 и отправляем запрос Еще раз подчеркну что Лора указывается прямо в тексте промта вес Лоры Вы подсматриваете у автора то как вес влияет на результат авторы устанавливают сами когда создают Лоры Поэтому у одного автора вес будет например единица будет средний значением А у другого автора это может быть 07 или 06 вот он нам создал первую картинку и вторую сразу Да но мы можем обратить внимание на то что результат сильно отличается от того который получился у автора Дело в том что автор использовал другую модель а именно чекпоинт вот как он называется у нас же выбран тик-поинт или бибрейт Однако мы видим что тут стиль аниме в основном мы можем сделать альтернативу включим Dark Sushi и получим что-то похожее кстати говоря в будущем Мы добавим здесь выбор огромного количества чекпоинтов То есть сейчас их 5 в будущем их может быть хоть 50 хоть 100 и так далее Это вопрос времени в целом Если вы Человек из будущего и смотрите этот ролик видите что в Боте уже совершенно другие настройки удивляйтесь мы постепенно будут развиваем какие-то функции могут видоизменяться но в целом суть будет оставаться плюс-минус такой же хочу еще обратить Ваше внимание на то что у каждой Лоры практически у каждой Лоры есть триггеры или триггерные слова так называемые Что такое триггерные слова во-первых где их искать находится они в общем описание Лоры Триггер Words их можно копировать отсюда либо прямо в нашем Боте их рекомендуют составлять промте вместе с указанием Лоры То есть как это обычно выглядит копируется триггерные слова это может быть одно слово или несколько а потом вставляется сам кот Лоры и на выходе мы получим примерно то что полагал автор Что такое триггерные слова сейчас попытаюсь простенько объяснить Представьте есть допустим мультфильм Том и Джерри и поэтому мультфильму автор Лоры обучал нейросеть То есть он загружал туда кадры из этого мультика где присутствовал Том и где присутствовал Джерри так вот если вы хотите нарисовать только одного из этих персонажей то вы напишите здесь в триггерных словах Том Пусть это будет Том а на другом изображении вам нужно только Джерри триггерным словом будет Джерри в этом случае автор здесь в триггерах указал бы том запятая Джерри Ну адекватный автор авторы бывают разные поэтому много косяков на самом деле в том как они оформляют эти триггерные слова поэтому не удивляйтесь у вас не получается Тот же эффект который был автора Потому что некоторые триггерные слова не перечисляют в одну кучу иногда это работает корректно иногда не очень триггерные слова можно использовать как по отдельности Так и вместе перечисляя их через запятую Вот здесь например видно что тут триггерных слова в данном случае даже словосочетаний отдельно один отдельно второй и отдельно треть Чтобы сильно не косячить Попробуйте сначала использовать так как предлагает использовать автор копируйте целиком и вставляете одним запросом напомню только что номер Лоры нужно брать правильно А не так как это указано у автора здесь авторы здесь указывают Лоры по их названию Но эти названия могут меняться от версии к версии поэтому вам чтобы не путаться проще брать по нормальному номер прямо из строки в данном случае 6.