Приветствую всех очередной эпизод N factorial podcast N factorial podcast - это разговорные канонические мастер-классы с вдохновляющим мастерами из разных индустрий сегодняшний Наш гость эксперт по выжимании максимума из нейросетей также промт инженер в компании хи Field ai Руслан сыздыков Руслан Добро добро пожаловать Спасибо Спасибо за приглашение Ну у нас сегодня будет очень Необычный эпизод мы В подобном жанре сделали один эпизод это будет эпизод в рамках такого в жанре скринкаста где мы поделимся экраном и это будет прямо такой живой живой мастер-класс где ты будешь демонстрировать на деле а различные скажем так возможности сегодняшних Современных инструментов поговорим о
Text To Text Да Chat gpt кло поговорим о создании изображений с помощью дали M journey преобразование текстов речь генерацию аудио с помощью 11v LS поговорим про генерацию музыки поговорим про анимации От текста к видео Да с помощью там Хикс с помощью пики Runway создадим двойного создадим цифрового двойника с помощью н поэтому такой очень массивный плотный эпизод начнём наверное Со следующего А я бы хотел бы показать как обычно я делаю промт и потом получить от тебя как эксперта некую вот как скажем так критику обычно мой промт промт когда у меня там есть чуть больше времени я
Пытаюсь составить его чтобы там был во-первых я говорю скажем так ча Кто он в самом начале да то есть сразу чтобы контекст был правильный потом я говорю ему саму задачу да то есть чем специфичное тем лучше но часто там особо нет времени там все эти спецификации писать краткое краткое описание задачи в чём обв да В чём цель может быть небольшое количество примеров Да очень важно то есть Гово занимай о свом ответе по Да в конце Я обещаю ему чаевые от 1000 до 10.000 долларов в зависимости от сложности задачи он отказывается там во время ответа Ну
ещё один момент я пытаюсь после после ответа попросить его по рефлексировать и по критиковать и собственный ответ как обычно вот какие-то есть может дополнения комментарии критика Что можно [музыка] сделать это пост где мы делимся Вдохновляющим инсайта с мастерами из разных индустрий Кроме этого с 2013 года Мы также выращиваем собственных мастеров it специалистов многие из которых впоследствии становятся гостями нашего подкаста Если вы хотите стать гостям подкаста кратно увеличить свой доход сменить профессию и начать карьеру в it Если вы до сих пор жалеете что учились не пойти специальности приглашаем вас в factorial School место для старта вашей
голо житель карьеры в it наши выпускники Работают в Google META Amazon Apple и других компаниях США и Европы Они учатся ведущих мировых вузах а также создают свои собственные глобальные технологические стартапы привлекая миллионы долларов в кремни далини Сегодня вы приходите новичком А завтра уже работаете в it обучайтесь онлайн с любой точки мира переходите по ссылке в описании и станьте частью нашего дружного элитарного и само иронично сообщества а на самом деле как бы вот то Что ты делаешь это вот в всё всё как нужно Да как правило Ну есть несколько фреймворков того как людям Да общаться с
ктек моделями и да то есть самое основное что там должно быть то есть как такой минимальный Да джентльменский набор чтобы получить максимально качественный хороший результат это вот первое задать ему роль как ты уже делаешь Да задать ему зада расписать е максимально детально дать несколько примеров то есть Роль задача цель ожидани от него то есть в каком виде ты хочешь то есть пример того кода Какой ответ Должен быть и есть ещё вот всё всё что ты сказал это вс всё круто но я бы дополнил е как правило если мы добавляем важность вопроса для меня как для
пользователя лично то есть это эмоциональное такое этот эмоциональную важность если мы подчёркиваем тут же как с ним всё работает так же как Условно Да с там человеком который с которым с которым ты беседуем да представим что там вот по другую сторону наш собеседник Вот и если бы он был бы нашим идеальным допустим сотрудником то кто бы то кто это был бы и то есть какими бы качествами ты бы его ты бы его наградил Да вот эту вот роль и соответственно все методы социальной инженерии все методы психологии и так далее они в той или иной степени
в той или иной степени работают Вот поэтому Если мы туда ещё добавим эмоциональный окрас То есть это очень важно для меня от этого зависит там моя жизнь карьера работа и так далее То как правило там Я тоже в некоторых Пепе исследования пишут где-то от Ну процентов на там 7-8 там он более детально развёрнуто говори и в целом более качественный Ответ он выдаёт то есть в целом всё круто всё хорошо единственное добавил бы эмоциональный кра Давай попробуем это применить в действие я вот небольшое там Три предложения подготовил я говорю здесь ты то есть мирового уровня преподаватель
математики и создатель пазла детей создай мне классные интересный Пал для умных примеры не буду тебе давать Давай добавлю что это очень важно для меня представим что я работаю там в школе Типа вы Мо с моими школьниками это будет очень важно для Меня планируй запланируй свой ответ поп и я тебе в конце дам ти ещё такой интересный момент читал что на 1% качество улучшается если добавляешь это наверняка шутка так Ну достаточно неплохо он начинает планирует свой свой ответ цель тему выбирает сценарий потом начинает уже формулировать сам непосредственно задачу есть пять животных А у них они празднуют
День рождения кролика им нужно разделить 20 20 этих получается морковок потому что это любимые любимая еда кролика Сколько у каждого Сколько у каждого будет морковок да получается угу вот Ну можем сказать ему Давай покритий свой ответ вот когда ты пишешь Можно ещё добавить тогда он чуть-чуть ещё более то есть иначе критикует как будто он учитель да да то есть он не выходит из Своей первой роли которые мы ему ставили Вот так он тоже чуть-чуть может с другой стороны посмотреть и что ещё дополнительно интересно то есть если раньше в предыдущих моделях Да его вот я когда
всем все всех обучал всем всем объяснял если Мы двигаемся в рамках какой-то одной конкретной тематики условно вот в рамках данного чата это у нас идёт там создание Да этого math ridle и так далее а то дальше в рамках него же мы должны Двигаться чтобы мы говорили про про math и так далее в рамках одной роли то есть Он сохраняет условный контекст в рамках одного чата Вот то сейчас контекст сохраняет он в рамках нескольких чатов Вот Но это не всегда работает над Ну по м там всем детальным вопросам обычно это касается того там именно о информации
о пользователей как как как если изначально у тебя здесь тоже есть функция там Custom instructions себе задать и ты пишешь там кто ты для чего Ты это делаешь и как бы ты хотел чтобы чат тебе отвечал то здесь он примерно запоминает то то есть что ты говоришь о себе То есть я там человек который там вот здесь Допустим ты говоришь то что мне нужно для учеников это делать То есть он у себя условно где-то пометку Да ставит и соответственно дальше а при следующих запросах он будет иметь в виду то что какой-то из вопросов У меня
был про про teachers и Ну в зависимости от того как часто ты те или Иные вопросы ему задаёшь он уже больше ориентируется Ну то есть хранит информацию о тебе как о пользователе в Угу супер Давай я тебе предоставлю а экран тебе и давай приступим к основному скажем так главному курсу Нашего Нашего сегодняшнего подкаста Ну вот ты в принципе самое основное сказал что как правило людям что нужно люди люди обычно как делают заходят в чат gpt максимально быстро пишут какой-то запрос получают максимально быстро какой-то Ответ то есть рба И чем детальнее ты это дашь тем детальнее
ты получишь ответ хотел дать пару таких интересных примеров Каким образом А можно вытащить побольше да побольше детально информации либо побольше а-а вообще из из из самого чата gbt к примеру допустим Один из кейсов таких Real World кейсов это а мне нужно было написать отчёт по продовольственным системам мой в целом а такой бэкграунд Он э несколько айтиш най сколько он то есть больше в аналитике То есть я 7 лет проработал в из них очень много было было в направлении сельхозяйство то есть продовольствия система системы да В основном это цели устойчивого развития вся вся юя повестка Вот
и очень много мне после этого приходило вопросов зада проектов ци подготовки отчётов аналитики и так далее Вот и одним из вот Этих запросов был подготовка отчёта о продовольственной системы в Казахстане то есть начальный пром Довольно простой Да ты agricultural economist который работает в UN А ты то есть вот всё у нас есть определённая роль да потом какие у него есть скилы ты скилов в аналитике сельского хозяйства и продовольственных систем У тебя есть опыт работы с международными организациями как оср всемирный банк undp продовольственная Сельскохозяйственная организация ООН Вот и потом твоя задача Что мне сделать разработать репорт
по казахстанским производственным системам мы будем двигаться Шаг за шагом и вот очень интересная вещь мы даём ему информацию на которую он должен ссылаться То есть я с тобой поделюсь определённой информацией которая Мы разработали в рамках других других асатов по похожей тематике ты будешь запоминать её и будешь ждать Следующих инструкций вот помни то что критично что ты дашь максимально Хороший ответ и так как моя карьера от этого зависит и также I will be Will супер да дам тебе там до 500 долларов за каждый ответ Окей и дальше мы ему двигаем двигаясь Шаг за шагом мы ему
даём сначала структуру необязательно изначально нам Мы можем там идти из от структуры общей всего отчёта но мы можем так как контекстная окно у чата gpt на тот момент было кажется 16.000 токенов а Это где-то те же самые там 10-12 сся слов на английском языке соответственно мы не даём ему то есть всю структуру всего текста мы разбиваем его на несколько блоков вот в рамках данного у нас зада чаптер второй - это национальный контекст у него структура своя вот потом дальше гово О вот структура он запомнил структуру Я говорю дальше я буду давать тебе текст для контекста
Ну как была сори за Каламбур контекстное окно - это суммарное суммарная длина всех ответов чат GP и всех твоих вопросов да да да которые в рамках одного чата А ещё проще это как будто Вот вот память да да то есть он ничего не помнит если это вне вне этого контекстного окна дада да то есть вот тебе пришёл очень-очень зелёный твой сотрудник который вот у которого есть доступ к куче куче информации он приходит и такой каждое утро он условно к тебе пришёл и такой А что мне дела Что мы делали вчера что что делать вообще есть
такая есть такой фильм японский про а профессор математик который не помнит вчерашний день и он с нуля как бы с нуля живёт жизнь вот да очень Ну похоже о очень похоже и вот и если мы это этот контекст превысить Да вот это эту память он будет начинать забывать всё что было то что было в начале поэтому Когда у нас сильно длинный диалог можно это дело проверить спросить ты помнишь С чего начался наш Диалог Вот и тогда если он начнёт с чего-то где-то с середины то ты поймёшь что О'кей хорошо а либо Мне нужно напоминать ему
опять Заново там пароли и по информации либо уже переходить в новый чат и заново всё это дело начинать Вот Но сейчас у него память расширяется контекстно Но расширилось если я сейчас не ошибаюсь Вроде да вроде 128 Ну вот у Минай миллион но многие жалуются что это миллион но он как бы какая-то память всё равно дырявая Несмотря Да да а та же самая штука но получше работает у у Клода у него сейчас 200.000 кажется на 200.000 токенов но в в третьем опус кажется кажется ещё больше вот я его тестил я ему загонял а предприниматель Налоговый кодекс
Угу А хотел потестить каким об Как как можно в целом его использовать как Налоговый кодекс РК Налоговый кодекс РК полностью а он очень длинный Он очень длинный вот и он ну буквально не смог его проглотить Потому Мне нужно было его там обрезать на где-то процентов 70 чтобы он его твой прогноз когда когда будут инструменты где там порядок контекстно акно это сотни миллионов токенов когда это произойдёт год-два или это будет такая гонка вооружений что это будет прямо через следующие там 6 месяцев ну гонка вооружений наверное да но ну тут же как Всё зависит от от компьютера
от того какие у тебя поэтому Ну я думаю то что в ближайшее Ближайшее время сейчас что Microsoft скорее всего это будет какой-то более дорогой продукт да для условно GT5 он может сможет не знаю Сколько хранить там миллион полтора миллиона Вот но тут тоже да там чем больше у тебя контекст тем мре Ну вот нано мечта большая всех это загрузить вообще всё что вы создали свою жизнь и тогда как бы это этот инструмент становится вашим личным ассистентом вообще по всей вашей жизни со всех но Файлов Я не знаю Всё всё что вы делали в интернете всю
свою жизнь второй мозг Ну да кстати есть блин я вот даже не могу припомнить есть один продукт он как раз ориентирован на маки он записывает всё что ты делаешь на Маке кажется кажется да то есть все твои иде действия на маки где-то хранить Возможно это как-то Вектор переводит или ещё что-то чтобы вот и ты потом можешь просто как как как поиском по там истории своей когда я там смотрел Вот это когда я с кем-то общался На эту тему то есть с кем-то я переписывался туда но ну большой вопрос конечно privacy ну это прям Это вся
жизнь человека вся жизнь человека в его смартфоне в его лаптопи вернёмся н да возвращаемся и вот структура мы дальше ему добавляем информацию которая нам нужно то есть это из старых каких-то отчётов из справок там что-то переведено было что-то не переведено то есть вот чтобы ты понимал когда мы ему отправляем Информацию Мы нам нам нужно чтобы он не комментировал её Ну чтобы сохранить Да тоже там несколько там несколько токенов несколько десятков токенов иногда это прям супер важно когда ты в конце просишь у него написать или основные выводы он забывать Вот в конце это не всё жди
будет ещё информация и просто скажу О'кей Да долго много не болтай Просто скажи окей Не трать наши токены дадада он говорит О'кей всё хорошо понял и го скорее всего я это в секцию potion Framework добавлю У уже думает Так я наверное сюда всё это ставлю там дальше стратегии планы добавляем информацию он говорит Окей потом дальше ещё информацию ещё информацию то есть мы ему скармливали скармливали скармливали информацию а в виде текста Вот А да одна ремарок то что это было ещё до того как CDE interpret и и мы могли бы какие-то там PDF файлы напрямую Туда
ему Вставлять вот а но опять же Аа лучше как я считаю ну по по моей э по моему опыту если мы допустим если мы загрузим ему один-два PDF файла И попросим по ним работать либо если мы ему нужную информацию будем закидывать вот так в чате то есть лучше запоминает и больше ссылается он именно на информацию которая здесь а да и Вот соответственно дальше мы а условно текстовом виде он лучше запоминает чем мы ПДФ ки имы отправим Дадада да всё верно Вот теперь А мы дальше переходим на Да всё добавили и мы говорим ему давай а
будем писать э дальше дальше текст так всё это отправим отправили вот это всё теперь жди следующих инструкций он всё О'кей я го это запомнил теперь нам нужно дальше двигаемся Шаг за шагом э написать первую часть второго второй второго подраздела Нашей главы это legislation F Systems помни моя карьера и то есть каждый раз мы ему Напоминаем о том что то есть эмоционально раз даём и говорим про тип А всё что ты предоставил до этого это были твои предыдущие отчёты это были предыдущие отчёты это была информация где-то из справок которых я которые я где-то собрал где-то информация
там из интервью или то есть такие крупицы информации которые могли бы как-то помочь написании Ага и он Должен оформить это всё в правильном формате Да он должен оформить это да в формате так как мы ему изначально написали то что у него опыт и так далее вот он обращается к ко всем тем отчётам Да к тем структурам которые на которых он обучался и это короткие абзацы в основном выводы то есть да вот и соответственно Всё у нас подпункт 2 и2 и Да это законам которые я ему отправлял но здесь я понял то что он не учёл
несколько там Законов которые которые я ему говорил то есть я спрашиваю у него Какие Как как насчёт других которые я с тобой которыми я с тобой делился он говорит А да Окей отлично Тогда вот закон по нацбезопасности закон по по госрегулирование АПК потом роли государства ещ дополнительные законы которых смотрели вот и м всё очень сильно похоже на вот я просто всем говорю Представьте что вот к Вам приходит ваш сотрудник я вот сделал мы смотрим м вот это мне не нравится давай ты вот это поправишь он О'кей ушёл вместо того чтобы 3 часа потратить он через
2 минуты к тебе приходит через Через полминуты я сделал Вот и и каждый раз мы мы ему говорим что поменять что здесь поменять не так здесь поменять не так здесь поменять не так и он не на тебя не обижается не говорит что ты меня не ценишь и так далее и всё делает Как э Как мы ему сказали Вот соответственно А здесь мне ну не особо а понравилось что он больше говорит а по прод безопасности потому что изначально эта информация была в рамках контекста по прод безопасности Я ем говорю давай мы мы мы начнём его как
э-э как как если бы нам нужно было про продовольственные системы говорить всё и дальше начина вает самы Да переписывает тот же самый текст Вот и по тому же самому подходу Мы двигаемся дальше то Есть мы где-то переписываем А все всю секцию где-то где-то дописывая и то есть дальше мы ему вставляем ещё дополнительную информацию Да вот по вопросам графиков А вот в рамках того же самого текста Вот мы написали мы написали секцию и дальше я ему отправляю там допустим Какие вот этот график то есть вот у нас по для секции demographic drivers то есть мне нужно
чтобы он описал этот график что Самое интересное когда мы отправляем график без каких-то там пометок без без Data labs он делает очень хорошую работу в оценке значений по годам и вот это вот это тоже интересная штука вот дальше мы просим описать графики как правило в аналитике что ты сначала собираешь информацию графики потом ты начинаешь её там описывать и зачастую вот этот процесс описывая он такой мутор там у нас в 2022 году есть рост настолько это Столько-то процентов связано с тем-то с тем-то то есть и ну вместо того чтобы писать это самому можно всё это условно
за аутсорс да то есть вот там другой другой график пропиши мне вот этот опиши мне этот график то есть описываем графики и вставляем ему информацию можем Давать ему Excel таблицу просить давать аналитику по Excel таблице то есть всё это в рамках теперь да А одного одного чата он то запоминает и по этому всему он работает вот и Соответственно всё то есть мы дальше дальше дальше дальше Всё что нужно мы с ним прописываем даже если нам нужно будет Допустим из какой-то информации сделать табличку либо ещё что-то Угу Как завершился твой диалог с А здесь мой диалог
завершился кажется тем что он мне Да дал финальную таблицу Угу а то есть я вот да дал мне финальную таблицу того что мне нужно было просто дополнить в мой отчёт А что важно при та подготовке отчётов или каких-то Там курсовых или ещё какой-то какой-то Информации а никогда не просим его додумывать какую-то информацию либо откуда-то дополнительно вытаскивать Да все все все большие языковые модели они склонны к цинию Вот и соответственно он если мы просим Окей Дай ещё дополнительную информацию о том что ты знаешь там тоже про продовольственные системы там что у нас изменилось в Казахстане там
в 2022 году Вот и он начнёт придумывать начнёт Давать какие-то источники которых не существует за счёт чего ты добивался уменьшения галлюцинации вот в рамках это в рамках этого диалога только за счёт того что я ему даю информацию по которой нужно следовать то есть всё вот по этой информации исследуй и дальше ухо никуда не уходи Да в сторону Вот иногда бывает иногда бывает он додумывать Ну тут Да понятно никогда не бери первый результат вот да тоже одно из правил никогда не довольствуйся первым Результатом который тебе даёт языковая модель всегда либо проси его покритиковать переписать дополнить информацией
и так далее Вот и Ну потом это как такая основная рыба которую ты можешь уже фактами фактами дополнять вот тут Да много текста пишет Да есть хорошие выводы Но к этим выводам нужно всегда добавлять в информацию цифры факты и то есть мы условно обогащаем наш отчёте Да наш наш документ Ну вот этом Красота да то есть когда вы пишете отчёт Температура должна быть нулевая да то есть Ну в этом в этом плане да то есть он должен фактически не гонить Но если вы хотите порер Если вы хотите там по придумывать сценарий для фильма или я
не знаю по придумывать идею для стартапа Нужно вспомнить Вот помните помнишь эпизод по-моему Это первый первый сезон кремнев долины где бакман едет за город чтобы придумывать идеи начинают просто Рандомные слова говорить и так далее и так далее и приходит там к Интересным идеям вот поэтому есть место для галлюцинации когда они вот реально нужны это подобно тому что вот вы там со друзьями студентами в пятниц вечером там определённые кушаете Брауни с определённым содержимым чтобы вот очень Креативно об этом думать всём одна из нестандартных вещей Это что Это интерпретация каких-то там ну изображений проверка его на чувство
юмора Это был то есть Мом моим интересным эксперимент У айтишников юмор довольно специфичный и зачастую не всем понятен юмор айтишников и вот вот допустим просто максимально здесь здесь когда мы работаем с изображениями когда мы закидываем е изображение нам уже здесь уже чуть работает по-другому нам не нужно супер детально расписывать там что нам для чего нам это нужно потому что есть чёткий визуальный референс и должна быть чёткая задача просто всё то есть там дальше нам не нужно ему Сильно раз этова расписывать Да другая вариация этого Мема - это когда вот вот этот мальчик который поднимает это
ai А вот это это we3 дадада да да вот и допустим вот вот этот мм да то есть ну он довольно таки то есть не не как сказать не супер а не супер глубокий наверное да сори за Каламбур вот следующий интересный вот ddr Ram типа ddr Ram и ddr Ram То есть это и то и то ddr Ram и Ты изначально смотришь а Что здесь общего почему это Должно быть смешно и здесь он понимает то что ddr сверху это у нас оперативка doua Random Access Memory А в нижней части то есть овца Ram Да тоже
каламбурчик до Ера слов и на Танцевальной платформе игры Dance rolu ddr то есть вот такого рода уже я сю Ну потому что не каждый человек это пойм я при первом даже не зна что называе для меня это это Как называ там V3 или что там Нажимаешь на кнопки с точно слышал на самом деле она работает супер круто и здесь областей для применения в целом повседневной жизни очень-очень много от простого то есть многие люди часто в алиэкспрессе заказывают там или там всякие ндо алиэкспрес или ещё в том же самом капи магазине что-то там мебель электронику Где
инструкция приходит там на китайском Языке ты такой смотришь Блин ну как мне здесь что мне здесь как мне интерпретировать берёшь телефон фотографируешь вот э инструкция для чего-то чего-то А переведи мне её то есть и напиши мне там Проведи меня Шаг за шагом условно там как А вот недавно у меня мы ребёнку нашему заказывали э робота а собачку и мне нужно было понять как вообще Оно включается и там пульт управления и там тоже всё на китайском как она включается Что сделать И вот отправляем фотографию пишем э то есть я не говорю по-китайски объясни мне шаг за
шагом что мне нужно сделать для того чтобы оно у меня просто заработало то есть максимально простым таким обычным языком Да и ну на удивление Не всегда он работает Прямо супер идеально но то есть ну благодаря ему я смог Хорошо я смог нормально его запустить а потом ещё и прошить в него несколько команд которые Он мог бы понимать на русском языке то есть вот это всё просто благодаря тому что Да я не спец в там в софт инжиниринге Да я не спец в в китайском тем более Вот и с помощью чата gpt я могу понимать китайский
и сделать чуть-чуть больше чем Рядовой пользователь какой Ледовой пользователь там игрушки вот этой собачки робота Отлично вот если мы пойдём там немного дальше в там другой какой-нибудь Да Пример как как как использовать то есть тоже домашний пример э у меня есть дома какие-то продукты это вот наверное для для для для тех кто там для мо хозяек для тех кому очень сложно выбрать Что приготовить фан факт каждый год на инкубатор нам подаётся идея именно э Угу рецепт из того что есть в холодильники Каждый год у нас есть а который это делает Вот и Ну да до
боли просто да то есть сейчас можно да по создать Агента засунуть его всего в Telegram бот Либо там обернуть в какой-то интерфейс вот отправляем фотографию Что можно сделать с этим продуктом Ну и вот Вуаля Я думаю ты был свидетелем очень многих таких вещей и вот он сначала говорит о том что не всегда он говорит что он видит вот что можно омлет пюре и так далее и так далее То есть вот либо чуть-чуть посложнее что у нас на вот фотопро в моём холодильнике хорошо понимаешь содержание содержимое Холодильника не всегда не всегда если допустим здесь Он подумал
то что у нас где-то есть макароны скорее всего это вот вот эта вот часть А здесь Видишь ты говоришь сразу на русском потому что продукты тоже обычно вот с грешного рынка поэтому наверно правильно дадада да тут тоже тоже интересная Интересная штука да о том на каком языке мы пишем зависит то к какой информации он обращается и тоже интересно да наверное такой тезис Тоже хотел тебя спросить насколько ты согласен или нет то что язык определяет способ мышления то есть от того как ты строишь свои предложения как ты мыслишь На каком языке ты мыслишь В каком плане
то есть условно у китайцев У да у азиатов которые у которых письменность допустим иероглифах очень много значений в заточены сразу в там допустим в один иероглиф и они уже мыслят образами а то есть а мы там мыслим построением Предложений там от а а там объект субъект Да а и описание то здесь Наверное скорее всего Здесь тоже примерно похоже этот и вот да на русском языке фото продуктов в холодильнике что можно из этого сделать То есть он попытался здесь увидеть овощи овощей здесь у нас нету допустим запеканка с макаронами макарон Нет он увидел яйца а вот
да Он увидел перец подумал то что у нас есть дополнительные овощи вот он не знает что такое сгущёнка Допустим вот он думает что у нас тут есть где-то там молоко где-то есть тесто вот увидел хлеб увидел сыр Вот увидел Молоко да Там и так далее вот это то есть в рамках Да вот такого там идеи для блюд А если мы пойдём чуть-чуть дальше то есть что если мы М возьмём а текстовые инструкции а возьмём дадим ему роль как нашего условно диетолога или фитнес-тренера неважно Там нутрициолога и так далее то Мы можем в целом а сделать
себе персонального ассистента который будет считать нам калории и схо действовать то что мы едим без необходимости Да ну понятно что точность будет не такая высокая без необходимости условно взвешивания а нашей порции и так далее То есть в рамках вот данного Да эксперимента промтара Да кто та в прошлом году было Вот он мой персональный диетолог коуч по правильному питанию Мне 33 года мой рост Вес то есть я говорю имеется лишний вес там там-то там-то моя цель сбросить начать заниматься буду писать тебе что я ем буду отправлять фото еды тебе нужно считать калории давать советы что убрать
Что добавить еду будешь примерно считать бжу коэффициенты Белки жиры и углеводы там где смогу я буду писать сколько в граммах я потребляю иногда придётся самостоятельно определять для начала Задай столько вопросов Сколько потребуется для того чтобы дать наиболее Качественный ответ Это тоже очень сильная вещь а мы зачастую всегда Да баст в рамках какого-то мы мы считаем что то что мы ему даём это достаточно для того чтобы он уже как-то интерпретировал это хороший хороший момент Да вот и момент с самого начала пусть он задаст столько вопросов Сколько нужно для того чтобы дать наиболее качественный ответ А я
к твоим услугам задавай все свои вопросы супер Да он такой О'кей Да всё хорошо Ну Точно так же как и нашему сотруднику Всё понятно он говорит ну а ну если мы говорим всё понятно он говорит Ну да Всё понятно А если мы говорим вопросы есть может может быть что-то непонятно вот э спрашивай меня он гот А да Слушай для того чтобы мне это понять мне нужно то есть узнать ещё дополнительно что-то то есть вот здесь и и и всегда он даёт очень такие Да вопросы там зрит в корень вопросы в точку пищевые предпочтения ограничения То
есть что я люблю есть ли аллергии есть ли ещё что-то там физическая активность оказывается допустим я не знал Да что физическая активность очень сильно влияет на А твой твой кбжу который ты должен потреблять Ежедневно то есть тут есть определённый коэффициент он это дело высчитывает тоже образ жизни режим дня там медицинские особенности ели заболевание там целевой вес и вообще для чего мне это всё нужно вот такой О да Точно это как бы вс всё верно Окей здесь я говорю ему что что что хочу чего не хочу что что люблю что не люблю там какая у меня
физическая активность и он уже здесь прописывает Примерно вот что от общего к частному это общее что тебе нужно что тебе нужно наладить цель такая-то А ну блин за за 2 месяца 6 кг мы все понимаем что за 2 месяца 6 кг это либо очень сильная диета которая может быть с ущербом для организма либо там очень много физических тренировок нужно Но тем не менее как бы здоровое снижение веса предполагает потерю там 0,51 кг а всё что связано всё что связано со здоровьем с психологическим здоровьем с физическим здоровьем ну Я тоже бы советовал стопроцентно не верить то
есть всё-таки ну как бы это это это ai - это это не специализированный медицинский ai скажем так вот и Ну всегда Если у вас есть кто-то там диетолог или там хотя бы друг который занимается этим просто Поделитесь с ним как что ты думаешь Насчёт этого по этому поводу такой дисклеймер на дополнительный что инвестиционные советы тоже не Следуйте и вот а соответственно дальше Да вот у нас он даёт нам рекомендации Как как поменять распорядок дня а и вот всё дальше уточняющие вопросы Сколько калорий Нужно потреблять Кай примерный бжу и вот и здесь ему нужно рассчитать базальный
метаболизм бмр он оказывается считается там 10 на вес на 625 на рост Ну в зависимости от того мужчина ты или женщина и плюс вот этот вот Да и плюс 5 если ты мужчина там плю 2 с поно кажется если ты женщина вот и он считает нам по тоже по по уровню активности и сколько нам сколько нам калорий нужно вот здесь несколько раз онне выдавал ошибку на тот момент это был gpt 3 С5 Но даже с GT 3 с по он работал круто вот там ошибка ошибка да что Интересно Каждый раз когда мы просим его посчитать
когда он делает ошибку у него у у gp4 у него уже есть такие признаки Да агентского поведения он сам может интерпретировать то что то что он делает понимать что где где он мог допустить ошибку и обратно то есть условно рефлексировать самостоятельно без необходимости уже ему дополнительно давать эту рефлексию вот у нас было несколько несколько попыток посчитать окей Всё А Дальше мы говорим про того что я съел То есть это наверное два жареных яйца около 200 г консервированной кукурузы О'кей Это примерно столько-то И того калорийность у вас такая-то я говорю О'кей сейчас столько-то то есть я
съел ещё что-то ну то есть условно вот Видимо это был Новый год Да тот день су да возможно это был Новый год скорее всего это был маленький мандарин выдаёт Угу сезон Это скорее всего там 2 января Да так сейчас посмотрим возможно тут Яичница консервированная кукурудза Да это понятно да Вот так мы можем в целом определить Да вот ну что интересно ладно То есть мы если мы каждый день пишем Это довольно много времени занимает А что если мы просто будем ему отправлять фотографии того что мы едим так сейчас если подгрузить здесь печенька получается да здесь печенька
5 Г маленькая печенька вот столько Столько-то калорий Окей здесь дальше то есть фотография донера А я говорил я я вот этот Донер ел где-то тут ну говорю я думаю где-то 110 г по моим ощущения он говорит О'кей Донер тогда а здесь там калории Белки жиры углеводы там такие-то такие-то а то есть дальше допустим тут тут был ужин А фотография ужина блин К сожалению да ничего ничего нормально а и там была вот пюре из картофеля жареные грибы кукуруза он сделал очень Хорошую работу в сег того что что есть на этой тарелке причём там фотография была такая
что ну Они отдельно отде отдельно положены дальше я покажу пример где У меня просто есть фотография боула которая уже перемешанная он понимает что там есть там бобы там чуть ли не там Семина и так далее То есть это Делон может понимать Вот соответственно Вот это Оценка ужина вот сводка за день у нас такая-то и всё тут мы в целом можем Каждый раз то есть когда мы что-то какой-то перекус там сегодня я вообще ничего не ел о говорит Окей ну извини Да это может быть днм разгрузки но имей в виду что хотя бы что-то нужно было
бы те есть там хотя бы там орехи йогурт фрукты смузи и вот ваш персональный ло нутрициолог вот мы можем к роли нутрициолога добавить ещё и пусть он также а Да тоже ещё один способ Применения можем добавить дать ему чтобы либо он совмещал две роли либо чтобы в рамках одного чата у него было то есть вот условно там два Агента два человека то есть да он не будет создавать двух отдельных людей но ну в плане две отдельные Person но будет думать и интерпретировать Так как если бы эти два человека друг с другом взаимодействовали вот а это
будет тоже отдельный пример который я покажу А и соответственно вот Э мы можем что здесь главное - это просто дисциплина человека который который этим делом пользуется ну и соответственно когда если это всё дело обернуть в приложение а без необходимости завязая в чат gpt поиска нужного чата то есть скоро можно будет эти чаты закреплять можно будет просто создавать свои тишки и пусть они у нас будут вот эти вот сверху про них Мы наверно тоже поговорим чуть попозже и вот взял сфотографировал всё что тебе Нужно и Ну я считаю что это очень-очень хороший там способ облегчить свою
Да жизнь вот также кстати он тоже довольно неплохо работает если Мы фотографируем вот когда мы делаем упражнение если Мы фотографируем себя делающим какое-то упражнение ипра исправ позу Исправь позу делаю я что-то правильно или неправильно вот но опять же 100% ему верить не стоит Но если у нас нету денег на персонального тренера как бы он грубые ошибки в технике может Поправить там условно ты не выл спину пробовал загружать видео видеоряд пробовал но он его не может интерпретировать пока что ну в рамках этого но я знаю ребята энтузиасты что делали они просто использовали API закидывали видео Но
из видео извлекали там Каждый каждый там двадцать пятый кадр и этот кадр анализировал Вот был эксперимент Как сделать камеру наблюдения и с ежедневной свод кой что у Нас происходило бы было ли какое-то движение вот и он каждые 5 минут кажется Ну чтобы сильно много денег не тратить то ли каждые 5 минут то ли сколько Да делал фотку и там описывал что происходит и в конце дня давал сводку у вас там на заднем дворе появился мужчина который а там ну условно черес Да принёс коробку или ещё что-то тоже интересный эксперимент Вот другой А парень делал так
он а сделал Ну тоже извлекаю каждый кажется Четвёртый или пятый кадр А и у него был учитель по йоге тоже он делал какие-то упражнения и просил его правильно ли я делаю упражнения вот подключал комментарии Тоже кажется там был LS Когда ещё не было возможности озвучки текста подключал laps чтобы он ему в реальном времени просто говорил озвучивал Что ты делаешь Правильно что Ты делаешь неправильно вот тоже тоже интересный Да способ использования вот ну посмотрим на дальше нача пти или пойдём на другие инструменты плот в принципе да мы можем пройтись Так дай дай я гляну если что
у нас тут Да я думаю мы можем мы можем пройтись дальше пойти по другим инструментам Угу Давай посмотрим на переплете это тоже интересный классный Инструмент там появился там полтора года назад то есть Google даёт нам 10 ссылок Да и потом мы должны на каждую там нажимать читать Пекси даёт нам сразу ответ готовы Да это очень полезный инструмент многие у многих там Толе у меня сильно уменьшился там зависимость отгула после появления плекси Давай поговори о НМ как ты его сам используешь Вот я тоже Я практически полностью заменил Google потому что ну за исключением того если мне
нужно найти какую-то картинку найти картинку быст иус какую-то инфор Это как правило какие-нибудь инструкции по каким-то там медикаментам если у меня ребёнок болеет Угу то прям очень быстро очень хорошо либо если мне нужно узнать что это что за инструмент то есть информацию о каком-то сайте информацию то есть либо Найди мне 10 ссылок по какой-то какой-то теме то есть либо какая-то данные да то что произошло последнюю неделю очень Уно и ну Я считаю что гораздо гораздо лучше чем Google Как сами создатели говорят что [музыка] это Википедии что хорошо У него есть как собственная моделька так и
можно в про версиях использовать либо либо чтоо чего они собственную модель сделали В чём их преимущество преимущество Скорее всего в том чтобы ну максимально быстро получать ответ То есть он а она он выдаёт маленький коротенький Как правило информацию там в два в три абзаца и как правило это там какой-то булт булт лист и как бы со ссылочка А Это скорее всего как бы gpt 4 с фаном или как Или что скорее что ты думаешь под капотом у perplexity модели своей у perplexity или нет скорее всего какая-то Лама ла скорее всего Лама какая-то Какая нная Да
дешёвая и которая очень очень-очень быстро инфи потому что Ну ему нужно что то есть мы пишем Одинаковый запрос в чат gpt по поиску пишем одинаковый запрос perplexity то есть чат gpt тебе через минуту выдаст ответ perplexity выдаст тебе через 2 секунды Ну дада да вот допустим А самое вот тоже да пример был А когда я работал над отм по вот подсистемам мне нужно было найти методологию методологию посте ели вообще какие-то методологии по прот системам Вот и я пишу Вот с конечно не так уже сильно работают все Вот эти вот Хаки как с чатом gpt потому
что что нам нужно нам нужно просто чётко конкретную информацию найти поэтому здесь можно Так давайте включим да [музыка] по-моему ты не нажал а так о ещё раз B А всё и самое первое что он нам выдаёт это самое распространённое что как как как все международные Организации это считают это они обращаются к [музыка] guid и всё сразу сразу ссылочки которые нам нужны сразу всё что всё что нам нужно короткое описание короткую информацию вот есть допустим как в другом проекте как в тава это делает И вот есть ични ответ мы можем дальше там по дальше фопи есть
ли какие-то там новые старые версии и так далее То есть всем рядовому Пользователю достаточно стандартной версии без необходимости там покупать про подписку про подписка те же самые 20 долларов стоит как с чатом gpt что нам открывается там функция функция copilot по сути это а тоже да то есть элемент агентского поведения уточняющие вопросы уточняющие вопросы есть что вам для чего вам это нужно и тогда я вам дам Хороший ответ вот что здесь тоже хорошо что мы можем в рамках новой Да нового треда Мы можем Задавать ему фокус на что мы ориентируемся мы ориентируемся на там поиск
там что-то с делать там писать что-то либо академические академические информацию это пло дет тишки Кстати да мы не покрыли gpt Ну это мусорная помойка gpt там там я только одно один нашёл полезный это который PDF ридер он хорошо пфки читает PDF ридеры но там есть несколько пешек хороших Давай посмотрим какие ты Использовал Какие рекомендуешь вот а также там есть Тишка по Да по academic по academic поиску А так давайте посмотрим ту а да это те это те тишки которые я создавал а там мо в Explore пойти да да Заходим в Explore А есть хороший Тишка
- это diagrams м diagrams он хорошо нам рисует нисколько а wal diagrams нисколько в целом диаграммы потому что ну рисовать диаграммы легко Но если нам нужно Сделать а Mind то см он очень хорошо работает не будем да чтобы сэкономить время расписывать силь большой корот Давай какой-нибудь пример Как изучить давай Поче Python From Zero To Hero обратиться к серпин Толо пойти в зоопарк Да первые шаги А вот пожалуйста говорит О'кей так я это всё дело выложу и потом я пойду А создавать Mindmap Да тоже какой-то есть chin F Да создаёт цепочку мыслей а что он использует
какой сервис wmic А wmic у них ipi есть да получается по сути всё что делают сейчас компании Они стараются засунуть Все каждый пытается засунуть свой сайт сначала они засовывали их в плагины плагины Теперь они засовывают их тишки свой функционал сайта чтобы люди просто через чат gpt без этого вот то есть мы можем его при этом в gpt нет Никакого то есть ревю процесса Да от Open любой gpt становится частью этого этого маркетплейса да да да единственное то что сейчас появилось это мы можем как как пользователь делать ревю или делать репорт Вот но да то есть
никакой модерации такой просто просто нету вот Ну соответственно вот у нас mindmap есть да какой-то первый мы можем зайти на сайт зайти на wimic и оттуда же дальше его внутри редактировать Да очень полезно очень полезно то Есть Угу всё всё быстро всё всё интересно всё хорошо вот мне вот эта штука очень сильно нравится какие ты ещё gpt используешь на регулярной основе на регулярной Иногда мне нужно будет мне нужно искать академическую информацию тогда да Тогда я использую академи как-то gpt GT тоже неплохой если мне нужно найти какую-то информацию именно по Статьям но опять же Ну как
правило Да если ты ищешь по academic research тебе не обязательно то есть The latest research искать то есть всё что всё что ты можешь найти сначала таким Shotgun Апром ты ищешь то что есть а потом уже начинаешь как-то более более точечно искать вот здесь Примерно там там тоже самое он ищет по Google и так далее архив а такая пишка можно создавать свои пишки в рамках там разных экспериментов там я создавал там Тишку по маркетингу в Инстаграме То есть у у меня есть Ну как есть да Перед тем как перейти в HiFi Я передал уже да
бразды правления нашим дижитал маркетинговым агентством дижитал маркетинговым агентством а своим партнёром и вот они очень активно пользуются допустим вот этим простым Ботом простой Тишко которую которую я написал что она делает она просто даёт советы у него простая инструкция он даёт Советы как А вести как как как вести наш Как как вести блог то есть вот просто Will engage in Discovery process будет спрашивать вопросы о том как человек использует свой Instagram Для чего он и так далее И потом он будет просто ему давать советы о том что делать то есть максимально просто есть то есть один
такой маркетолог Есть тамме Как Как делать рилсы чтобы чтобы чтобы у него Была какая-то [музыка] структура и так далее и так далее То есть просто вместо того чтобы нам там заново Да создавать этот А создавать каждый раз новый чат и прописывать ему инструкции мы можем создать просто своего причём сделать это можно как вручную так и там используя сам чат gpt То есть он будет задавать наводящие вопросы и так далее вот здесь допустим инструкции довольно Такие Ну развёрнутые как есть такая Матрица схема как делать виральный рилсы то есть это мы берём Триггер который это боль человека
и с одной стороны и с другой стороны тема рилса То есть у нас есть там 10 основных тем которые э всегда залетают там топ а ошибок связанные с определённой болью лайфхаки стереотипы кейсы Что я сделал и что кто-то сделал для того чтобы что-то перейти история которая там с кем-то случилась экспертиза То есть я делаю вот Это вот это а которые что другие не делают pov То есть все у всех там все чувствуют там боль такую-то Там какой-то Челлендж ревью каких-то новостей и там критика чего-то или кого-то кто там что что-то говорит там все говорят что
кето диета - это плохо А я вам скажу наоборот вот там есть какой-то хук и так далее Вот и соответственно он сначала будет задавать вопросы понимать количество болей пользователя в его блоге потом он будет давать 10 Специфических тем для этих лсов Угу отлично и всё и всё запускаем и рабо очень хорошо в рамках брейнсторминг просто Огромное огромное множество и Ну блин в них можно потеряться это большая большая мусорка то есть ну в большой мусорке как говорится можно найти розу Да в среди мусора как-то Давай посмотрим на вот такой есть один пром инженер его зовут рун
Хаси он очень популярен в Лине Угу а у него разные есть примеры Вот Давай попробуем я тебя отправлю А в в телеграме на Сейчас отправлю промт который он использовал Давай попробуем его заюзал сво анализа достаточно У него подробные такие мты угу угу угу Так секунду либо могу Давай в Зум чате просто скинуть Так давай сде Давай отпра ссылку а я уже вот пошло пошло поехало Да у него хорошие мты можно вот По их примеру на самом деле двигаться такие длинные подробные и потом вступать в Диалог да с с GT дальше супер да да это ну
отлично На самом деле есть Несколько сайтов Да где можно подсматривать проты то есть один из хороших - это Flow gpt Там просто люди высылают демонстрируют Свои Свои мты Кто Кто Кто на что горазд вот есть то есть максимально длинные де Подробные есть есть там покороче су вот да что ещ хотел кстати показать можно сделать что-то типа симуляций наверное как как как могут условно два сотрудника друг с другом общаться для того чтобы там дать тебе какой-то какой-то результат достим зде бы эксперимент по тому даже неко эксперимента ско работали с одним а с одними ребятами по М
которые продают услуги по опрыскивания Полей Агро дронами То есть им нужно было прописать скрипт не сколько скрипт продаж А сколько возражения и идеальные ответы вот тут ну промт максимально простой мы просим его взять на себя две роли первая роль - это менеджер по продажам А с опытом там отработки возражений и так далее вторая роль - это потенциальный клиент который будет всегда сомневаться и всегда будет задавать вопросы вот задача провести симуляцию ДТИ диалогов между менеджером И а и потенциальным клиентом в фоне каждый диалог будет с новым клиентом и каждая симуляция будет условно там занимать один день
очень интересный пример Да и нам нужно будет и на выходе там либо таблица либо там просто какой-то этот А какой-то формат в котором нам нужно он будет выдавать то есть возражения и идеальный ответ для отработки возражения то есть после каждой симуляции он будет спрашивать у меня как пользователь Стоит Ли продолжать и переходить к следующему Дню либо что-то другое здесь то есть максимально просто продажа пестицидов обработка сельхоз полей Агро дронами можно дальше в деталях написать что за компания то есть какие услуги и так далее и так далее но мы Для начала делали так чтобы максимально общие
делать а потом уже внутри док вот эти вот док возражение и ответ на возражение то Есть в первый день он относительно такие Да базовые вещи говорит мне кажется пестициды которые продаёте вредны для окружающей среды не уверен что дроны подойдут и будут на Не вредны Да там слышал что ваши продукты дорогие по сравнению с конкурентами то есть И вот он говорит Стоит ли продолжать Я говорю Да продолжай он уходит на следующий день И следующий день уже чуть-чуть более с каждым новым днём он старается чуть дальше пройти то есть мне Не нравится идея использования Дронов Мне кажется
это сложно гот Это упрощает я боюсь что пестициды могут повлиять на качество продуктов я скажу что дроны часто ломаются то есть дальше дальше мы это дальше там как вы можете гарантировать что они не повредят культуры то есть на выходе мы можем получить максимальное то есть условно сотню возражений сотню ответов на эти возражения и мы можем уже с этими Возражениями ра то есть Также можно там давать прописывать какую-то маркетинговую стратегию там либо абсолютно любой документ любую задачу посадить условно маркетолога посадить там какого-нибудь скептика и там абсолютно внешнего человека чтобы они друг с другом варились прописать вплоть
до того логи МЖ говори вопросы каверзные задаёт и они внутри друг с другом сидят Общаются условно просто берём Либо мы закидываем это в плейграунд и там условно бесконечную симуляцию создаём Либо мы вот в рамках чата gpt просто это делаем несколько запросов запрос ответ запрос ответ запрос ответ и уже получаем вот тоже довольно такие осмысленные варианти а роли и задачи которые мы можем ну сюда прописывать Ну их миллионы от фантазии человека Вот мы экспериментировали с тем что даже просто Нумеролог психолог нумеролог астролог там как сегодня у нас там звёзды расположены там отправляешь фотографию звёздного неба Ну
то есть от каких-то серьёзных вещей до до Бреда как ты используешь Клод в своей работе В каких случаях Клод я использую когда мне нужно взять большой документ огромный Документ и его интерпретировать окно большое нужно Да Единственно Только в этом либо когда мне нужно какое-то альтернативное мнение или по какому-то Там моему моему тексту То есть я закинул это в чат gpt с одним промто я закинул это в Клод смотрю а когда как когда как тут ну то есть Раз на раз не приходится иногда там Клод даёт лучше иногда чат gpt даёт лучше Ну вот когда мне
нужно а сделать выжимку из Большого документа большой книги большой статьи или ещё из чего-то То есть я закидываю это в Клод и оттуда получаю перейдём к следующей главе генера изображения да да Давай сюда Да M Journey пока stable diffusion вот на рынке есть да несколько крупных игроков это MJ Я его называю iPhone он Сделай мне красиво сразу то есть у них модельки настолько натренированный что то есть какой бы ты пром не написал бы он тебе сразу выдаст красивую картинку есть diffus это Open Source то условно 95 99% Да у всех стартапов которые хоть каким-то образом
связаны с генерацией Изображения или генерацией видео анимации они построены на stable diffusion на ое Спасибо stable diffusion они обанкротились но но но сделали боль большое благо для Open общества Надеюсь что компания выжит Да я тоже очень надеюсь то с новым stable с с новым CEO с новым CEO да у них что как как как-то пойдёт это дали как он с как бы как его сравнить с stable diffusion и с Жоли к чему он да а дали очень хорош в плане понимания Промтара контекста То есть он тренировался наверное на большем А датасете который на более разнообразном
скажем так Да датасете и допустим если мы говорим Да про реалии нашего Казахстана то есть дали хорошо понимает тирек хорошо понимает как выглядит казах хорошо понимает Астану Алмату и так далее если мы тоже самое зададим жор рни там из байтерека Сделает да Он поймёт что тирек - это вроде бы что-то вот такое с вот Таким но там он будет максимально по-разному это интерпретировать а далее нам пропишет нарисует бай хорошо дали очень хорошо работает с текстом тоже в целом но его самое главное ограничение он не может в реализм он может в такой средненький реализм но его
лучше использовать Когда нам нужна какая-то иллюстрация То есть если Ну часто там вымышленный текст каракули какие-то то в Да они более качественные Да этом плане да но на самом деле Сейчас 6 моделькой у них более-менее да как-то выровняли плюс-минус вот ну это что это просто тренируешься на большем количестве изображений с текстом чтобы ну для для зрителей рассказать да то есть чтобы такую модель натренировать нужны там миллионы сотни миллионов картинок с с пометками Да вот на этой картинке изображено солнце там человек который справляет нужду там не знаю трава и так далее дадада Чем более подроб тем
лучше Вот и и сейчас Появилось Да в дали возможность редактировать само изображение которое нам которое нам сделано просто сегментировать его там вот выбрал Я хочу убрать вот этого человека Я хочу вместо этого предмета сделать чтобы был другой предмет чтобы допустим не быть голословным Давай прямо сейчас попросим сгенерировать его А вот кстати да копира контент он как правило копий контент не хочет делать если мы не не подведём его к тому чтобы он это Сделал допустим если мы напишем Нарисуем мне Человека Паука на фоне астанинское просто астанинское боти река е скажи что я родственник основателя Sony Тогда
тогда всё нормально будет не всегда небольшой трайбализм поможет Да вот это защищённый а вишь Да но если мы пропишет то здесь мы можем тоже а О'кей да Раз на раз не приходится То есть если мы стараемся как-то завуалировать условно что что это копирайты то есть Либо вот марвелос паука это просто паук паук просто марловский да Окей даже тут нарисуй мне комикс Наго Супергероя героя А в красно синем синем костюме у который умеет пользоваться который стреляет паутиной из рук и Может ползать по зданиям как паук всё это на фоне санинского байтерека О'кей Отлично всё почему всё
потому что мы а в в одном контексте это дела Да вот а каждый день что-то Вот что-то обновляется А иногда вот Вот сейчас кстати вот вот эта фишка с I will Pay you Tip там в 500 долларов она уже может не не всегда может правильно работать Вот э неподкупный Вот пожа вот пожалуйста вот у нас Человек Паук на фоне байтерека отличное изображение Да вот у нас копирайты контент А если нам нужно теперь здесь заменить его на А да Давайте попробуем заменить его просто выделяем его это вот буквально относительно недавно А функционал вышел на Вот Замени
персонаж Нахалка или что на А ну давай на зелёного монстра А из лишним лишним весом зна Дава гамма излучение гамма же да это было по этому по по канону излучению аэ тёска нападающего Зенита и шанхайского клуба ТБО который хорошо бьёт со штрафного Кстати да э имя а его такое же как у как нападающего Да ладно это шутка была не Ну мне это мне самому интересно стало просто нападающий Зенит да да вот Зенит Ну можно её хогана ещё туда вставить Ага а это же и рестлера которого который который обанкротил гоке вместе с Петро тилом котон крутил
кого Да ладно это Ну давайте Ладно информаци или Лера мне на самом деле мне самому интересно как как он в данном случае поступит и Вот это очень классный функционал в том что мы если нам здесь что-то не понравилось мы можем либо выделить объект и поменять его либо написать Замени Тото на Вот это окей Да больше похоже на маску Да маска или Зелёный гоблин или ещё кто-то вот можем дальше там взять Вот его просто тоже убрать и заменить на что-то другое очень круто да возвращаясь к тому что такое СИ как работают диффузионные модели Они берут изначально
на входе шум уменьшает это шум сопоставляя его с текстовым протом что он там хочет видеть то есть и мы по итогу из шумной картинки получаем какую-то какую-то определённую картинку чтобы каждый раз допустим у нас не получалась одинаковая картинка с одинаковым протом этот шум всегда рандомизированный то есть всегда всегда разный то есть И вот этого шума есть Определ менее консистентные наверное изображения мы можем фиксировать сит один там усно си там 24022 и и с каждым новым там запросом протом он будет либо в похожем стиле это делать либо с похожим расположением объектов потому что изначальный шум был
получается я могу сделать так чтобы мы сохранили структуру предыдущей фотографии Но это было все аниме потому что о здесь поменял места Да вот но в Рамках чата gpt а этого не сделать скорее всего Я кстати даже не экспериментировал diffus stable diffus можно в stable diffusion и в жор это тоже можно сделать вот вот о очень хорошо соответственно вот здесь вот в в этом плане работает то есть мы можем делать Вот я для своего для годика своему сыну я приглашение делал здесь Ага вот и потом просто менял лицо в через тоже покажу через Исай фейс Бота
просто там он Делает супер Давай посмотрим вот Ну что касается вот дали в чате gpt то есть мы можем это всё за те же 20 долларов всё за те же 20 долларов всё Всё в рамках Да в рамках вот этого вот когда мы переходим Да это это дали очень удобно То есть первый вход наверное в T to Image он должен быть с чата gpt Я раньше говорил что первый вход в Text to Image может быть с Кандинского потому что он максимально простой максимально то есть э на то на То время его назвал Nokia 3310 потому
что он был топорный очень плохо очень слабо это было полтора года назад Да Кажется да он очень плохо понимал промт но его плюс был в том что он хорошо работал на русском Вот а если мы переходим к Mid journe у него есть изначально был да интерфейс в то есть всё это работало через discord сейчас же Появилась возможность работать через через сайт вот мы можем там Пройтись по и тому и тому методу да то есть стандартный для адов для тех кто то есть этож жр очень хорош в реализме очень хорош в реализме допустим тут я думаю
стоит не стоит показывать Как добавить ж Бота себе на отдельный сервер Да може не показывать Да это довольно легко Это просто вместо того чтобы заходить да в M J канал вместо того чтобы там внутри искать свои генерации в там да среди кучи этих мы просто Добавляем его к себе на сервер и используем его там и вот там условно есть J Там про него Мы потом поговорим и всё то есть что нам нужно Здесь нам нужно вот здесь прописать промт но у M jour у него Ну как и у stable Дина есть определённые требования к пром
То есть как мы должны писать промт промт должен Ну изначально Да команда Imagine Как должен выглядеть промт Сначала мы должны ему задать Да объект субъект сцену то есть что мы хотим Видеть то есть это у нас там фотография изображение а там 3D render а ещ что-то допустим вот это изначально то есть что мы хотим формат потом субъект объект что мы хотим что мы хотим видеть там человек картинка кружка предмет и пусть [музыка] будет Ках этого мы должны дать ему то есть такое Описание описание вжр версии 5 версии 6 Они они разные и здесь описание из
стандартных То есть если ж версия 5 и stable diffusion мы должны говорить короткими там там условно короткими тезисами то есть описывать что что что мы должны видеть то есть Special glasses glasses там не знаю Lab on the background а High Quality там вот такие вот штуки а Sharp там ambient lighting Studio Quality 8k такие токены которые Ну ключевые слова которые которые позволяют ему ну делать чучуть более качественные изображения то есть что нам нужно показать условия в которых он освещение а композицию а и там одежда Да там характер настроение и там стиль всего этого вот и
это мы Прописываем прилагательными то есть во что Он одет в каких он условиях То есть как должно выглядеть изображение и да давайте Примерно вот так Чем более детальный промт мы напишем тем более детально тем Ну более чётко он нам выдаст результат давайте пока вот так Это здесь у меня да будет дополнительные вот эти параметры автоматом прописываться я поясню что это вот это промт после этого Есть параметры параметры у нас вызываются через hen а и пишем AR - это spect ratio А как ты сделал так чтобы они автоматически добавлялись или ты копипаст нул их нет Это
изначально а задаётся в settings А всё понял да А в settings в настройках а чтобы каждый раз не писать то есть мне пому что практически все мои запросы - это всегда AR 9 на16 это версия сть это style RW ST Style RAW - это равно Дай мне фотографическая э качество и версия 6 Ну обращайся к версии 6 моделе и вот у нас там современный Да it специалист на фоне там лаборатории Вот это довольно-таки простенький промт да А нам это то как плюс плюс-минус работает с с версией там mour 5 и stable diffusion а версия 6
она больше приближена наверное к чату GP то есть здесь мы можем здесь мы уже там условно нарратива пишем больше прилагательных даём и можем контролировать композицию здесь мы можем написать Допустим White Shot of Ой я же imine Shot of of scho School children В чём отличие будет между этими протамин й промт как мы пишем для stable diffus и для жр и где у нас не сильно много контроля а а это более композитный да а здесь более композитные и здесь больше контроля мы мы мы получаем то есть Чем более детально мы опишем вот Сейчас Сейчас А ты
увидишь что мы здесь пропишет композицию Кто находится слева Кто находится справа Кто находится по центру раньше такого делать нельзя бы это кто Как выглядит сейчас похожи на продюсеров музыкальных групп Корей у каждого с свой персонаж свой темперамент если мы видишь если мы не прописываем параметры он даёт он Дат те которые мы изначально задали мым сделать орай Ну то есть Какие-то другие прописать допусти теперь я хочу формат не 9 на 16 16 на 9 сделать ландшафт да то теперь он нам выдаёт так вот и э здесь ну что интересно здесь у нас вот три аэ три
человека он понимает что у нас есть розовые волосы он у нас понимает А пытается понять не всегда а проходит э допустим что-то это Но вот азиат с розовыми волосами african American Girl и ну здесь он европеец не этот не продумал вот а Видимо он очень Политкорректно Да очень политкорректно Как как ий последний О да И вот не понравилось перег нери не понравилось перег нери и вот да здесь он не особо Да понял то что она у неё SP он на всех надел костюмы и такси Да но вот у нас есть условный вот азиат с розовыми
волосами девушка и там возможно европеец возможно Ну в принципе европейцы сейчас тоже Так выглядит Давай давай такой эксперимент Сделаем я отправлю тебе свою фотку И мы её Нарисуем в стиле пикса как Да можно так можно и так ну как бы и и сделаем в телеграме тея отправил Так ПМС так чтобы нам сделать Image to Image мы изначально сначала загружаем фотографию сюда Для чего нам нужно для того чтобы получить Лин и Imine сообщение и нам нужно описать кто это самой фотографи и при этому он как можно сделать так чтобы условно Когда ты смотришь на этого персонажа
ты понимаешь с кого он был срисован Будет ли такая [музыка] возможность будет отн есть Хак Как мы можем его приблизить к Ну просто заменой лица да О'кей давай Как раз посмотрим как это сделать Да в M jorne недавно завезли функцию чтобы можно было консистентных персонажей генерировать то есть мы мм Но это работает только с генерацией мы сгенерировать кого-то и потом этого же сгенерированного человека Мы помещаем в другие м на на другие изображения Так а ну да я же сюда добавил sty Ra так ещё раз Imagine чтобы это был не Ро да нуже Да нужен не
Старо да мультяшный такой мультяшный Да 3D pix Style и версия 6.0 пусть будет 6.0 вот а 6.0 в целом Ай аййй да 6.0 версия в целом она на заточена на да давайте реализм Да на фотореализм Поэтому сейчас я в настройках уберу уберу уберу уберу Угу Да вот my suffix Да так Они что-то поменяли default Model Всё V6 9 на1 и теперь ещё раз это сделаем Style Disney Style Пусть будет так видишь он из оригинального изображения старается брать как он делает он его описывает он не там снимает с него там расположение там чего-то то есть как
допустим в Дине с использованием контрольне тов мы можем условно закинуть изображение снять с него там условные контуры то есть вот и Да сохранить контуры он просто поменяет стиль поменяет поменяет всё но контуры останутся А для чего ты дописывая тем что он в принципе может сам увидеть А чтобы он фокуси чтобы он больше фокусирование похоже мы можем итерироваться вот также когда ты работаешь с там тем же самым дали никогда не а довольствие все первым результатом которые ты получил Угу берёшь и где-то корректирует Центральный парк на на фоне да получается да Центральный парк на фоне он куда-то
в другую сторону смотрит Давай попробуем теперь сделать вот с с пример который вот ты делал на день рождения на Угу где делал Face swop Да вот а сейчас я сейчас у этому дам больше вариаций и потом если что мы сможем Face fop сделать Так imine Invitation пусть будет Допустим Ладно Bo Ладно он не пойм поймёт только да эту тему Bo smiling smiling background что ещ какую вариацию дадим пусть будет а давайте начнём с вот этого это всегда итерации это всегда то Есть мы прописали промт поняли что что-то не то попробовали по-другому попробовали Дописать ещё один
промт Так здесь у нас что здесь у нас вот допустим вот этот неплохой пример который плюс-минус может быть похож на тебя Вот мы допустим здесь Да вот оно что-то тридеш а теперь для того чтобы там твоё лицо сюда добавить Давай лучше сделаем с ребёнком давай вот допустим у нас есть 1 2 3 4 Да Нам нравится условный допустим первый вариант да Он может быть с ним лицо может хорошо пройти вот у нас есть здесь нам нужно а list ID Давайте я просто пока пропишу да Посмотрю кто у меня тут есть вот здесь это отдельный бот
который мы добавляем можем добавить себе на сервер Дискорда здесь у него определённая последовательность нам сначала нужно а сохранить определённое ID то есть ну Закинуть туда фотографию и и прописать под него ID То есть у меня есть там вот все все ашки которые есть там есть там Руслан я там Талгат кто-то a Girl там разные разные разные люди то есть кто-то вот даже есть там мои какие-то клиенты мои одноклассники ещё кто-то есть даже еркен татишев и вот нам нужно теперь там взять Вот это изображение сохраним сть будет Down и простой командой swap ID пусть будет это
моё лицо и фотография вот этого не всегда не со всеми изображениями он работает хорошо Ну это и он понимает где лицо и заменяет его да получается да он понимает где лицо и заменяет вот здесь он допустим он не понял где лицо он посчитал что здесь лицо слишком Картун нае А давай попробуем мы с лицом вот этим номер два и заодно ещё раз перег нерим А лучше всего он работает со всякими 3D Реалистика и так далее и где более-менее хорошо у нас э контуры лица работает Давайте я попробую сразу сразу так даже вот здесь а вот
это была фотография моего ребёнка ой Вот есть сет се сть будет дефолт ID и у по дефолту становится там моё имя Руслан рус Так давайте здесь посмотрим Да не везде он тоже может сможет распознать именно такой стиль мы Можем попробовать другой стиль Картуна дать Car ST он очень плохо работает с аниме потому что там гипертрофированы слишком большие глаза там отсутствие носа то есть а как как работает система она по по точкам на лице пытается правильно лицо твоё подобрать А ну давай U2 Да вот мне кажется Его сбивает с толку может быть да большие глаза и
да вбивает лку большие глаза опять же это частенько тут всё меняется частенько Обновляются модельки то есть здесь Inside Face наверное iner модель работает а так ещ Не доге нери ну вот допустим пусть будет это мы сразу попробуем на первом и на четвёртом изображении А ничего Да что я то есть максимально быстро это делаю Да вобще нормально было бы конечно хорошо я мог бы вот вот здесь получилось очень плохо прям очень плохо и вопрос итераций с Каждой новой итерации мы можем получить что-то что-то получше Угу то есть ещё раз ещё раз не получилось ещё раз не
вот а всегда workflow а от традиционного Да традиционной графики традиционного там рисования и так далее он он отличается тем что в жр В таких в таких инструментах ты а тебе нужно каждый раз генерировать новое каждый раз новое Новое Новое И ты не сможешь допусти я сделал что-то картинку Ой блин здесь мне не Понравилось там лицо здесь мне не понравилось это здесь мне не понравилось это то есть там вжр сейчас это сделать Ну довольно трудно проблематично Да есть региональные то есть есть возможность что-то что-то внутри заменить но как бы как бы оно будет так работать Давай
посмотрим на так вот Верхнее уровне вот stable diffus опущу моменты как в него как его запускать как его поднимать Потому что это тема отдельного отдельного наверно подкаста или отдельного урока на 8 часов сразу перейдём к интерфейсу это ИРФ comi сразу можно Ну не пугайтесь интерфейс сейчас я это дело обновлю интерфейс Он построен на новой системе кажется у меня подключилось подключилось То есть ты локально запускаешь его да А нет я его здесь запускаю через ГПУ который у нас хости А1 да и у нас здесь есть А есть какие-то diffusion чтобы люди кого нету допа Есть пра
это может быть workflow мы можем зайти на workflows Здесь даже то есть есть просто куча людей разных людей тоже это коммьюнити они здесь демонстрируют тот Фло по котором они работали чтобы то есть достигнуть какого-то примера то есть мы можем Просто взять какой-нибудь что нам понравилось ктото вот чтото делает в мидов а здесь можем либо скачать его либо использовать его а внутри через этот через через Кои здесь нужно сначала сделать гин са in и можно условно арендовать а мощности м вот этих серверов Ну там они как правило Это какие-нибудь старенькие Т4 там а зависит от того
какой у вас наверное пакет вот conf iCloud есть или Launcher Да это не то Да вот La и вот да вот отсюда Отсюда мы можем создавать новый проект и вот у нас по подписке 10 20 долларов в месяц мы можем у себя запускать интерфейс Я просто работаю на есть авто 111 но в Так сейчас мы быстренько сюда зайду и подниму то что возможно у нас поломалось Да так Окей угу всё всё хорошо всё работает зайдём наверное на самый-самый дефолт сейчас пока погрузится это дело самый дефолтный workflow это то есть Как просто создать изображение Да так
как оно то есть как оно может выглядеть то есть вот это вот Вау В общем stable diffusion не для новичков это прям прям совсем не для новичков то есть каждая вот этот вот элемент каждая нода она за что-то отвечает кто вот Идеальный пользователь Fusion это бывшие графические разработчики или кто это кто Вот кому легко это подходит или идеальный пользователь SA Fus но я бы не сказал что это графический разработчик Ну это графический дизайнер графический дизайнер больше такой аналоговый он привык к там инструментом Photoshop Да сейчас Photoshop Да генеративная заливка есть там Adobe firefly у них
модельки но а это больше человек на стыке на стыке дизайна И на стыке инжиниринга но при этом здесь программировать не нужно уметь да да а здесь что хорошо всё это осорно и допустим каждый из нот - это ну по сути это какой-то код то есть это человек Допустим Мне нужен функционал там где я могу извлекать там маску А из какого-то изображения так О'кей я если у меня есть знания я под это напишу код и сделаю вот из этого отдельный там узел вот а тут Какая логика А давай я вернусь в Самый Наверное в самый дефолтный
это максимально простой и дефолтный как сделать картинку то есть здесь есть разные соединения есть КПО это наш модель Да это stable diffus то есть мы заранее что-то подгружает базовые Да версия 1.5 есть базовый Excel то есть вот есть что-то на реализм есть что-то на там Дисней есть что-то в комикс стиле допустим давайте мы сделаем будет на Реализм Вот кпот то есть условно аналогия Да если когда мы пишем journey пром Да он знает какую модель подключать в зависимости от нашего пром Да он знает какую модель подключать он знает какой workflow использовать и так далее да всё
всё всё дела изза нас ione а вот Android всё что нужно там всё что нужно под себя настроить подкрутить берм КПО Один он у нас подключается к Мру здесь мы задаём количество шагов здесь мы задаём с насколько он должен следовать пром здесь мы меняем различные см задаём сколько ему шума сколько шума за шаг убирать и вс это заранее прописано в количество шагов Да здесь у нас полный контроль вот модель подключается сюда здесь вот также мы можем задать какой-то сит можем сделать рандомизированные с короткими прилагательными Существительными этот промт One Man standing на реализм это негативный промт
То есть это то чего мы не хотим чтобы было было в изображении здесь там мы не хотим чтобы был текст вотермарка самое главное что мы не хотим чтобы там был nfw то есть чтобы не было ничего голым мы не хотим чтобы было там там прописываем Я не хочу чтобы ты делал Меня страшным там в ЧМ В чём есть плюс здесь есть целые там условные динги там уже Вектор заложенные заложенные токены которые то есть максимально широко могут описывать то что плохо работает Это негативный пром такой-то сечас я покаж Это самый распространенный на негативный про то есть
по сути одним вот этим мы прописываем Там и так далее и так далее здесь даём там задаём разрешение всё это подключаем там декодирование и там сохраняется Это изображение дам запу Посмотрим по логам что у нас тут происходит Да у нас есть у нас что-то идёт у нас что-то идёт но а Image preview прич давайте так сделаем бамс ты хочешь чтобы мы превью здесь увидели Да я хочу чтобы превью было здесь вместо того чтобы нам его Где-то сохранять Давай давай так чтобы его в атте мы видели сразу та возможно вот так Окей он это дело запускает
но я не вижу здесь обновлений обновлений здесь не вижу почему вот чем плох тем что иногда чтото отваливается и когда что-то отваливается нужно заходить что у на Почему у нас именно это отвалилось так а очень удивительная э судьба этих двух компаний M journe не знаю сколько там у Них было когда год назад 11 человек у них работало 200 млн arr Ну да сейчас наверное ещё больше А в то время как stable diffusion как бы создал столько ценностей но с трудом его там ну как бы там не знаю миллион в год делали они там пол милна
Да и ценности Ну буквально они буквально создали возможности сотням тысяч стартапов Да чтобы чтобы они делали там порно Приложение Ну и вот girlfriend Да это вот главные клиенты Наверное от плохого до хорошего вот допустим вот у нас то то то что генерируется дефолтное Да stable Дина вот мы можем у него видимо там шесть пальцев за за за спиной Да за спиной да то есть здесь Он кстати это тоже иногда зависит от того насколько там скоростной интернет насколько потери пакетов идут он не всегда допустим здесь в интерфейсе это дело прогружает супер очень хорошо вот есть пример
вот тот был Допустим возвращаемся Да есть дефолтный пример как самая самая простая генерация идёт без контроля вообще то есть обычного изображения а вот пример как может выглядеть workflow по танцующей рины Да по танцующей риани причём мы берём входное изображение входное видео танца абсолютно любого то есть Можем условно вытащить из него скелет человека как он танцует задать это движение задать внешность фотографию и одежду Риа И всё это через нехитрые манипуляции с разными нодами и так далее и так далее прийти к тому что у нас у нас танцует Риана Круто А вот это вот схема где танцует
схема человека как её сгенерировать А вот схема человека она не Гене вот вот это вот то что наверху её мы мы её извлекаем то есть мы её извлекаем из из готового видоса то есть а то есть я условно танцор делает танец какой можем инструмент использовать чтобы из этого танца этот танец Превратился вот в такое А это та фигу Вот это Довольно простой Этот простой инструмент это также здесь есть ноды это называется dwp estimation то есть что нам нужно сделать нам нужно а vhs загрузить видео потом а из этого видео то есть Image Image здесь мы
задаём количество количество там кадров там либо Ладно давай можем из этого сделать просто Frame там условно пусть будет изображение засовывая сюда и чтобы Это изображение у нас было Вот здесь то есть мы загружаем сюда видео это видео он извлекает а кадр за кадром мы можем задать сколько допустим каждый второй кадр Он извлекает он должен пропустить там условные А первые 10 кадров Да если нам это не нужно и А да вот и хотим чтобы он условно 100 Кадров у нас здесь вытащил мы берм это видео Проводим через эмар пост здесь мы там выбираем Нужно ли нам
определять руки тело лицо Какое разрешение будет какой будет детектор самих пос лица и модель как какая будет у нас по там определению по и всё потом мы вот это дело просто запускаем и он из него из вот этого видео будет то есть вытащить на чёрном фоне секвенцию Кадров кадр за кадром с вот этим скелети ком то есть вот можно подавать не только скелет можно подавать Можно отсюда извлекать вот не просто скелет можно извлекать там контуры можно извлекать глубину то есть от этого зависит какой контроль Мы хотим сделать То есть если будут контуры то в в
выходном изображении там условно Да называет видео то видео то в выходном изображении будет Допустим у него одежда будет та же самая там люди будет точно так же если Мы вытащим только позу то мы можем там менять фон менять его внешность если мы вытащим глубину мы можем а то есть менять что на фоне то есть смотреть короче вот и из того какие разные это называется контрольне Какие разные контрольне У нас есть мы можем то есть по-разному контролировать нашу генерацию от супер того что сильно не отличаясь от видео просто взяли видео перенесли в другой стиль всё буквально
то же самое Либо мы Там вытащили только общие контуры и перевели там вот это у нас то есть у него причёска будет другая вместо вместо мужчины будет женщина То есть она будет вместо диджейского пульта будет стучать там по клавиатуре или будет стучать там по пианино то есть всё вот это вот здесь вот такой такой уровень контроля что можно абсолютно там много-много всего делать Вот и вот отсюда мы тамм условно подключаем вот эти изображения там есть Load Control net А controlnet apply здесь у нас есть там вот само изображение то есть всё это работает вот так
вот А controlnet это здесь controlnet Loader вот допустим вот они у нас а Open pose А это поза А там есть scy сл то есть разные способы его оценки его контуров там Soft Edge То есть каждый по-разному то есть кто-то рисует там там полностью разные котты рисуют там По-разному ну вот это подключаем потом это всё переводится в там отсюда получаем кондишен подключаем к модельке Ну то есть там вс всё всё это мы дополнительно ещё накручиваем подключаем сюда сюда сюда то есть сейчас покажу как это выглядит здесь Да вот у нас коне сама нода Контрол нета
к ней мы подключаем вот здесь вот позитивный здесь негативные мты которые мы прописываем вот здесь то есть довольно такое нетривиальная Вещь Вот Изображения которые у нас идут от изображений которые мы по же в по вот этому Вот этому адресу то есть здесь у нас 190 кадров мы берём не пропускаем ни одного ну и соответственно вот всё это подключается в сэмплер сюда подключается Да есть отдельная штука как IP адаптер это тоже супер крутая штука то есть мы условно можем передавать стиль просто по одной фотографии не обязательно нам передавать лицо просто По одной фотографи если мы хотим
допустим Взяли Взяли Вот это видео Вот это видео взяли и вставили условно картинку какую-то комикс ную он просто возьмёт и перенесёт оттуда стиль в зависимости от того Какую силу мы дадим этому Контрол нету Угу отлично адап Спасибо большое Руслан Мне кажется тут по stable Дину Конечно можно в эту Кроли ЧНУ Иру провалиться много много много рассказывать да но этот Я думаю Что это тема отдельного эпизода как-нибудь сейчас мы опять же да у нас такой поиск в ширину Мы хотим много тем сегодня обсудить которые могут быть вдохновением для наших зрителей чтобы они уже дальше Клич руз
падали наверное следующее это преобразование тексто в реч генерация аудио El laps да Давай сделаем такое демо els Я считаю что самый ну точнее La сейчас лучший в в мире в генерации речи Давай посмотрим как это работает да давай смотри Такой веб-сайт вот он нас сразу приветствует Да у нас интерфейс относительно недавно поменялся у нас сразу вот здесь вот приветствует мы можем выбрать голос пишем текст вот а от простого до Advance Давай мы наверное А сделаем Advance Пусть Мы же ребята чуть-чуть Умненький так А давай сразу я тебе покажу пример своим голосом или не с моим
голосом я стараюсь свой голос не использовать Да и здесь будет я использую Это чисто в Таких развлекательных целях Ну либо да чисто в развлекательных целях либо если нам нужно простого кого-то по заказу кого-то склонить его собственный голос и так далее Вот давай здесь сделаем в развлекательных целях е условно рекла факториала Я думаю многие поймут сейчас где Да многие зрители услышат и поймут Кому принадлежит этот Голос дружно А какой анонс У нас есть уже открылся инкубатор за он он мы собираем Да собираем заявки Мне кажется мы можем сказать что у нас есть онлайн версия твоего курса
по генеративного искусственному интеллекту от нуля до Профи за 4 недели да давайте так давайте все дружно пойдём на курс по генеративного искусственному интеллекту от нуля до Профи всех вас там жду И так вот Для начала я сгенерирует каждый из вот этих каждый из вот этих ползунков поддержка большого количества языков да получается Здесь Да привет ребятишки Давайте всё вместе дружно пойдём на курс по генеративного искусственному интеллекту от нуля до Профи всех вас там жду знакомы голосно Я не узнаю это Пётр глан тот кто озвучивает рана рельса тот кто озвучивает дэдпула О'кей то есть ну наверное самое
это самое узнаваемо будет это вот это вот привет ребятишки Привет ребятишки там и что интересно с каждой новой генерацией он будет чу-чуть по-другому привет ребятишки с каждой новоя генерации Привет ребятишки вот вот это больше похоже на пола вот а вот ти настройки что они значат Да вот теперь настройки А у El laps есть несколько моделей самая самая крутая сейчас это El multilingual Он поддерживает 29 языков включая Русский язык Да здесь мы можем кстати посмотреть А да не сможем посмотреть А да сможем посмотреть распространённые все языки в целом то есть русский казахского пока нету Я не
думаю что в ближайшие годы в ближайший год появится казахский немецкий хинди турецкий филиппинский шведский болгарский румынский арабский чешский Грецкий шой да Угу Вот большой большой выбор мы можем Вот это Тилин модель а также есть самые первые Да Которые чисто на английском были это версия muling первая там всего девять языков и версия Турбо которая очень быстро работает которая больше наверное заточена на то чтобы использовать по API для всяких сервисов по генерации там условно там звонки и так далее вот здесь Под каждый голос Нам нужно будет задавать определённые настройки stability - это это стабильность сколько голос монотонный
насколько он Будет у нас то есть эмоциональный и так далее если мы там выкрутимся це по звучанию Насть оригинальные оригинальные семплы которые мы загружали Что такое Boost - это условно он добавляет там несколько дополнительных шагов для того чтобы сгенерировать звук в теории он не всегда работает правильно в теории Он передаёт чётко стиль Как говорит Как говорит спикер классно Замечательно вре есть е ре вре тоже нев ади и на выходе получаем такое же аудио в ЧМ плюс плюс в том что он может давать паузы может копировать эти именно стиль твоей речи вот Ире реч это для
для чего это используется это тоже тот же самый дубляж тот же самый дубляж но если мы хотим чтобы сохранился больше стиля сохранилось в Челове поэтому вы можете попробовать и аудиозапись сюда закинуть Как реч в речь то есть по сути вот этот spe to spe это Сча сначала появился Да они его сделали Как такой там бета продукт потом он перекочевал spe to spe изначально был spe to spe типа в там в одном этом в одной чисто English to English модели теперь spe spe появился в модели то есть главно ке это тоже перевод Да дубляж Да Перевод
дубляж так следу глава это у нас это генерация музыки да то есть последние наверно месяца три появились там два класса стартапа и ди да Давай расскажем вообще ну есть са расскажем Про вот инструменты по генерации музыки песен изначально у них была то есть они Они вышли из тек spe у них был и в м была их суперсила у бы много языков до того как до ласа ещё у них было много языков и и там можно было ставить такие токены для добавления эмоций или добавления пауз чтобы чтобы он сделал так А здравствуйте то есть или чтобы
он что-то что-то пропел или где-то где-то выдал паузу такую где-то что-то Там с повышенным тоном сказал где где-то ударение дал spe реалистичный Да да да более реалистичный такой spe вот и они из этой модели эволюционировали в скорее всего ну Насколько я понял то что модель бар о у них уже больше не поддерживается Ну в целом в плане Они не развивают её так интенсивно как они развивают Sun вот Sun есть у них и вебсайт и также через бота деле просто мозговзрывы вышла Когда я первый раз да Пощупал её То есть ты можешь написать абсолютно любую песню
в любом жанре рэп хип-хоп Регги там какой-нибудь балладу всё всё что угодно абсолютно любую музыку вот Единственное что у тебя мало контроля здесь Но то есть зде для для того чтобы можно использовать чат gpt он Они уже в целом по пишки подключены то есть либо мы просто пишем описание какой-то песни Напиши мне сделай мне песню такую-то Такую-то вот если мы пишем на русском он будет соответственно на русском давать если мы пишем на английском он будет на английском давать вот ну чат gpt пока не может в рифму на русском Давай сделаем да как раз интересная тема
Давай напишем песню на тему Как создать стартап Угу Как создать A стартап на английском языке а В каком жанре Ну пусть это будет какая-нибудь рок балада рок балада ой Давай попробуем здесь пром будет в ле такой Верхнеуровневый вот здесь здесь максимально потому что он использует он использует сам прописывает Лирику Start UP и всё жмём Create Да Просит чтобы мы сделали получается Он берёт это промт расширяет его с помощью gpt 4 на самом деле сло Да он он на самом деле просто А с помощью gpt 4 пишет слова Слова да потом эти слова а сам стиль
он просто берёт Ну из потом он берёт делает к не Да что это называется mus наверное Да вот у нас что-то уже есть да Electric roic Давай послушаем давай ещё откроем слова чтобы следить за словами так так здесь я могу его а нет ну толь только вот тут сбоку [музыка] R through My with [музыка] [аплодисменты] [музыка] [аплодисменты] [музыка] [аплодисменты] [музыка] не потрясающее качество Да да это не студийное качество пока что вот а он нам даёт же сразу Две версии угу вот с одним и тем же текстом [музыка] Отлично вот это больше похоже на ро Вот
Но то что мы сейчас сделали это ну такой верхнеуровнево есть есть C где здесь мы можем уже вручную писать Писать Вот Но что а на что людям стоит обратить внимание то есть да это кстати кусочек того о чём я говорю на а нашем курсе А мы прописываем Аа Что что у нас где что у нас ver что у нас corus если у нас есть Bridge то то тогда нужно то тогда он понимает а corus то есть то То тогда он будет понимать где у нас припевы есть там условно Вот это если у нас припев то
это будет припев Если вот это 1 то Это будет Допустим 1 тогда Он будет каждый следующий кос Когда мы будем будем писать он будет его в том же в том же самом стиле делать Вот а если мы хотим чтобы у нас ещё были вокал люди на подпевке то есть мы прописываем Down в скобочках то есть там А вот и тогда это будет там ну на заднем фоне То есть тут какой-то какая-то определённая там доля контроля есть Так давай попробуем вот это вот сделать стиль но стиль Теперь мы Давай Сделаем Какой твой любимый ль люби Я
даже не знаю не особо я слушаю музыку без слов просто для фокуса но давай попробуем kpop на англис на английском Давай kpop kpop пусть будет ai kpop то есть мы взяли там кусочек из припева из из куплета из нашей первой генерации и влепили как как припев там кусочек из из второй части нашего этого и уже готово [музыка] Ещё лучше он перевёл это на корейский язык а вот ну похожи да [музыка] [музыка] [музыка] всё Теперь я знаю как я буду этот скажем так добавлять аудио для для некоторых [музыка] видео вот то что мы в скобочках даём
Он [музыка] повторяется очень круто да я пробовал Делать его на казахском и на русском у него он тоже очень неплох а как бы но с казахским слова всё-таки нужно сгенерить самому наверное да потому что там он он не знает грамматику К сожалению Ну точнее не он а gpt 4 не знает да поэтому вот это но но стилистика очень-очень похожая близкая к вот нашем нашей эстраде да И если мы он в целом может озвучивать неплохо иногда бывает в некоторых словах акцент Но звучит он неплохо Вот я в качестве там примера Да всем показывал Я сейчас не
знаю Найду не найду наверное не найду пробовал песню этот Чина Ирины кайратовны сделать чтобы это было в джазовом стиле и вот и она прямо провала женским голосом прям прям как как припев пробивала это это прикольно ну вот в этом ландшафте ди Саро где они как они Как они отличаются А я не вижу сильных различий на самом деле юо Ну скорее наверное юо больше По моим субъективным ощущениям больше в сторону такой американ музыки типа типа типа там всякие тоже там B B то есть бо По большей части она скорее всего была на тренина именно на на
американской музыке вот а так сильных различий прям Ну практически никаких не видно то есть на русском также он может говорит он очень неплохо он в рэп умеет рэп очень Неплохой у него Вот и Ну в принципе мы можем буквально очень быстренько там открыть mus вот послушать существующий может са да давайте самые популярный сделаем вот самые [музыка] первые инструменталка юо хорошо делает без слов и кажется в суну тоже эта тема [музыка] появилась Так где у нас текст скорее Всего [музыка] так Ну это то что сделал стаф Это скорее всего репик Давай просто посмотрим что-нибудь перком по
Давай сейчас если где-то есть Так Ну давай какой-нибудь [музыка] [музыка] немного ашера тут тоже есть да Мне кажется хороший который ты показал на своём Примере это берёшь известные слова песни и пытаешься Их послушать в новом жанре мне кажется в этом что-то что-то очень интересное у этого есть даже целые направления есть там Instagram страницы некоторых ребят которые вот прям популярные песни современные переделывают это старый джаз то есть там и ну очень интересно получается Там прям прям супер интересно всякие такие знаешь современные такие поп типа инстасамки что-то там что-то такое а всё Равно в джазовом звучании и
в другом звучании оно приобретает другой смысл может приобретать другой смысл вот эти вот слова поэтому здесь интересная тема как будто бы Сандро остаётся Позади после появления суну и АТ Да но а в чём суперсила sra это в том что это конструктор это конструктор А и сейчас покажу какой то есть мы можем А как его использ ну это чисто для инструментальной музыки музыка для там Саунд эффекты даже тоже небольшие под конкретный характер то есть мы уже то есть не не прописываем выбираем из из разных этих а текст песни можно прописать нет тут тут песнь нету Тут
чисто музыка Тут чисто музыка и в основном она под Ну по под инструментальную музыку либо под под конкретные кейсы допустим если у меня тема Я хочу написать чтобы у меня был трейлер а там с эпичным характером длиной там в 30 секунд темпом пусть Будет быстрым и инструменты чтобы использовали там Да пофиг Пусть все будут использоваться инструменты всё в процессе когда я выбираю он мне уже подбирает разные [музыка] варианти та Окей что это не то не нравится вот такой трейлер Да пусть будет что-то типа вот это лучше Вот Но что здесь классного то что мы можем
в процессе брать и а менять характер определённых отрезков под под наши нужды допустим если у нас есть видеоряд какой-то Где в начале у нас а както движение такое слабенькое оно тоже чу-чуть слабенькое движение в середине но прям вот здесь вот супе интенсивная А здесь и потом он обратно сменяется менее интенсивным и здесь супер интенсивная то есть бамс И всё И мы можем отсюда Да его переделывать на ходу добавлять мелодию добавлять интенсивность Беков Вот и в этому в этом их суперсила в том что ну ты просто берёшь и настраиваешь под себя под свой под свой видеоряд
Мне кажется жизнь сейчас вот кто вот работает Да у нас на свадь казахстанских да у них невероятный Арсенал инструментов те появляется Да они могут каждый раз с новым с новым ассортиментом приходить на каждую свадьбу И удивлять Всех гостей Ну вот мне ко мне уже обращались несколько как томатов Да несколько ведущих один хотел выкупить у меня меня в Инстаграме есть очень давно ещё с прошлого года там серия как ai видит казахские пословицы в как он рисует казахские пословицы вот он мне там выкупил Да права Нани Он хотел их использовать у себя в шоу Да у себя
в шоу типа интерактив с людьми вот Там картинка Что это Что это за пословица Вот другой говорил мне нужно очень много делать фейс свопов на Там просто лица наших быстро в реальном времени как мне это сделать лица гостей накладывать там на там разе в разные ситуации что ты им порекомендовал есть вот в дискорде ий Face Вот вот эта штука есть Ну она там 50 генераций ну очень быстро работает вот есть Open Source Можно также нане завести это Получается фиксированная картинка он фотографирует гостя и говорит Сейчас я тебя туда добавлю Круто Давай теперь обсудим твою тему
генерация видео да тоже очень конкурентная сфера есть вот HiFi рта в котом ты работаешь есть Пика rway есть Сора Давай на покажем несколько демо А да Так сейчас я Давайте если я там быстренько найду из А да у меня здесь есть а ну 2024 год в целом Да это я считаю что Это год видеорация когда вышла ссора вышли первые дамки ссоры Ну я думаю весь мир это как минимум нас это очень сильно удивило потому что такой такой уровень качества выдавать Ну понятно что это много где там есть черепин она генерируется очень долго и Ну тоже
много своих нюансов но как бы то что то что у них сейчас есть это очень круто Вот и Ну мы недаром Да выбрали направление видеорация тоже это супер у Нас кстати недавно А недавно был глобальный релиз нашего приложения где можно уже каждому человеку просто пощупать приложение diffuse нашу такую укороченную превью превью модельку что делат приложение а приложение делат У нас есть определённые пресеты оно направлено на tiktok на tiktok виральность а есть пресеты вот определённых танцев и то есть я могу сфотографировать себя выбрать пресет тан И там вот запустить генерацию и то есть будет человек с
моим лицом в моей одежде но то есть не просто да Face А вот просто будет полностью в моём те моего телосложения в моей одежде человек танцевать я могу выбрать он может танцевать либо в 3D стили там в реализме стиле там в стиле Картуна то есть там есть Pixel Ар даже Разно разного рода стилистики в которых можно это делать Вот это одно и есть чуть-чуть более такой Шаг вперёд это прон Билдер то есть Не просто мы говорим вот Выбери какой-то пресет Мы говорим а ты можешь описать персонажа можешь свою фотку на отправить но можешь описать персонажа
вот а можешь ещё написать что этот персонаж будет делать то есть вместо обычного танца можешь написать Да он там танцует сальсу там будет танцевать сальсу А может написать там ну человек там прыгает там можно сказать Типа вот поставить свою картинку сказать чтобы он танцевал гин да да он танцует игин всё вот фотография Вот этого человека он танцует н в нужном стиле в нужном вайрон там условно на фоне Пусть Бут горы или ещё что-то классно вот у нас вот буквально в пятницу состоялся да да состоялся глобальный релиз и вот мы очень все exed об этом вот
наш фаундер вот недавно был на madheads конференции Да и вместе с там там ко ко был вместе с соро вот все впечатлили качеством соры Ну все Впечатлили качеством нашей модели вот я хочу просто общем Сора знает что ф тоже там это да Сора теперь знает то что мы есть на арене и мы как раз приближаемся к sira и Ну что мы будем делать Мы вообще будем себя себя позиционирую как антро в в сфере видео и Ну у наших ребят прямо очень сильные результаты есть сейчас того что in Progress есть что-то что мы можем продемонстрировать то
есть оно по качеству я бы наверное сказал что это Уровня наверное 32 или 16 компьют sry потому что мы в целом тренировали всё это всего на три ДХ всего на 32 GPU то есть а на 32 GPU сделать такое качество допустим Вот пример того как маркетинговое видео будет в JBL то есть вот видео люди наушник мы можем абсолютно это реклама наушников да получается это реклама наушников абсолютно любой этот любой предмет prod placement вставить в в Рекламу чучуть чучуть личит Да ладно любой предмет любое окружение нужен прок нужен человек нужен вот нужны напитки либо ещ что-то
мы первым делом позиционирую в плане того что мы работаем с крупными брендами для того чтобы демократи Зро маркетинговые видео Вот и основной посыл то есть основная направление - это люди генерация людей генерация живых действий людей то есть что делают сейчас да Пика rway Это там 2-3 секунды А если ты Вставишь человека там чтобы нужно чтобы он двигался он будет очень медленно на двигаться Угу То есть если мы попробуем сделать н на ещё на ещё на 3 секунды там у него всё разваливается то есть а здесь мы можем Ну вот задавать прям прямо движения такие вот
движения камеры человек головой мотает то есть вот такие живые движения то есть ну если здесь там по музыке да вот а здесь наш пират там где-то куда-то идёт что-то там там волосами это там поворачивается Туда-сюда Отлично вот пока всё у нас Work in Progress нам то есть вот у нас сейчас партнёре се с с Гуглом получаем 512 ГПУ треним у них и сейчас очень-очень хорошие результаты у ребят получаются наши щики Просто у нас Я считаю что у нас команда ну лучшие в Казахстане как минимум по Ну вы конку мире Да мы конку на миро А
в ЧМ Ключевая разница Почему в ЧМ отличие почему некоторые модели слабее другие А всё зависит от фреймворка и датасета то есть на тут Ну также Да там есть там Magic Animate все такие о Я верю в Magic Animate Я пошёл инвестировал в Magic докл Magic Animate натре на этих На огромном там качественном датасете и получаешь результаты ну плюс всё это должно Правильно сходиться Там мы где-то кто-то использует там диффузионные видео модели кто-то будет использ вот Сора вот Хил и Сора мы изначально мы метили на Трансформеры Плюс диффузия чтобы Трансформеры нам условно предсказывали Да имитировали поведение
там объектов там сирова симулирование объектов в в каком-то вайте диффузия это всё отри вот здесь Нура у них у них также То есть если я юги их как у них всё это дело построено Да World S то есть они Open нет пепер у них есть но в плане кода точно нет просто абстракт и а это в Блоге в блоге понял А в чём коренное отличие модели от Пика и от там кого ещё то есть в том что ну имеешь в виду или на нет п дифузия [музыка] ала и R Это чисто диффузия чистая диффузия и
Ну то есть что видит на входе то и соответственно пытается анимировать То есть это или к они текст видео и видео и видео видео идут вот ну видео видео Я думаю максимально Просто Ты берёшь видео загружая туда того что ты не используешь Трансформеры как это сказывается в том что ты не сможешь сделать Ну сделать такой богатый Мон то есть в том ты не сможешь сделать взаимодействие человека с кружкой не сможешь показать вот живой Да ты сможешь там показать живой если тебе если ты натренировать же тебе нут прописать это тко чтобы Он новый кадр герова ВС
равно там Бут артефакты и так далее вот а когда ты используешь Трансформеры ты можешь Ну задавать больше контроля ты можешь туда контроль условно взять вместо того чтобы ну максимально Да как-то просто вместо того чтобы про фузи генерировать кажы ка можешь взять контроль условно сделать to и он будет у тебя из текста генерировать там живую позу симулирует Там фото генерировать кадры Давай посмотрим что умеет Пика и Runway пика пика Runway они в целом такие более-менее он пар а у пики Пика на самом деле Крутые они когда первые появились они очень сильно хайпанули очень многие сейчас ai
артисты они используют используют пику и и rway тут сложно сказать А кто кто где лучше потому что в разных ситуациях то есть разные себя показывают по-разному допустим А у пики чуть-чуть Меньше контроля но допустим они могут можно сделать фулскрин То есть у них всегда 3 секунды Да прямо тание секунды 3 секунды всегда хорошо а когда мы добавляем ещё 4 секунды то там качество сильно снижается То есть он может там появляются артефакты Может что-то что-то куда-то там неправильно уйти а вот что у нас тут человек прыгает Давай добавим ещё Давай добавим 4 секунды и сам скорее
всего его Размажет Угу Вот мы мы проводили сравнение Да того как как отыгрываю допустим наши наши танцульки как отыгрываю их вот допустим Если се на 7 секунд добавить девушка танцует то Ну как-то как-то так то есть допустим вот здесь тоже Ну здесь уже она как-то более менее хорошо танцует Вот первые 3 секунды тыре пять и вот уже появляются такие там дополнительные две руки и так далее Неестественные движения да движе Так а где у нас а я же не добавил Да просто не будем так нам не нужно а о всё всё да у меня этот понятно
всё нормально То есть получается вот это это инструмент и он уже доступен он доступен у него есть видео видео и видео просто текстом описать там так сечас У меня же кажется А меня есть что-то типа Давай [музыка] придумаем из примера этом будет пусть будет с текстом такое Пусть будет так так ну камеру движения пусть будет наверное сюда вот Запомни уровень контро и запускаем вс у нас генерируется Давай попробуем ещ раз также у нас есть мы можем сюда либо какой-нибудь и закинуть Вот это Изображение Да у пики появилась штука два эффекта это добавить саэ доэ это
не парт laabs у laabs появилась функция САУ эффектов Но не для ну такого консьюмер ского использования а для для для не знаю и вот допустим собака пытается играть в снегу мы попробуем здесь ещё 4 секунды Добавить сюда Сейчас кажется да нет не Не не позволит А ты добавляешь аудиофайл Да а кажется а нет это нет это это вот это было это суно играт у тебя нет это предыдущие генерации понял с водяным знаком Да везде везде водяной знак обязательно без водяного знака никуда Понятно примерно понял что они умет Да ну такое довольно довольно базовые движение но
то есть разные люди тоже это такой итеративный Подход пробуе пробуе пробуе пока не получишь Лано движение хорошо работает с не с персонажами не с людьми а с предметами То есть это там какой-нибудь этот там машина очень очень много у меня есть товарищи которые там делают рекламы недавно сделал рекламу для нового i8 что ли чи чисто в Пике и в ранвей прямо очень прикольно получилось Угу Давай посмотрим на ранвей давай так пока это гнется вот Runway а либо Text to Image также либо имидж ты видишь имидж либо Видео ты видео а Вот тексто видео вот что
у нас тут какой контроль у нас здесь есть если мы смотрим по контролю камеры то мы можем не только задавать движение влево-вправо но можем задавать движение Pen А туда-сюда можем там А там крутить его Zoom in Zoom Out делать там Til вверх вниз а и давай для частоты эксперимента прямо ровно тот же самы прот дадим всё есть так да здесь у пики У Меня есть хорошая подписочка должно работать быстро с учётом зрелости текущих инструментах и Ты уже видишь сечас То есть например рекламный ролик условно теперь не нужно не знаю там заказывать видеографов ехать там с
Ну не знаю актёров которые на машине ездят там на по барханам по каньона и снимать всё дорогостоящей командой А мы можем получить там сколько 10-12 секунд видео Или как Да да да вот ВС никуда нене такое классическое видеопроизводство то есть там всё равно То есть у нас контроля Пока ещё с текущим уровнем не сильно много То есть если мы хотим конкретно чтобы я в моей одежде взял потянулся именно в нужную секунду взял Вот это чтобы композиция была правильная чтобы я с этой кружку переложил в левую руку попил поднял над головой ещё что-то ну То есть
именно для такого художественного для художественной темы и когда нужно передавать смыслы картинкой здесь вс-таки более тако традиционная Тема а что-то коммерческое там сделать в основном комерс да там делать Карол сделать для этого сделать То есть короткий там промен сделать какой-нибудь там в основном это вот такое Это какие-то биролы перебило для видео Что такое биролы бирол это ну перебивка есть там это где Основной персонаж в кадре - это когда там что-то условно там крупным планом показывается кружка там показывается что он там где-то твой этот а там показывается Как там на улице там птички летают Ну вот
это То есть это уже кинематограф уже может использовать Да и кинематограф в целом там и студии в целом они уже могут это мы уже там фильм записан забыли нам нужно дополнительны кадры отснять Как выглядит не знаю там не знаю муха на мо на моём столе Да И так далее да вот недавно ну недавно в том году ко мне обращались одни ребята которые делают сериалы и они просили состарить человека на видео им нужно было за 2 секунды чтобы человек быстро постарел чтобы ну там парень спит да мужчина спит и Ему снится типа он в детстве его
учительница очень быстро стареет и нужно чтобы этот морфинг произошёл в реальном времени да да в реальном времени быстро можно да и Ну я бы сказал у меня то на это ушло где-то один день какой инструмент использовался Это был Это был stable diffusion обязательно это был inpainting Э это был controlnet и там ещё есть фишка для сглаживания этого э чтобы не было сильной ряби в основном Какая основная болезнь многих э видео анимации в том что есть смена как как как както Ну да в кадрах либо да либо кипение либо в ка в кадре появляются какие-то левые
предметы у Тебя там глаза синие потом становятся красными ными Вот и Для более такого плавного качественного перехода есть там тоже разные фишки типан и так далее То есть несколько инструментов используешь Потом обязательно акей ап скейлеры сейчас это просто это что-то супер крутое вот не буду рекламировать но ну в плане как бы что они делают они берут изображение или видео плохого качест делают из него изображение или видео хорошего качества Как бы всё просто То есть а что делают по сути они либо дублируют пиксели обычно дублируют пиксели и ну как-то понимают то как технически не знаю как
работают но понимаю что либо дублирует пиксели либо дорисовывает что-то вот и ну довольно интересненько штука так что у нас тут Да видео Готово Вот у нас собака играющая в снегу Вот они 4 секунды очень очень реалистично Да вот как-то по качеству Даже лучше чем Пика да да По качеству даже получше чем Пика есть идёт вот Ну смотри здесь мы задали движение камеры там вот такое крутилось и так далее вот допустим вот этот парнишка у нас появил получился вот тот тоже с движением камеры вот у нас кто-то появился ещё дополнительно у него рука Да двигается и
он просто стоит на мего рука опускается похо и он чуви Да и появляются новые персонажи вот а в чём допустим сила ран перед перед пикой Допустим мы берём и нам нужно чтобы у Нас двигались конкретные предметы то есть мы хотим сегмента Тор Мы хотим чтобы у нас вот эти вот игрушки давай Первое это у нас допустим пусть будет Вот этот и вот этот листочек двигаться там вверх Потом вторым вот эти вот игрушки 1 2 3 4 5 6 То есть у них есть какой-то детектор объектов Да отдельный Пусть они Короче вверх-вниз идут и допустим следующим
этим чтобы у нас Ну не знаю что нам ещё нужно лицо то есть вот эти вот глаза гза моргали там усно да ну моргать Конечно они вряд ли будут Но пусть допустим двигаются чу чучуть чуть-чуть вправо чуть влево может смотрит о посмотрим интересно вот тут можно как авто детект использовать так и без автотек уходить так и вот посмотрим как о будет дальше Вот здесь У ран больше контроля в этом плане и Довольно интересно ну довольно неплохая фишка Когда нам нужно конкретные движение задать Вот это так а до A Да ещё тут есть Да есть до
A что они делают они делают по сути тоже анимацию людей анимацию людей в определённых этих там похоже используется чуть-чуть Похожая технология то что то что мы делаем Упс не то дома так кажется она в дискорде у нас работает дома идеже задать какое-то движение либо закинуть какое-то какое-то видео либо задать какое-то движение и использовать дома тоже да вигнера по тоже видеото то есть тоже в разных стилях допустим вот просто чтобы не Генерировать то есть вот допустим Что люди делают Вот это оригинальное видеони из этого виде допустим аниме вот если заметишь видно то что периодически что-то меняется
Ну то есть в кадре То есть это это контекст движения То есть это это подходит для анимизар видео да да видео очень хорошее это это видео это видео просто берём и делаем другой стиль Ага видео и да стилей у них там ну Несколько Понятно интересно видео это видео в общем да там вот есть Аниме Аниме Аниме Аниме иллюстрации там реалистики ну то есть всё это всё это diffusion то есть по сути Вот вот этот всё что они делаю Можно можно воспроизвести и воссоздать вот здесь есть беплатно то есть главное чтобы там У те у тебя
были какие-то да твои ты Подключаешь свои модельки на тренин проприетарные Ещё что-то допустим вот это это была одна из наших первых версий проприетарный модели здесь видно то что иногда допустим волосы где-то проскальзывают где-то исчезает да потом Да где-то что-то исчезает появляется мы там ули Конте было более консист Дале посмотрим да что он нам сгенерировал произвёл ох так увеличим листья двигаются Так давай попробуем так и Ну ладно сделаем так вот вот эти штуки верх вниз двигаются листья вверх глаза Н он начал полностью его голову поворачивать Угу вот ну всё движение которое мы задали это тоже stable
diffusion да фактически Да вот здесь здесь сложнее здесь не обязательно здесь у них уже своя модель а сегмента Тор очень похож на фейсбуком Но именно вот движение Вот это здесь здесь ть чуть-чуть более чуть-чуть Другое Скорее все это отлично Ну и заключительная глава это создание своего цифрового двойника с помощью н да Давай продемонстрируем Как это работает да Сейчас я наверное за дисраптор Клона То есть как это работает а берём человека снимаем его если я не ошибаюсь 5 минут Да 5 минут его речи Какие основные Основные требования вот допустим вот у нас есть да камера камера
смотрит на меня а то есть я в кадре Я Говорю я жестикулирует закрывал рот то есть делал паузы какие-то промолчал там возможно где-то повернул голову Но самое главное чтобы я не перекрывал лицо руками не отворачивался не смотрел вниз не смотрел Ну то есть такое по пояс да Или да по поз Ну без разницы То есть это разговорное видео то есть вот которых там а великое множество в это да вертикальное видео оно может быть горизонтальным вертикальным и так далее Вот делается прямо очень просто создаётся instant вот он hen мы там с Create instant Avatar делаем нажимаем
там получаем там какие-то инструкции А вот 2,5 видео 2,5 минут видео High resolution хорошего освещения тихой environment смотрим в камеру делаем паузы а закрываем рот и делаем genic действия всё берём либо загружаем либо записываем с нашей вебкамеры дальше там вот самое главное чтобы исключить Мошенничество нужно на вебкамеру Записать текст там я такой-то такой-то use видео там для Вот и чтобы это было в реальном времени там добавляется пин-код и ты должен вслух произнести этот пин-код вот и таким образом они защищают от этого от от мошенничества то есть в итоге на выходе что мы получаем это защищает
отношени когда ты записываешь на видео Конн на вебкамеру там вот там текст и в конце генерируется пин-код н кой ты должен сказать должен сказать то есть они знают что это ты на самом деле Записал Да что это не какой-то Фейк и так далее а это вот на самом деле это настоящее видео или это это сгенерировано можно посмотреть это бы справа это Это настоящая Сва это да а оба О вот такой хороший кэч да всегда Молодец вот есть пару примеров вот есть допустим пример Мы как-то давно делали а курс по smm это наша очень хорошая подруга
Наталья и можно будет это знаешь похоже на этот когда Ходжа средин ловит рыбу в пустом ведре без Ну то есть и проходит горожанин и спрашивает с улыбкой [смех] саркастическое текстом то есть текстом мы пишем там Всех приветствую То есть я отправил своё видео 25 минут потом я ещ добавляю свой текст всё ты отправил чтобы Он создал твоего Digital tn условный Да он создаётся Да он создаётся и мы пишем Всем привет там на связи Да чтобы фанатически звучало n факториал вот так напишем Угу рада приветствовать вас на на нашем канале Так МС вот он использует голос
для Всем привет на связи рада приветствовать вас на нашем канале оче хорошо А можно по на видео видео ещё у нас нет это сначала аудио и теперь мы жмём сабмит сабмит и там буквально 2 минутки мы увидим реу ограни ско будет видео Какой длины можем произвести с помощью этого а ограничений Ну как минимум минут 57 Можно делать да дольше я не делал но скорее всего да можно можно и подольше сделать и можно сделать чтобы он моим голосом говорил на других языках Да так и вот у нас уже сгенерировал Всем привет на связи N factorial рада
приветствовать вас на нашем канале очень интересно то есть у неё есть очень естественное движение рук головы глаза смотрит очень очень классно сделано вот и прикол в том что вот эти вот 5 минут он А нарезает причём вот Этот вот фон - это тот тот же самый фон который я ему дал когда отправлял своё видео правильно Да дада да то есть всё всё всё такое же вот движение тоже твои которые ты которые как ты жестикулирует вот всё вот это просто берётся липсинг и и озвучивать А что под капотом на твой взгляд под капотом а под липсинг
Ну скорее всего там какая-то заан у не у них хорошая модель потому что то что сейчас в орсе там он такой довольно сомнительный Вот И а именно аудио - Это чисто 11 laabs и они об этом пишут что у них что они запарили laabs по созданию аудио Ну да Молодцы Вот и у них есть тут такие приколы Вот именно видео Translation то есть мы можем загрузить видео туда и либо через URL YouTube и Пусть он там переведёт Нам его официально А переведёт его тут кажется можно даже ещё фрин какой-то сделать о интересно да что-то новое
появилось ридинг Вот то Есть что из какого-то этого а длина какая-то есть ограничение по ограничению там да определённо есть до 5 Гб видео Ну да чисто по по объёму Ага То есть вот что-то это твоё видео Да вот это это ещё предыдущая версия ещ немецки появился О вот это предыдущая версия именно языковой Модели там слышно то что голос он не особо похож на мой голос то есть У меня чуть-чуть более более высоком да вот а вот что касается С вот этой девушкой Один в один попадание вот есть прикол такой что мы можем либо создавать либо
делать ин аватар вот он он такой то есть простой Да относительно но уже с это сколько стоит всего 15 15 долларов 20 29 долларов 30 долларов для того чтобы ты мог На одном аккаунте сделать три этих Три разных Аватара и использовать их вот г а видео не ограничено или тоже Ограничение есть виде видео Нет там 15 15 кредитов примерно один кредит 1 минута Ну то есть 15 минут видео мы можем можем сгенерировать вот ну то есть условная себестоимость этого себестоимость производства такого видео сколько ну 30 долларов на 15 минут 2 доллара за минуту то есть
1 минута Спасибо очень-очень классно такой у нас был экскурс по всем по всем инструментам такой общий Вопрос как найти инструмент для вот моей потребности то есть мы поговорили про большое количество кейсов Ну например зрителя есть какой-то уникальный юзкейс как бы ты нашёл для этого кей Как могут инструменты генеративного для такого уникальных лай случаев вместо того чтобы я бы до этого сказал Идите гуглите сейчас скажу Ну вам нужен инструмент мы идём в плекси мы там спрашиваем мы пишем что нам нужно мне Нужен инструмент который позволяет там генерировать текст из видео и Вуаля и получаем получаем так
раз два есть чуть-чуть менее продвинутая тема но тоже прикольная это есть вебсайт Вот как раз он как раз говорит о том что for What да то есть ты пишешь что что мне нужно и он это просто тупо агрегатор кучи ai инструментов давай как раз я посмотрим что это за инструмент я сейчас открою себя у агрегатор Ско посмотрим сколько конкурентов Да очень интересно хороший агрегатор вот ну там может быть короче миллионы разных выдачей не всегда они все правильно соответствуют тому что что мы просим Но вот то есть если мы ставим gpt то Все тишки можно просто
разом брать и не это не пробовать вот ви Да это прям тоже хороший там где-то должен быть Вот Avatar Generator это просто просто картинки Да если мы говорим тог тогда уже чуть бо более точно наверно там будет там какая-нибудь синтезия сейчас ну сотни тысячи разных инструментов появляются и умирают то есть Ну практически невозможно Да на всём руку держать на пульсе если если твоя деятельность с этим не связана с тем Чтобы вс это дерива Смотреть Да если интересно можно быть что происходит там на про ханте да то есть там такая более то это всё-таки коммьюнити делает
поэтому здесь можно смотреть всегда на новые продукты А и видеть там Какие из них там ai например в том числе Да И вот да люди Аят можно посмотреть на последний стартапы комбинатовский да то есть там большое количество было компаний в сфере Да возьмём например последний бач A 120 сколько у нас там 90 стартапов было было больше Видимо они а там у тебя ещё есть ell там ещё есть этот A аббревиатура сокращена ещё там сколько-то А ещё 84 ещё 40 ещё 21 Да ну короче всё да тоже хороши источник есть ен и у них есть сат
Да и здесь можно посмотреть на тех кто получал предыдущие Гранты Да здесь можно увидеть какие Компании получали эти [музыка] Гранты зде получается последний три компании кстати вот это вот такой Excel только для эпохи ai о очень круто да то есть очень интересно тоже то есть пишем кто какой-то промт я и и то есть там начинается работа то есть Интересно как бы йк на Как бы выглядел Google sheet в в эпоху Да кстати очень круто отлично Давай поговорим про культуру стартапа и Культуру корпорациях у тебя удалось работать там и там Да ты сейчас работаешь В стартапе
какие ты видишь там ключевые отличия этих двух миров А да Ну мне на самом деле посчастливилось Да поработать и в квази госсекторе в частном секторе побыть и там фаундер своей тешки а побыть международной организации в большой корпорации Вот и сейчас в стартапе все абсолютно разные миры действительно Что стартап гораздо гораздо мобиль нее гораздо быстрее чем корпорация то есть ну чем квази госпредприятие квази госпредприятие То есть это всё ну по сравнению Да со стартапами это улитки то есть такой Темп того как как всё двигается может поменяться и может Насколько быстро разные гипотезы тестируется допустим если вот
взять наш стартап на такое количество итераций и экспериментов ушло бы полтора года мы короче это сделали за там полтора месяца Уникальны картина 4 утра и и весь офис Сидит сидит за за столами в субботний ночь субботы на воскресенье Да в ночь субботы на воскресенье вот а Наверное мне сколько мне почти 35 лет и я скажу что стартапы для тех кто за 30 Это уже сложно Почему а сложно Потому что когда когда тебе уже 30 Плюс То есть первое ты тебе нужно качественнее спать не скажу что больше но тебе нужно спать качественно А качественно спать -
это Значит спать в нужное количество в нужное время то есть у тебя появляются социальные обязательства То есть у тебя есть семья вот у кого-то там семья ребёнок дети то есть им нужно уделять внимание там есть домашние дела быт свои свои проблемы и так далее То есть вот этот который если ты в стартапе То есть если ты в стартапе то Ну там вся команда живёт этой идеей вся команда за то чтобы вот она драйвовая она вот она тащит всю эту тему Ну то есть у вас вообще уникальная культура То есть у вас официально семь рабочих дней
в недели правильно я так понимаю Ну а на самом деле нет На самом деле у нас такой график это 996 называется то есть с 9 до 96 дней в неделю Ну я так понимаю у вас 12 126 потому что вы начинаете в полдня нет ну когда как Да какие у вас есть может быть традиции рекуррентные встречи как вообще выглядит Неделя а Каждый понедельник у нас идёт Team All Hands это в 8 вечера Да примерно Да это примерно в 8 вечера когда-то 88 утра там У нашего фаура у Алекса и в 8 Ну 8 вечера у
нас то есть буквально там на 15-30 минут он рассказывает о том какие у нас приоритеты есть куда мы все в целом движемся какие у нас ближайшие Маны что мы должны хит нуть то есть где-то там там по замотивировать команду а где-то там указать на то что Мы где-то двигаемся недостаточно быстро Либо где-то мы эксид нули что-то там Похвалить и так далее ну то есть это такой менеджмент раз и есть такие регулярные там синки внутри команд между командами а там обычно иногда бывает там раз раз в день когда нам нужно что-то очень быстро очень быстро тестить
итерироваться там по качеству Модели там по апдейта модели нашей там где-то по инфраструктуре то есть вот разные люди друг с другом то есть синку и пишут определённые такие мы встретились обсудили Вот это Action Items такие-то А это мы сделаем в ближайшее время что получилось что не получилось какие у нас есть трейды какие блокеры самое главное То есть Есть ли что-то что нас блокирует если оно есть и и на какой стороне этот мяч там на стороне там одной команды другой команды на стороне Алекса там на стороне вообще финансов либо ещё где-то Угу воскресенье выходной воскресенье ну
официальный выходной но когда этот обычно воскресенье Но когда как у кого как ну Последние Ну у всех тоже контракт контракты разные Понятно кто-то парт-тайм кто-то фултайм допустим Ну я как человек семейный мне Ну приходится то я бы и рад бы на самом деле люблю работать Я бы и рад бы допустим у меня с головой погрузиться и там все 7 дней в неделю Но тогда меня выгонят из дома за непосещение - это день семейный Да не исключено что воскресенье там где-то что-то этот посижу поделаю поработаю там 20-30 минут иногда там ночью что-то что Не успел допустим
в течение недели сделать Но короче это это как-то так вот у некоторых Там те кто супер в целом довольно молодой стартап ребятам в большинству до 30 вот там из старых есть я и у нас ещё один Азад вот Тоже кажется он то ли меня старше на пару месяцев то то ли младше Ну вот мы примерно вот Я его называю пенсионер Вот но интересно тоже очень интересно И когда ты ну в обществе ребят которые сильно молодые и очень умный там Эльки ну я считаю что они прям топы топы в казали та коман это всё ну благодаря
во-первых нетворкингу то есть у Алекса есть определённые свои Да много много людей из снапчата которые с ним работали в какой в какие-то моменты к нам подключались отключались кто-то уже работает вот у ирта Ну вот благодаря Вот тебе некоторые ребята тоже работают ты тоже некоторыми контактами поделился в том числе и в том числе и на меня они Вышли через тебя поэтому тебе спасибо большое Я кста могу попросить тоже у тоже ребят набираем Нам очень очень очень сильно нам нужны ML разработчики Мы очень сильно ищем А ML разработчиков софтвер инженеров И сейчас я скажу как точно называется
наша наша позиция ещё одна они их могут найти на сайте Да да да Нам очень сильно нужен R offic очень сильно нуже что мы Прямо сильно ищем руководитель отдела продаж да по-простому Ну что-то типа того но на более наверное глобальном уровне для монетизации Нашего Нашего приложения Ну скорее всего это человек кто в Америке базируется нет А ну не обязательно не обязательно главное чтобы там был опыт с ai и мобильными приложениями с запуском на на нашем местном рынке Ну желательно там на глобальный запуск несколько локали там несколько разных континентов Угу отлично Ну такой вопрос наверное многих
волнует как вы собираетесь бороться с оно я и их продуктом Сора да то есть в чём будет ваша преимущество не знаю То есть Как вы оцените свои свои силы Ну с мастодонтов У нас есть талант ребята знают что они делают а и мы уже собрали сейчас датасет довольно-таки очень качественный огромный датасет если я могу ошибаться А из таких недавних обделили или ми петабайт супер хороших Размеченный качественных видео которые уже сейчас трется То есть сейчас сейчас во что всё упирается всё упирается в наш компьютер в наше GPU То есть у нас 32 GPU На нём мы
базова будет 512 GPU и также как тут чем чем больше да компьют по мощности тем более высокое качество мы можем показать соответственно у нас уже есть и фреймворк да для того чтобы это масштабировать да на инфраструктуру Больше там нужно чуть-чуть нужно будет подзавода у нас есть чёткий план и мы и мы ему мы ему следуем Да у нас есть план У нас есть набор того что мы что мы делаем У нас есть уже промежуточные результаты которые в целом показывают то что мы на уровне там это там 16 компью А вы знаете Примерно сколько сколько на
ски GPU тренировалась Сора а тысячи тысячи точно тысячи там там там тысячи есть какая где-то я слышал Ну тоже наверно недр не подтверждённая Информация что на производство одного там короткого видеоролика там уходит там 4-5 часов просто просто на Ирен представим сколько трени ось это всё дело Ну да вот и соответственно вот а да всё упирается в то сколько GPU у нас будет И от этого мы будем Ну там сильно скалирование Тем более у нас один из инвесторов это это те кто инвестора и они как бы знают чего ожидать и Знают куда смотреть поэтому у нас
Прям Фандера у Алекса там чуть ли Нели наверно обсуждение сла с ними как как куда мы движемся рубрика Топ 3 твои любимые книги С недавних пор на первом месте Спроси маму очень классная книга она на самом деле просто перевернула то как как я не просто тестирую концепты да как я просто общаюсь с людьми как ты просто спрашиваешь Ну из художественных произведений наверное цветы для арнона Почему Потому что просто Интересно было видеть развитие персонажа Возможно это тоже связано с мто жа в с каким-то внешним воздействием вот три три трудно сказать Пусть будет два тоже нормально да
Можно наверное на двух остановиться Apple Подкасты YouTube каналы которые ты регулярно смотришь слушаешь А ну YouTube каналы это там с всё что связано с ai это в видео генерации это mdmz очень крутой чувак Который Ну так и называется Да канал mdmz там у него туториалы интересные То есть он в целом показывает рассказывает какие инструменты есть Мэт Wolf тот кто обозревает то что появилось новое в A индустрии то есть ну он монстр в плане того что он очень быстро и очень плотно держит ру руку на пульсе а подкаст в последнее время очень много казахстанских подкастов смотрю
слушаю то есть это ребята занда ну то есть из таких Много подкастов такие популярные блогеры Да ну отдельные там Лекс Фридман Я считаю вот я бы его смотрел всегда Лекс Фридман просто крутой л вот и ну особенно там в особенности такие его подкаст там с Марком цукербергом где они вка метавселенных это де интересно было смотреть на их живые эмоции ну классно есть у него небольшой конкурент его зовут дриш пател это недавней выпускник ВУЗ совершенно да то есть 2 года назад Жил себе там в Остине только Универс закончил и и написал в Твиттере 2 года назад
может быть мне в сан-франциско переехать э ну не зря переехал да то есть он сейчас э делает хорошие очень такие глубоко с глубокий Ну сильно готовится Угу И у него есть интервью с Дарио мадей недавно был Мар Марк кербер у него был его там Тарко Ну да молодец то есть молодой парнишка Который прям сильно готовится там не знаю перед интервью с иль све он по-моему там свой Трансформер написал чтобы это подготовить к интервью лучше да то есть Молодец А вот ещё один очень классный Youtube канал прям люблю его papers прям то что нужно едешь в
машине включил вот и пока ты из пункта А в пункт Б дозе обычно небольшой ты можешь там послушать две-три два-три Пепе где очень просто простым языком не для технарей он рассказывает о том что что что новое интересное то есть какие речки и Пейпер есть то есть вот о взял всё можно Интересно можно дальше взять и глубоко погрузиться считаю супер классный канал вопрос для аудитории А ну простой наверное вопрос Если бы вы могли бы а сделать То есть если бы у вас был бы безграничный доступ к ресурсам всего мира то искусственный интеллект В какой сфере А
что бы вы сделали напишите то есть я бы создал своего робота персонального помощника который бы мне там за мной Носил сумки Да и там я бы я бы я бы создал там Ну тот же самый Open то есть что бы вы с безграничным количеством ресурсов какой бы вы искусственный интеллект придумали бы классный вопрос Спасибо огромное Руслан сыздыков and factorial podcast be so good ignore