e Olha só hein seja muito bem-vindo muito bem-vinda a mais um vídeo do Linux chips e hoje nesse vídeo aqui você vai aprender como criar o jeps Sabe aquela I que tá aí fazendo todas as bigtechs tremer aí nos últimos dias sim você vai aprender como executar o gpsc na sua máquina junto com o lama totalmente gratuito sem gastar nada vai executar isso na sua máquina aí ó não é nenhum outro modelo parecido não é o próprio di psic o R1 que é aquele que tem o mesmo poder né computacional o mesmo poder de Inteligência Artificial nível blaster aí da queridinha lá da openen né o o One né o o1 lá que é o modelo mais avançado que nós temos lá na Open n lá no chat GPT e nesse cara aí no jeps que nós vamos aprender como criar ele como fazer a execução dele na sua máquina rodando localmente e usando mais uma vez o olama mano se você não sabe o que é o olama procura aqui no canal Vou colocar aqui ó na descrição do vídeo tem dois vídeos que eu fiz aqui no canal mostrando como que você pode executar o olama para executar uma porrada de outros modelos aí de llm para que você possa chamar de seu aí ou executar usar aí na sua máquina então não vacila tá aqui na descrição antes de começar o vídeo é muito importante falar para você deixar aquele like Maroto certo vamos bater aí o recorde de like aqui bora lá vamos ver Quantos likes nós teremos vai ser o recorde Tenho certeza absoluta e a outra coisa se você vai seguir o tutorial comigo vai lá no comentário e já coloca lá o seguinte ó estou seguindo também o tutorial estou fazendo junto estamos junto alguma coisa para eu saber que você tá nessa também brincando com a gente certo bebe água agora dito tudo isso a primeira coisa que nós temos que ter o entendimento o que que é esse negócio de de psic né Deep psic nada mais é do que o modelo criado por uma empresa chinesa que tá fazendo todo mundo ficar pirado pelo seguinte motivo eles são até 1% é é é o valor que foi gasto pela openni para chegar no ow One Então imagina só nós estamos falando aí de pelo menos 100 vezes mais barato loucura demais né Eu acho que a tendência é isso né cada vez mais a a gente ter acesso a modelos aí de a cada vez mais barato seja aí no momento de treinar que foi o caso da de psic ou então até mesmo aonde executar esses modelos né para executar o modelo de psique aí na sua máquina Você vai precisar do olama então mais uma vez se você não sabe como instalar o olama eu vou até mostrar aqui para vocês que é bastante simples não é nada de outro mundo vamos lá no site do olama para que você possa ver como como que isso funciona e você vai ver como é difícil primeira coisa vamos lá compartilhando a tela todo mundo tá enxergando aqui a nossa querido lat trá da tela lá do site do olama certo e aqui você consegue rodar o olama aí uma diversa numa diversidade de tipos aí no macos no Linux e também no Windows clica aqui em download da vida você vem aqui ó clica em download ele vai te mostrar lá um curinho se você tá no Linux Olha só se tá no Windows faz o download se tá no Mac também faz download mas aqui no Len é lindo demais é só copiar esse czin aqui Maroto ó que ele mostra aqui que tá na sua máquina pronto você vai estar com o nosso querido ol atrado olama instalado certo somente isso nada de outro mundo uma vez o olama instalado aí tá tudo bonitinho Agora sim nós podemos mostrar Olha o estrago lá na na na nos stockes né nas ações da NVidia causado aí pela dips né olha que loucura né Tudo por conta aí dos rumores dos papers lançado uma coisa que é legal falar da dpsc é o seguinte ele é um modelo open source mais ou menos open source Mas uma coisa que nenhum outro modelo ou quase nenhum outro modelo mostra ou deixa aberto é a forma a forma como eles treinaram o modelo o legal da de psic é que eles não deixaram isso aberto né lá para você reproduzir mas ele deixou através de paper então a galera já tá reproduzindo através dos papers lá tudo que foi necessário para que chegasse lá no na versão R1 que é a que tá batendo o ow One lá da openen olha que louco né E aqui nós temos lá então o gráfico que eu falei PR vocês aqui nós temos o carinha né o de PS se você acessa lá o site dips. com né chatd psique. com você vai ter acesso é de grá Por enquanto só que ele tá com várias vários problemas técnicos lá porque tá tendo muita gente algumas pessoas estão falando que é ataque até inclusive né porque tá tendo toda uma uma disputa entre Estados Unidos e China em relação a esse tema enfim é uma discussão bastante longa que nós podemos trocar uma ideia numa Live uma hora qualquer dessas certo por isso é importante se inscrever no canal para ficar atento aí quando acontecer alguma Live depois nós temos aqui ó lá no huging Face hug Face nada mais é do que um repositório Aonde tem uma porrada de modelos open source lá então você vai ter o Lhama lá da Meta né do do Facebook tem diversos outros modelos sensacionais Como é o Mistral tem um monte depois dá um bizu e através do hug Face que você consegue ter acesso a esses modelos e através do olama é que você consegue fazer a execução da maioria desses modelos então vamos lá passar aqui paraa próxima página que nós temos o repositório lá do github do nosso querido lradoilaorado detalhes de todos os modelos deles disponíveis certo isso aquii é o V3 mas se você for aqui ó em de psic ai da vida você consegue ter acesso por exemplo ao R1 que é a grande sensação do momento certo e aqui tá mostrando Quais são os modelos dele que tem disponível né então vai ter de 1.
5 bilhões de parâmetro quanto mais parâmetro mais inteligente vai ser esse recurso porque ele foi imputado foi adicionado a ele mais informações certo então ele conhece mais coisas vamos dizer assim tá ligado 7 bilhões de parâmetros 8 bilhões 14 bilhões 32 bilhões e 70 bilhões e tem aqui o o o zero né com 671 bilhões de parâmetros manja então é muita muita coisa uma coisa que é legal de falar que tem dois tipos aqui ó dois base Model né dois modelos bases um é o Ken Talvez né que é do alibaba se eu não me engano ele é chinês e temos aqui o lama né que é da Meta então é americana então tem esses dois jeitos norte-americano né então tem esses dois sabor cores aí para você se deliciar no lama se eu não me engano é somente o do Lhama não tenho certeza não acho que se P os dois mas o lama é o que eu já tenho testado aqui tem funcionado maravilhosamente bem mas se eu não me engano o Queen também funciona maravilhosamente bem certo dito tudo isso daí já falei aqui do olama também Onde você consegue ver ó Então você vai aqui modos por exemplo ele traz lá no site do olama mesmo Quais são os modos que você os models né os modelos que você pode executar então tem aqui ó de psic o R1 por exemplo vamos clicar nele para que nós f vamos dar uma olhada de como que isso funciona se eu quero executar esse cara eu consigo executar até o de 671 bilhões de parâmetros Mas isso significa que eu tenho que ter uma máquina gigantesca para que você tenha uma ideia eu tenho ele aqui ó eu fiz o download de duas versões do deeps de 14 bilhões de parâmetro e o de 7 bilhões de parâmetros certo um foi 4. 7 o outro 9 GB aí o tamanho aqui na minha máquina ó tô mostrando aqui em cima tem o htp mostrando os cords CPU e também a memória tem o 62 GB memória provavelmente rodaria aqui mais de uma performance assim bem sofrível né dê um bizu aí na sua máquina testa se você tem máquinas mais modernas aí processadores que já estão melhores anad com i mano você vai tirar muito proveito disso né como por exemplo os Macbook mais recente aí os M4 da vida dito tudo isso depois de beber mais um golinho da água espero que vocês tenham feito o mesmo vamos fazer aqui o seguinte então tem todos os modelos aqui que eu posso ter tá vendo ó todos eles Então é eu falei que era só os modelos da liama não né você pode ver que do Queen também rola aqui de buenas como que será que a pronúncia é correta Coloca aí no chat é kwin Ken Ken será Talvez né Vamos fazer o seguinte aqui agora que nós já estamos aqui vamos aqui no nosso querido latr Shell e você que já sabe aí como executar o lama se não sabe tá aqui na descrição né Para que você vai lá aprender no vídeo lá onde eu já expliquei isso e ele funciona basicamente igual o docker manja então se eu quero listar os modelos o lama Lich se eu quero remover o lama rrm e aí eu passo qual que é o modelo que eu quero ah remover se eu quero executar esse cara o lama Run E aí eu passo qual que é o modelo que eu quero executar Então vou colocar aqui ó Run no no de 7 bilhões de parâmetros vou dar um enter aqui e ele vai carregar aqui na minha máquina eu já fiz o download senão ele ia fazer o download lá dos 4 GB né quase 5 GB ia demorar um pouquinho mais aqui já tá feito o download Então nesse momento você já tem acesso ao prompt aí do nosso querido latr de psique R1 de 7 bilhões de parâmetros então eu posso vir aqui ó e e criar sei lá criar uma receita de sei lá lasanha vegetariana coisas bobas aqui colocando mas Lembrando que esse cara aqui ele é um cara que ele pensa né o R1 é que nem o o W One lá ele pensa como assim ele pensa então ele é bom para resolver problemas para você passar um problema para ele para ele pegar e te ajudar em código por exemplo nessa tarefa que eu fiz aqui é bem tranquilo qualquer um vai conseguir fazer de uma maneira bem fácil né mas se você olhar aqui ó O primeiro é o Thinking tá vendo ele tá pensando ó Thinking ele pensa então ele fala assim ó primeiro escolhi a forma de de laça dei que acredito Sera mais comum que é a Francesa Ele ainda tá vendo ó tá trazendo aqui alguns caracteres que não não mostrou mais em chinês tá vendo Então vai trazendo aqui todo esse pedaço aqui é ele pensando em seguida deir simplificar os ingredientes para a preparação optei por um método que minimize o tempo de tudo isso aqui ele vai fazendo justamente é como se ele tivesse pensando ali depois ele vem com a resposta e fala assim Claro aqui está a receita ah de lasanha vegetariana perceba esse cara aqui é o de 7 bilhões de parâmetro ele é um é é é um modelo chinês o português aqui nele ainda não é das melhores coisas ele é fluente aí no inglês até espanhol chinês tem alguma eu acho que são un cinco idiomas Mas ó receita aqui ó trouxe aqui né lazer vegetariana simples e delicios inha e ele começa a trazer todo o texto né do que que nós vamos precisar para fazer isso mas ó mais uma vez ele tá trazendo aqui ainda ó de Ovando algumas coisas aqui é o de o 7 bilhões certo trouxe lá a receita eu vou pegar e vou copiar aqui a mesma frase e nós vamos rodar no outro né Lembrando que esse aqui é o modelo oficial Então não é nenhuma gambeta nem nada do gênero né é o modelo mesmo beleza vamos lá agora rodar o de 14 bilhões de parâmetro aqui você vai ver que ele vai ter uma performance um pouco mais devagar ele não vai ser tão rápido que nem foi o outro porque ele já tem mais parâmetros aí para pensar Enquanto isso você vai vendo em cima Como que está o o o consumo de CPU ó pode ver meus meus processadores quase todos aí estão acima da metade então ele tá pegando e tá fazendo ali de novo aquela linha de raciocínio dele né E tá pensando então ok ó eu preciso criar uma lasanha vegetariana vou pensar sobre os ingredientes principais primeiro a base da a é a base é a pasta shits né que seriam aquelas pastas da Lasanha ah depois as as camadas de salça e e queijo né entre elas e aí ele vai explicando aqui o que ele tá pensando sobre o preparo né como que ele vai criar essa lasanha para mim mais uma vez esse daqui é um modelo muito específico né o R1 é que nem o o One que ele pensa né ele vai ter ali ele vai achando né preparando a melhor resposta para você com olama você pode rodar basicamente todos os modelos que tem lá no huning Face então vai lá depois se diverte né escolhe qual que o modelo que você quer agora começa a resposta dele tá vendo ó Claro aqui está uma receita de lasanha vegetariana deliciosa tá vendo o já tá como tá melhor corrigido tem muito mais parâmetros quando você tá usando lá na interface é aquele lá de 600 e tantos bilhões de parâmetros Então vai ser cada vez mais Redondo quanto mais parâmetro mais Redondo vai ser então aqui você já consegue ver que ele já tá com o português perfeito né não tem mais nenhum problema ali com o português mesmo ele não sendo aí fluente no nosso querido latal do português você não vai ter nenhum problema a partir daqui né do 14 até lá os 70 bilhões por exemplo Com certeza você não vai ter nenhum problema nesse e ele vai trazendo aqui toda a minha receita perceba que já tá com uma performance mais baixo Mas vai depender muito da sua máquina aqui né Daqui a pouco eu mostro aqui as especificações da minha máquina mas você vê que não é uma máquina simples é uma p de processador tá uma pad Ram aí e mesmo assim ela está bem devagarinho só que agora é o seguinte ó vou pegar vou cancelar que ele tá fazendo lá a receita vou cancelar vou sair fora desse cara porque eu quero mostrar o seguinte imagina se a gente tivesse uma interface que nem a interface do chat GPT ou a interface do deeps lá para que a gente pudesse acessar e ver como que isso funciona e na na no Browser né E tem como fazer isso então vamos lá todo mundo executar dá um docker docker Run da vida Opa docker Run esse cara aqui ó bonitinho também está aí eu não sei tá muito grande é esse comando gigantesco que não sei o que dá uma pausada no vídeo Veja com bastante calma e se vocês ó deixa eu até vou descer mais um pouquinho quer ver deixa eu limpar aqui vou descer aqui para ficar porque tá mostrando a minha cara em cima do comando esse daqui é o comando para que vocês possam sair aí utilizando o nosso queridinho de queridíssimo né ó inclusive tá um pouquinho para cá o meu terminal ó por isso que eu tava vendo ali ó que tá faltando agora aqui ó aí desse jeito maravilhoso demais se vocês comentarem fizerem lá um um um esquema bem firmeza lá nos comentários mano faz aquele engajamento bonitinho eu faço o tutorial tudo certinho com todos esses parâmetros que você precisa mas aí eu quero o engajamento de vocês também eu quero que vocês compartilhem tem o botãozinho de compartilhar aqui né do LinkedIn vai lá compartilha o like mano é obrigação tá ligado mas compartilha isso aqui principalmente no ledin mano tá ligado porque é onde a galera tá estudando esses olos ou então vai lá no Instagram sei lá usa criatividade mas ajuda nós bem vou dar um enter aqui nessa bagaça e você vai ver que nós teremos aí ó ele pegou e executou um cara docker PS da vida tá lá esse cara em execução acabou de subir Qual que é o grande barato desse open web Ui é uma forma de você acessar né o grande barato dele é uma forma de você acessar o nosso nosso carinha vou usar essa daqui esse esse endereço mesmo local host 8080 se eu não me engano é onde que ela roda 8080 vou dar um enter aqui ele vem lá falando assim ó primeira coisa a autentique aqui né deixa eu aumentar aqui a tela ele fala autentique aqui né como eu não tenho conta criada Lembrando que tá rodando tudo na sua máquina certo então não esquentem a cabeça eu vou vir aqui eu colocar aqui ó Jeff São desse jeito e depois eu vou colocando todos os detalhes aqui eu quero colocar a senha o usuário ali Vou colocar aqui a senha giro pop só pra gente testar desse jeitinho Maroto simples rápido e fácil nada de outro mundo certo vou lá Create account ele fala aqui tem que ter o e-mail Então vamos lá Jeferson @lin ships.