é o lance é esse é achar o melhor pra sua aplicação né acho que é por aí né po pode passar isso aí que a gente já discutiu gente falou né É o que eu queria mostrar é o seguinte Olha só o cérebro humano como ele funciona quando você vê alguma coisa você tá a a retina já é parte do sistema nervoso coisa que pouca gente sabe E você já tá roteando pela rotina pela retina essas informações que elas são em última análise traduções de foto pelo núcleo geniculado do tálamo até uma área que chama área ocip ital do cérebro ali você tem vários processamentos diferentes Então você tem no Você tem os cones e bastonetes você vai captar cor você vai captar a forma você vai jogar isso separado Você Vai juntando de muitas maneiras e uma hora você vai ter uma representação que tem algum nível de de estrutura que você vai bater com a sua memória para ver se você reconhece alguma coisa vai tagar por assim dizer você daqui a pouco você tem a percepção de que aquilo é um objeto ou o que quer que seja se você escutar alguma coisa você vai fazer algo parecido Mas aí você vai fazer via cóclea eh você vai fazer isso via eh o o córtex temporal você tem né o nervo auditivo é um outro caminho então o cérebro da gente ele não é ativado por inteiro cada vez que você vê um estímulo seria altamente ineficiente se fosse assim redes neurais tradicionais e mesmo Por exemplo quando você usa o Lhama quando você usa um algoritmo desses elas funcionam como esse cérebro ineficiente o o o a Rede Inteira é ativada quando você usa ela quando você escreve um prompt não importa que qual é a natureza do prompt que que de psic fez usou um modelo chamado mistura de experts que é muito bom que que emula essa lógica multimodal do cérebro humano que ativa um módulo de acordo com o tipo de informação tá sendo isso e isso daí traz uma eficiência absurda e melhora muito a qualidade Então essa é outra tendência que veio para ficar e tá todo mundo usando tá e a a Open também já usou mistura de expert não é uma invenção da deeps deeps simplesmente fez um uso melhor de mistura de experts mas isso aqui muda bastante coisa assim na lógica de de de produção de de algoritmos e e produção de resposta boa porque você aí pensa se agora eu tenho várias redes eu consigo treinar as subredes e a elas conseguem ser altamente especializadas então por exemplo o quen ele tem também uma mistura de experts e o que pelo pelo menos é a hipótese que eu vejo por aí eu tava num negócio lá tem um do Mit e tá ouvindo isso semana passada eh e que justamente nessa mistura de expert deles o as coisas de vídeo foram priorizadas entendeu Então essa é essa é uma outra tendência dos nossos dias esse negócio de ter um modelo melhor para uma coisa um modelo melhor para outra cada vez mais vai ser a realidade e esse negócio de um modelo melhor vai se tornar menos comum e vai ser muito mais esse negócio por causa da mistura de experts muito legal põe aí Cris a gente já falou disso e eu acho que a gente e tá bom de de poderos bater papos mais sensacional cara e então e o negócio é o que aí o que que você acha que amanhã Amanhã quando a gente acordar vai tá aí qual que você acha que vai ser a próxima grande bomba nível de psique assim bomba nível de psique tá porque você tá falando de uma bomba de eficiência pode tirar Cris acho que essa é senão as pessoas acham que a gente já tá indo embora para para abalar o mercado assim igual os cara os caras fizeram Ah uma coisa queria falar com você porque foi assim né para para pro pessoal entender a cronologia né o o trump tomou posse e quando ele tomou posse ele anunciou o Stargate né Aham que o Stargate o que que é é uma um investimento diga também ele fez isso porque tava toda galera ali né a tinha que fazer isso é uma grana gigantesca meio B em ah vira assim ó desculpe pr pra câmera lá que senão fica te pegando de costa é meio como que é meio meio bilhão de 500 bilhões 500 Milhões de Dólares não não 500 Bilhões de Dólares 500 bilhões meio tri meio trilh de dólares para ser investido principalmente em infraestrutura em data Centers né É É isso né sim e aí um dois dias depois vem os chinês e joga essa bomba em cima Foi um momento bem Você acha que vai ter alguma coisa assim que que que posso fazer um comentário em cima antes dis é o seguinte Olha só e dá a entender assim o o o salto em eficiência atingido pela de psic que mais vai ser menos importante mas tem um um papo rolando por aí que foi primeir primeiramente ventilado pelo Sat anadela que faz muito sentido que é o paradoxo de devons tá esse foi um economista neoclássico e que diz o seguinte quando o custo de alguma coisa Cai e essa coisa é importante a demanda por ela sobe de tal forma que o output final aumente decai entendeu então assim dado que servidor de a é caro a ia também não cresce tanto tem esse uso e tal mas quantas pessoas por exemplo o chat chpt pro custa 200$ 200 por mês r$ 200 Quem é que tá a fim de pagar pouca gente agora na medida em que eu tenho tanta infra que eu posso oferecer por $2 aí o mundo inteiro usa se for um negócio agi entende o ponto O que que adianta eu ter agi se custa $1. 000 por mês quantas pessoas conseguem nem que conseguem quantas pessoas fazem o cálculo e falam realmente na minha vida mudaria a ponto de valer a pena poucas então o projeto Stargate não é não é ele não é tornado obsoleto pela redução de custo chinesa é pelo contrário a tendência A a você ter um aumento na demanda é muito grande muito grande não acho que que que a coisa se aplica por aí o ponto que eu vejo que é muito mais sensível e que eu não sei eu acho que ninguém tá querendo discutir é que a premissa toda é que você vai enfileirar placas de vídeo mas por exemplo cerebras que é uma uma fabricante de hardware nova que gerou um um um chip Você pode procurar isso na internet porque é tão absurdo que eu vou falar que você que que você você vai achar que é loucura que ele tem quatro qu 4 trilhões de núcleos caramba é sabe qual o tamanho do chip assim entendeu sério então a gente tem essa a gente tá vivendo esse momento em que não necessariamente o em que GPU tá sendo questionado como o grande paradigma entende não é simplesmente por exemplo você tem o questionamento padrão que é o Google Google USA TPU Mas por que que o Google USA TPU o o Google USA TPU porque o é TPU é um é um é um paradigma é uma é uma placa que ela é muito adequada pro para você fazer recomendação insem search em em base relacional de que é que é em última análise o buscador então não vale mas fora esse papo do Google porque assim Às vezes as pessoas falam é tá vendo tem as tpus que são melhores aí isso é papo de bobo não é o caso mas fora desse mundo em que todo mundo usa GPU você tem uns entrantes tem uma tem uma pesquisa andando rapidamente e que talvez indique um um substituto das placas de vídeo eh para processamento de as e agnósticas entendeu não típica do Google que tem lá suas peculiaridades entendi e aí quando você vai para um projeto desses que tem como premissa uma sequência rápida de desenvolvimento basicamente você vai com o que tem E aí você tá falando de um monte de placa da NVidia é tipo igual o Elon musk que falou não eu eu eu tô aqu ele tá montando aquele centro dele que é o maior vai ser o maior do mundo já é né o pra xai e a premissa é ter em algum momento né ou sei lá se é premissa mas é o que ele tá declarando pelo menos a publicidade 1 milhão de placas de vídeo que é muito mais que todo mundo 100. 000 placas é um número escandaloso tá 1 milhão é uma loucura total se discute quantas placas a a de psiqui teria de verdade se é 5.
000 se é 50 o número mais escandaloso possível é 50. 000 Mas é em geral vai de 5. 000 a 30.
000 Mas o que importa é que é muito menos entendeu agora Será mesmo que para você ainda mais nessa mudança de paradigma que a gente tá vendo aqui Será mesmo que enfiler um monte de placa de vídeo 1 milhão de placas de vídeo que você tem que conectar uma na outra Será que que esse vai ser realmente o futuro do da da da da i na sua essência isso que eu que eu que eu queria ver mais discutido sabe que eu não vi essa eu vi essa Eu vi assim eu vejo esse debate mas eu não vi ele no mundo Stargate não vi nenhuma discussão sobre esse ponto em si e para mim esse é o grande ponto porque quando você por exemplo por que que eu não sei se você já parou para pensar uma coisa mas por que que os os os chips eh de são como eles são as placas de vídeo eu vou te dizer porque eles são como eles são Porque existe um negócio chamado empacotamento que é o momento que você corta e a máquina de cortar ela tá setada no mundo inteiro de uma mesma maneira você acredita que é isso não é uma loucura mas é isso essa é a grande verdade entende vai ter que mudar o padrão né então não t falando eles vão fazer desse jeito a questão é será que não é hora de de de avançar um pouco mais em pid por exemplo se eu tivesse num assim pensando do ponto de vista governamental tivesse num país de Alto desenvolvimento com muita grana eu não eu não acho que eu faria um investimento direto em infra sim eu faria um um um investimento com testes de tecnologias de processamento eh antes de escolher eu farei uma fase de escolha de de tecnologia para processamento de a eu não tô tão convencido que é que que é GPU Na verdade eu acho que não é GPU entendeu É isso aí então essa é minha minha verdadeira crítica A ao Stargate não é o fato da de PSI mostrou que não é necessário Claro que não de psic mostrou que é mais necessário do que nunca que então é isso mesmo então você pode quer dizer que se a gente botar um negócio desse de pé a gente consegue ter a infra de a de a do mundo inteiro que é o o grande sonho né do ponto de vista geopolítica é você ser o fornecedor da infraestrutura da do mundo só torna melhor o negócio não pior Uhum agora questão É mas tá bom agora você vai construir um um mega cluster com 100. 000 200. 000 500.