é pessoal hoje a gente vai falar de um assunto que eu nunca imaginei que eu ia falar sobre teoria da mente e inteligência artificial eu já trabalho com inteligência artificial há muitos anos e essa llm tudo que aconteceu agora de Inteligência Artificial desde 2023 colocaram a área da inteligência artificial para começar a fazer testes de coisas humanas que era um negócio impensável 2 3 anos atrás ou até era possível mas era completamente diferente a abordagem e agora a gente já tá falando de teoria da mente que é aquela coisa de você conseguir pensar pelo outro

e começar a fazer aquela coisa bem doida assim ah que que o outro Faria quando acontecesse isso se tivesse acontecido aquilo Porque daí você consegue comprovar se a pessoa tá conseguindo pensar sobre como o outro pensa e é muito doido esse é um dos assuntos mais divertidos que a galera mais gosta de falar sobre psicologia vamos entender o que que tá acontecendo aqui ó nesse tal de Gen x que vai falar sobre imaginação do futuro e tentativa de prever o que que vai acontecer usando i e também vamos falar sobre geração de imagens com Snap

Jan vem comigo a isso aí e vamos lá pessoal Sempre agradecendo a todo mundo que deixou seu like a todo mundo que se inscreveu um agradecimento especial a todos os membros que patrocinam esse canal aqui de Inteligência Artificial E olha que assunto divertido é um dos meus preferidos teoria da mente muitas pessoas já conhecem esse termo teoria da mente mas tem pessoas que nunca ouviram falar sobre isso mas já sabem o que é só não sabe o nome e o caso mais clássico que todo mundo conhece de teoria da mente é o caso da Cell

e da Anne que é mais ou menos o seguinte estão ali as duas a Cell e a Anne e a c tem um cestinho e a Anne tem outro cestinho a Cell Guarda um brinquedo dentro do cestinho dela e por alguma razão Alguém chama ela lá fora ela sai do quarto vai lá para fora enquanto a Cell está fora do quarto A An pega o brinquedo que estava no cestinho da Cell e coloca no cestinho dela só que tá tampado não dá para ver quando a Cell Volta aonde que ela acha que tá o brinquedo

dela e isso daí é a ideia da teoria da mente você tem que raciocinar que a Cell não viu e se ela não viu ela continua achando que tá no cestinho dela e no desenvolvimento infantil e coisas assim esse tipo de teste é utilizado por exemplo para fazer detecção de autismo Mas mesmo no desenvolvimento normal uma criança com menos de 4 anos acaba dizendo não ela vai procurar na cestinha da n porque a criança olha aquilo e ela não consegue se colocar no lugar da cé e coisas assim e a gente chama isso de teoria

da mente e tem vários níveis isso que eu tô contando seria um nível bem Inicial dá pra gente dificultar bastante esse teste e aprofundar bem mais mas vamos dar uma lida aqui pra gente entender a estrutura Explorer Ton da Meta mostra que mesmo os modelos de mais sofisticados incluindo GPT for All tem problemas com tarefas complexas de raciocínio social as descobertas desafiam a liações otimistas anteriores sobre a capacidade da ia de entender como os humanos pensam e é exatamente isso que é teoria da mente você conseguir pensar como outro pensa mesmo os modelos de a

mais avançados como GPT Faro e lama T dificuldades em entender como outras mentes funcionam de acordo com uma nova pesquisa da Meta da Universidade de Washington e da Universidade de carned Melon o o estudo foca na teoria da mente nossa capacidade de entender o que os outros estão pensando e acreditando isso é simplesmente demais se vocês não perceberam a gente tá entrando num nível de Psicologia avançada já fazendo testes nas inteligências artificiais para ver como que tá a inteligência delas comparada com a inteligência humana mas agora já num nível bem sofisticado num nível que até

os próprios seres humanos não desenvolvem muitas vezes testes anteriores à teoria da mente eram muito básicos e poderiam levar a uma superestimação as capacidades dos modelos dizem os pesquisadores em testes anteriores modelos como GPT 4 alcançaram as melhores pontuações e repetidamente estimularam alegações de que os modelos de linguagem desenvolveram uma teoria da mente que é que eles estão chamando de Tom Bem interessante né vamos dizer assim é como se tivesse a teoria da mente dependendo do teste que você faz mas que agora estão fazendo testes mais complexos e a coisa tá mudando um pouco no

entanto é mais provável que eles tenham aprendido com a prática narrativa da Tom e portanto possam passar em testes simples de Tom com essa capacidade e isso é bem interessante parecia que tinha a teoria da mente mas talvez não tenha uma nova maneira de testar a teoria da mente da inteligência artificial para lidar com isso a equipe criou o Explorer t a primeira estrutura para gerar testes de teoria da mente verdadeiramente desafiadores em escala ele usa um algoritmo de busca especializado para criar cenários complexos e novos que levam os modelos de linguagem aos seus limites

gente isso aqui é simplesmente demais é subir a régua da inteligência artificial numa dificuldade que ela não estava sendo testada antes e até fácil de entender porque que os testes eram tão mal feitos antes porque a gente não estava achando que a inteligência artificial ia conseguir resolver tem que ficar claro isso nas Entrelinhas Por que que os testes anteriores a inteligência artificial passou e agora não tá passando porque os pesquisadores facilitaram imaginando que a inteligência artificial não ia resolver e quando ele resolveu ficou todo mundo surpreso e quando a gente fica eufórico a gente começa

a falar notícia não sabe o que que tá falando e aí rola aquele exagero né mas olha que interessante aqui ó o diagrama ilustra o processo de geração de histórias de três etapas do Explorer Ton E aí é o seguinte a definição inicial do contexto passando pela análise estrutural e usando rastreadores de estado mental e até a elaboração incremental de histórias que sonem naturais Então essas etapas aqui ó são as etapas da criação da história para você criar um certo nível de complexidade e um certo nível de enredo que precisa ser descoberto e aí na

etapa um eles levantam um exemplo de um contexto de história colocam as pessoas o local um local alternativo um objeto algumas coisas que podem ser contêiners eu não sei como traduzir isso aqui né mas como se fosse uma frigideira uma caixa de made coisas assim né e alguns tópicos de discussão então ele inventa esses tópicos aqui aí ele vai pro passo B que faz uma atualização dos Estados da amostra aqui ó que são os estados visíveis estados que estão invisíveis né cobrir a maçã por exemplo com chocolate e coisas invisíveis como por exemplo colocar sal

na maçã envenenar a maçã coisas assim que você já entendeu né já dá o material ali suficiente você já tem o local as pessoas e um objeto e algumas coisas que podem acontecer você já começa a criar o enredo na sua cabeça e aí na terceira etapa ele vai gerar uma dificuldade da história com o busca jador de estados mentais aqui né se tava a an e a Bet aqui que entraram na cozinha o que que acontece toda aquela historinha igual contei da série da An ali e aqui na última etapa ele vai preenchendo a

história de forma incremental né Pega o contexto o que que vai acontecer depois e depois e depois e por aí vai para que aquilo que estava em rado se desenrole E aí acontece a história os resultados não foram ótimos para os llms testados quando confrontados com esses testes mais difíceis até mesmo os de melhor desempenho como GPT foro acertaram as respostas em apenas 99% das vezes outros modelos como mixt ilama tiveram desempenho ainda pior às vezes errando todas as questões Isso está muito longe de suas pontuações casas perfeitas em testes mais simples isso aqui é

interessante demais você tá vendo como baixou né a boa notícia é que o Explorer T não é útil apenas para testes ele também pode ajudar a treinar modelos de a para fazer melhor quando os pesquisadores usaram os dados do Explorer Tom para ajustar o lama 3.18b instruct seu desempenho em testes padrão da teoria da mente melhorou em 27 pontos e isso é demais isso é interessante pensa o seguinte gente tudo que foi treinado de llm foi treinado com as nossas ideias do que que era uma inteligência artificial antes da llm surgir então tudo que foi

feito pelos profissionais de Inteligência Artificial até agora foi inspirado naquilo que eles estavam acostumado fazer junta os dados faz o treinamento vê a qualidade mexe um pouquinho nos dados aumenta a qualidade e terminou de treinar tá pronto era assim que a gente da área de Inteligência Artificial raciocinava mas agora não é mais assim gente agora a gente faz uma inteligência artificial cria um modelo de reforçamento esse modelo de reforçamento precisa de algumas respostas certas e erradas ali para ele aprender a reforçar ali e dar uma recompensa pro modelo e ele começa a melhorar depois e

isso inclusive depois já ter sido treinado Então as coisas estão mudando e a hora que a gente começa a ver que tem alguma falha que tem alguma área que ele vai muito mal vira uma oportunidade de começar a Gerar conteúdos naquela área e olha que interessante esse fato de você gerar automaticamente problemas de inteligência vai fazer com que a inteligência artificial comece a ficar mais inteligente nessas áreas isso aí vale para seres humanos e v pra Inteligência Artificial aquilo que a gente estuda a gente fica mais forte e aquilo que a gente estuda pouco a

gente fica menos forte é o normal isso né gente se você me perguntar alguma coisa sobre como que é viver no Alaska eu nunca vivi lá eu não tenho informação sobre lá e a mesma coisa tá acontecendo aqui estamos começando a colocar conteúdos que a inteligência artificial não estava acostumada a ver e olha só aqui ó o desafio de seguir história simples os pesquisadores descobriram algo surpreendente os modelos testados T ainda mais dificuldade com o rastreamento básico de estado Manter o controle do que está acontecendo e que acredita em que ao longo de uma história

do que com a teoria da mente em si e isso é realmente o problema da teoria da mente Porque conforme a história começa a ficar complexa você já não lembra mais quem pensa o quê isso sugere que antes de podermos construir eas que realmente entendam as mentes dos outros precisamos resolver o problema mais fundamental de ajudá-los a seguir narrativas simples perfeito eu já fiz um vídeo recentemente falando sobre se a gente tá criando um cérebro digital e isso aqui me parece justamente os passos evolutivos os passos de aquisição de habilidades que as inteligências artificiais estão

conseguindo e tá realmente maravilhoso acompanhar esses espaços Será que a inteligência artificial vai acabar acontecendo como acontece com o ser humano que a gente segue certas etapas para conseguir aprender uma coisa a gente precisa conseguir aprender outra Será que isso em algum momento vai começar a ser realidade Porque pelo que a gente está lendo aqui é como se essa inteligência artificial tivesse na primeira infância muito pequena ali antes dos 4 anos mal consegue fazer teoria da mente toda confusa ela tem um super conhecimento sobre informações do mundo inteiro mas ainda não consegue relacionar direito não

consegue trabalhar esses dados de forma coerente é mais ou menos como se fosse um bebê super nerd super inteligente mas que ainda não tem habilidade para lidar com as informações que conhece é muito engraçado é muito doido ver isso curiosamente quando se trata de melhorar especificamente a capacidade de um meia de entender a mente dos outros os pesquisadores Descobriram que os dados de Treinamento precisam focar explicitamente na teoria da mente em vez de apenas no rastreamento dos Estados muito interessante né gente todos os dados dessa pesquisa estão disponíveis no huging Face para outros pesquisadores usarem

então se você tem interesse nesse tipo de pesquisa Ó entra aqui na huging face vai ter aqui os dados vão ter as perguntas tudo que tá acontecendo todos os testes que eles estão fazendo eu recomendo demais se você é psicólogo se você gosta de teoria da mente se você quer estudar Inteligência Artificial e Psicologia que você se aprofunde nesse tipo de teste aqui porque esse ano é o ano da Inteligência Artificial geral gente é o ano em que as pesquisas sobre inteligência avançada vão surgir porque a gente já tem o cérebro digital e agora a

gente tá aprendendo a fazer esse cérebro raciocinar fazer ele a refletir eu expliquei no vídeo que passou aqui simplesmente demais aproveitem que nós estamos numa época maravilhosa de mudanças deixa aqui nos comentários O que que você tá pensando que eu quero saber o que que você tá imaginando sobre teoria da mente se deu vontade de você fazer pesquisa também e essa notícia de hoje aqui é simplesmente demais jinx tenta ensinar a inteligência artificial a imaginar o que está por vir e olha que interessante esse desenhinho aqui que ele já dá mais ou menos uma ideia

do que que tá acontecendo tem um carro tem pessoas tem um monte de coisa acontecendo e aqui esse serzinho aqui ó tá perguntando o que que será que tem na minha frente fazendo imaginação e tudo mais e observando ali o ambiente e tentando prever o que que vai acontecer Olha isso os pesquisadores da Universidade John Hopkins desenvolveram um sistema de I que pode gerar um ambiente 3D totalmente explorável a partir de uma única foto que demais gente é realmente criar um ambiente pra Inteligência Artificial viver o sistema chamado genx pode ajudar robôs e agentes de

a a entender e navegar melhor em situações complexas permitindo que eles Imaginem o que está além da sua visão imediata isso é simplesmente uma coisa do Futuro Lembra quando eu falava Lembra quando eu falava que aquele joguinho do Minecraft gerado por ia que era um joguinho super esquisito super zoado mas que ele já se assemelhava um sonho e que essa geração de imagens baseada em Inteligência Artificial que tenta acertar o que que vai acontecer no futuro ela serve Com certeza pra gente tentar elaborar e pensar no que que pode acontecer e isso pode ser aplicado

em robótica Pense nisso como dar as máquinas uma forma de imaginação a capacidade de imaginar o que pode estar na próxima esquina é perfeito quando você tem um gerador de vídeo e você dá uma foto para ele e pede para ele gerar um vídeo você pode pensar do ponto de vista de um cineasta Olha que filme legal que eu fiz se você pensar do ponto de vista da previsão do que que a inteligência artificial acha que vai acontecer aquela geração de vídeo na verdade é uma previsão do futuro porque ela tá olhando para aquilo e

pensando o que que pode acontecer lá pra frente isso é muito doido e olha aqui ó aprendendo com videogames em vez de usar fotos do mundo real a equipe treinou o jx usando ambientes virtuais de mecanismo de jogos como a real 5 e a unit que para quem faz jogos são esses programas aqui que eles usam para fazer jogo isso permitiu que eles coletassem dados de Treinamento ricos e diversos de forma eficiente porque gente raciocina comigo o que que é mais fácil sair na rua e ficar fazendo filme de um monte de coisa ou você

fazer um monte de ambientes virtuais e ficar treinando em cima deles isso é perfeito e isso gente tem a ver com uma ideia do Platão eu gosto de fazer essa relação muito platônica que existe uma diferença entre o mundo sensível e o mundo inteligível mundo sensível é esse mundo construído a partir dos nossos Sensores do que a gente está vendo agora do celular que você tá vendo enquando Você assiste esse vídeo ou da tela do monitor que você tá vendo isso é um mundo de sensações você tá vendo as coisas e o mundo inteligível é

o mundo da inteligência das coisas que a gente pensa a inteligência artificial ela tá trabalhando nesse mundo inteligível ela tá criando coisas dentro desse mundo ela está imaginando coisas hipotetizar de decisão o processo de Treinamento USA esse tal de Cub Maps uma maneira de projetar visualizações 360º em seis quadrados que formam um cubo bem interessante olha só a equipe reuniu caminhos de exploração pré-definidos por meio de um desses mundos virtuais escaneando sistematicamente diferentes direções de movimento para construir um conjunto de dados abrangente e isso ajudou o ginex a aprender a criar transições perfeitas entre diferentes

pontos de vista que demais gente segundo os pesquisadores os resultados são impressionantes mesmo ao explorar até 20 m nos ambientes gerados as imagens permanecem estáveis e coerentes métricas de qualidade padrão mostram baixas taxas de erro sugerindo que o sistema produz visualizações altamente realistas e aqui ó o jinx faz o seguinte ó ele fala assim ó entre dentro dessa imagem e imagine o mundo aqui dentro e ele clica no Explorer aqui e a inteligência artificial vai começar a fazer essa geração e ela vai começar a explorar aquele mundo ali e é muito doido porque é um

mundo meio Fantástico meio fantasioso as coisas se transformam mas as coisas de uma certa forma tão coerente e ele tá explorando ali o mundo 3D sendo uma coisa muito doida né Realmente parece um meio que um Google Maps misturado com coisas de animação E ali a inteligência artificial vai poder se ambientar e vai conseguir viver nesse mundinho virtual aqui muito doido o ginex pode gerar vistas aéreas movendo-se ao longo do eixo vertical dando aos agentes de a uma visão mais Ampla do ambiente como ter a perspectiva de um drone sem precisar dele ai ai ai

isso aqui é muito bom o sistema também é surpreendentemente bom em criar vídeos multiview de objetos enquanto outros modelos de código aberto lutam com essa tarefa o genex mantém Fundos consistentes e iluminação realen ao longo da sequência dizem os pesquisadores Talvez o mais impressionante seja que o genex pode ajudar com algo chamado de mapeamento 3D ativo e olha isso aqui ó Conforme um agente de a explora o ambiente gerado ele constrói um mapa tridimensional de tudo que vê semelhante a como veículos autônomos constroem mapas de seus arredores exceto que tudo isso acontece no espaço Imaginário

do genex e não no mundo real tá entendendo gente ele consegue mapear o espaço dele como se fosse um carro que tá ali detectando as pessoas e percebendo o ambiente e percebendo as coisas que estão acontecendo só que ele tá fazendo isso como se fosse a imaginação pensa agora você assim ó como que faz para chegar até a padaria se Imagina saindo de casa e fazendo caminho a pé é mais ou menos isso você começa a criar na sua cabeça uma imagem e tem um mapa ali você se desvia das coisas Você caminha por esse

mapa e isso serve para você tomar uma decisão inclusive para você pensar em detalhes e coisas para fazer você pode nessa tarefa de imaginação descobrir coisas que você queria fazer que você já nem lembra a exploração imaginativa ajuda e a tomar melhores decisões mas talvez a aplicação mais interessante seja na tomada de decisão de a os pesquisadores demonstraram isso com dois cenários de tráfego No primeiro caso um agente de a se aproximando de um cruzamento não sinalizado vê um carro Prateado vindo de frente então tá aqui ó o carro dele aqui tem um cruzamento aqui

e tem um outro carro vindo de frente com apenas uma imagem o agente pararia para ficar seguro mas usando genex para explorar diferentes pontos de vista ele pode localizar um sinal de parada voltado para o outro carro e decidir continuar dirigindo para evitar congestionamento tá vendo que tem uma placa aqui aqui ó e tá vendo que o llm Minha gente é esse carro aqui então pode ser que ele pense assim bom tem um carro vindo aqui mas esse carro vai parar porque a placa tá apontada para ele e eu devo continuar Porque para mim tá

tudo ok muito interessante hein Ao invés dele simplesmente parar porque ele detectou um carro vindo ele vai tomar um outro tipo de decisão Em outro cenário um agente esperando em um sinal vermelho precisa decidir se deve fazer uma curva à direita complicada por um carro se aproximando e um pedestre cruzando usando genex para explorar vários pontos de vista o agente percebe que está bloqueando a linha de visão entre o carro e o pedestre em vez de apenas esperar ele decide avisar ambas as partes sobre o perigo potencial então aqui ó tem uma pessoa atravessando a

rua tem um carro vindo no retrovisor tá vendo que tem um carro vindo no retrovisor aí o genex tem uma outra perspectiva aqui que ele olha e vai perceber que essa pessoa não tá vendo esse carro aqui e que se ele tivesse tomado uma decisão egocêntrica ele ia ficar parado no mesmo lugar que ele tá porém a decisão que ele tomou aqui é avisar as duas partes isso é simplesmente demais né os pesquisadores comparam isso a imaginação humana não precisamos andar fisicamente ao redor de um caminho de bombeiro para saber que ele provavelmente está bloqueando

a estrada inteira ou contornar um sinal de parada para saber o que está na sua traseira o genex dá aos agentes de a capacidades imaginativas semelhantes quando equipado com genex o agente GPT for All tomou decisões corretas 85% das vezes em comparação com apenas 45% das vezes de um agente trabalhando a partir de uma única imagem ah gente isso aqui realmente tá muito doido eu não tô acreditando no que eu tô lendo isso aquela coisa pra gente assistir em filme em cenários multiagentes a diferença foi ainda mais dramática 95 de precisão com genex versus 22%

100 Isso é realmente um futuro que chegou gente e aqui ele comenta o genex permite que sistemas de a explorem ambientes de forma imaginativa visando fornecer insights equivalentes à exploração física ainda assim a equipe reconhece algumas limitações fazer a ponte entre ambientes imaginados e reais continua desafiador o trabalho futuro precisará se concentrar em adaptar o sistema a dados de sensores do mundo real e condições dinâmicas claro né gente como eu já comentei os nossos estados de desenvolvimento da Inteligência Artificial a gente tem a criação que já passou que foi a descoberta das inteligências artificiais e

das Gerações de mundo Agora esse caso específico é um caso de exploração ainda não estamos em fase de otimização a gente tá na segunda etapa exploração vendo o que que dá para fazer como que faz Quais as alternativas como que a gente vai fazer essa navegação das robóticas funcionarem E por aí vai comenta aqui embaixo o que que você tá achando sobre isso porque eu tô bastante empolgado eu nem tô acreditando nas coisas que eu tô vendo de tão futurista que é tudo isso próxima notícia o novo Snap Jan ai da Snap pode criar imagens

de alta resolução em segundos no seu telefone Isso aqui é bem interessante será que é isso que eu tô imaginando você tem um modelinho de geração de imagem dentro do celular sem precisar ir pra nuvem uma equipe de pesquisadores incluindo alguns da Snap incorporation a empresa por trás da Snapchat desenvolveu um gerador de imagens de a que pode ser executado diretamente em telefones parece que é isso mesmo gente geração de imagem sem precisar sair do celular o novo sistema chamado Snap Jen pode criar imagens de alta resolução em apenas alguns segundos em celulares de última

geração diz a equipe a principal característica aqui é o quanto eles tornaram o modelo de a menor enquanto geradores de imagens populares como o sd XL que se a gente for traduzir é stable de Fusion Extra large que é o modelo de stable diffusion do tamanho gigantesco usam cerca de 2,5 bilhões de parâmetros o Snap Jen precisa de apenas 379 milhões realmente é bem menos e eu fiquei até na Mena dúvida se o sd XL Só tem isso aqui acho que até mais mas vamos lá tornando cerca de sete vezes menor isso ainda mais compacto

que o pix art Alpha da Huawei outro modelo de a leve e otimizado para uso em telefones Isso significa que as coisas para celular estão chegando né mesma qualidade em um pacote menor de acordo com a equipe da Snap tornar o modelo menor não prejudicou o seu desempenho na verdade seus testes mostram que ele pode realmente ter um desempenho melhor do que seus concorrentes maiores muito bom gente olha Vocês estão entendendo isso significa que os preços vão baixar Isso significa que talvez a Nvidia perca uma boa parte das ações dela porque a gente não precisa

de uma super inteligência como a gente imaginava que precisava e o preço deve baixar Com certeza né alcançamos o modelo t2i extremamente eficiente que supera amplamente muitos modelos de parâmetros multibilionário existentes como SD XL lumin next e playground V2 escreve a equipe ao medir como bem o sistema combina imagens com descrições de texto o Snap Jan obteve 0,66 no bmk gen eval superando pontuação de 0,65 do SD XL e aqui tem umas imagens geradas aqui ó um carro feito de vegetais ó aqui o carrinho feito de vegetais um fantasminha adorável segurando uma abóbora em formato

de coração com o fundo de uma casa mal assombrada ali ó ó bem bonito bem interessante e bem responsivo bem interessante mesmo demais gente demais eu não sei se Vocês entenderam o que tá acontecendo aqui é que o modelo que antigamente era gigante e pesado que jamais rodaria no celular vai começar a rodar nativo no celular sem precisar ficar acessando a nuvem o sistema realmente brilha quando se trata de velocidade os geradores de imagens de a anteriores eram muito lentos ou muito grandes para funcionar bem telefones mas o Snap Jan pode gerar uma imagem de

alta resolução de 1024x 1024 pixels em cerca de 1,4 segundos e um Iphone 16 pro Max e aqui eles mostram a geração ó e aí ele colocou ali o prompt ó vai dar um generate ali um cartoon vibrante daurada boreal E aí gerou basicamente foi piscar o olho ali e já tá gerado vamos ver se ele vai fazer mais alguma coisa outro prompt vamos lá colocou de novo ó outro outro negócio do vangog generate Ali vamos ver vamos ver vamos ver 1 2 3 4 gerou ali o corg o cachorrinho muito bom gente o negócio

tá bem rápido e tá bem responsvel bem interessante isso a equipe diz que alcançou essas melhorias examinando sistematicamente as escolhas de design de arquitetura da rede para reduzir os parâmetros do modelo e a latência garantindo ao mesmo tempo uma geração de alta qualidade eles também simplificaram o decodificador a parte que transforma a saída de ia em imagens finalizadas tornando-o 36 vezes menor do que oos sistemas semelhantes maravilhoso gente e eu sempre comento para vocês a Inovação tem três etapas a invenção que é quando a tecnologia não existia as melhorias que é quando você começa ali

tatear e depois por fim a otimização a geração de imagens já está na fase de otimização a criação já foi lá em 2023 2024 foram as melhorias e agora estamos na parte de otimização e nessa hora esses números de 36 vezes menor todas essas coisas começam a fazer sentido para fazer seu modelo menor funcionar tão bem quanto os maiores os pesquisadores deixaram seu modelo aprender com sistemas de a maiores como sd3 o sd 3.5 e a versão de poucos passos do SD 3.5 chamada de sd3 P5 lar de turbo para acelerar a geração de imagens

isso aqui que a gente chama de destilação né quando um modelo grande ensino pequeninho eles também desenvolveram um processo de Treinamento especial que pode reconhecer quando certas tarefas são mais difíceis para o modelo menor aprender e ajustar o processo de ensino de acordo Olha que interessante gente isso tem tudo a ver com o aprendizado porque é aquela coisa humana também quando tem um assunto mais difícil tem que estudar mais e certos assuntos são mais fáceis de aprender na Inteligência Artificial não é diferente e basicamente quando você pega um assunto mais de difícil você tem que

ter dados de Treinamento especializados naquela dificuldade ali já contendo um certo balanceamento em relação a todo o resto dos dados porque parece boba mas é real a inteligência artificial se ela fica Estudando muito uma coisa só ela fica muito propensa a só pensar naquilo e quando você tem dados diversificados e você tem uma dificuldade balanceada também fica perfeito eu tô super empolgado O que que você pensa em relação a isso Bateu aquela animação parece que 2025 vai ter muita coisa saindo pra mobile vai ter muita Inteligência Artificial rodando no celular pode ter certeza até o

final do ano esses modelos que esse ano eram super caros e super inteligentes vão est pequenininhos baratinhos dentro do celular e a gente vai conseguir usar sem precisar de Internet isso vai ser simplesmente maravilhoso comenta aqui o que você tá pensando se você quiser apoiar o canal para continuar vendo vídeos como esse seja membro os membros TM acesso ao grupo do WhatsApp e vídeos antecipados É isso aí deixa seu like valeu

iA Reprova em Testes da Teoria da Mente, GenEx Cria Mundo Imaginário para iA e Novidades no Celular