Name: ChatGPT quer fazer tudo por você; essa outra IA é capaz de aprender sozinha
Duration: 15 min 1 s
Channel: Olhar Digital
Description: E como não poderia deixar de ser hora de repercutir esse assunto com a nossa coluna semanal Fala aí. E vamos receber Roberto Peninelli que é físico pela USP com especialidade em machine learning po...

E como não poderia deixar de ser hora de repercutir esse assunto com a nossa coluna semanal Fala aí. E vamos receber Roberto Peninelli que é físico pela USP com especialidade em machine learning por Stanford e colunista aqui do Olhar Digital. Vamos receber o Pena aqui nos nossos estúdios.

Olha o Pena com cenário diferentão hoje. Vai escalar Pena. Tô vendo uma corda ali atrás, parece que vai fazer alpinismo.

Boa noite, bem-vindo, querido. Tudo bem, Marida? Eu adoraria escalar hoje, mas não posso, né?

Isso, na verdade, esse aqui é o nosso cenário aqui da Caramelo Biônico, que é a minha empresa que desenvolve coisas com inteligência artificial. Tô fazendo hoje, eu tô nesse cenário porque eu tô fazendo um pouco de hora s aqui. Tô terminando de editar um vídeo que vai inclusive ao ar amanhã.

Então, para quem tiver curiosidade aí de ver um vídeo sobre a amanhã, vai tá lá no caramelo biônico. Mas enfim, vamos falar do que interessa, Marido. Vamos falar sobre essa nova questão da Openi va dar o documento da Openei, Marisa?

Pois é. Pois é. E aí trouxe algumas informações, digamos, em primeira mão de quais são os projetos, não é, da Open AI.

Mas até eu queria que você falasse aqui com a gente, Pena, sobre esses planos futuros da Open AI, se eles são muito ambiciosos ou se realmente eles são factíveis, podem sair do papel e mais se os usuários vão adotar esse estilo de vida, digamos assim, com esse assistente pessoal tão próximo do nosso dia a dia. Primeira coisa é notar então que de fato parece que a Open foi construindo passo a passo seus recursos para chegar nesse ponto de ter esse super assistente, né? Não sei como que a gente pode chamar.

Então, primeiro que a gente viu, os modelos de raciocínio são aqueles capazes de fazer tarefas mais complexas, com planejamento, né, um pouco que não é só aquela resposta rápida, podem pensar a respeito. Depois a gente viu os modelos multimodais que eles podem eh ter texto, imagem, áudio, vídeo. Isso é essencial para você ter um assistente na sua vida que vai poder compartilhar aí vários sentidos com você.

Depois a gente eh viu também a memória de longo prazo, Marisa, que é uma tecnologia eh fundamental para que você tenha alguém útil na sua vida. A pessoa tem que lembrar tudo que ela vai tendo na sua vida. Esse assistente tem que ir recolhendo informações do seu cotidiano, do que você faz, de quem é você, etc.

Para ser útil. Então, quando a gente viu essas três tecnologias sendo lançadas aí e meses a meses, então agora parece que eles desvendaram o seu grande plano, seu plano aí maquiavélico de dominar o mundo, será que é então dar esse super assistente, alguém que vai est permeando a sua vida, que vai poder fazer meio que tudo para você, né, tudo intelectual junto com você, desde fazer uma lista de mercado, fazer um um uma exercício de academia, dar um prognóstico, te te dá informação. ações úteis quando você precisa, resolver alguma coisa do seu trabalho.

Enfim, é isso que eles estão dizendo. Mas também vem grandes desafios, Marisa, eu não acho que é tão fácil não. Primeiro é que vai precisar de muita energia e muito processamento, porque aí você vai ter alguém que vai estar meio que o tempo todo recebendo informações de você, compartilhando com você, né?

Alguém que vai poder tá acessando, digamos, a eh sua sua informação em tempo real. Então isso aí já acho que vai faltar, porque a a própria Opii já tá reclamando, tá faltando processamento para atender os pedidos normais. Imagina quando tiver escalando para esse super ultra assistente.

E outra coisa que vai faltar um corpo também, né? Porque eh será que é o celular é esse corpo, né? Você tem que tá carregando isso o tempo todo, mas o celular é sempre essa coisa meio inconveniente.

Tem que tirar eh eh abrir a câmera, fazer não sei o quê. E aí, Marisa, eu acho que a gente conseguiu umas pistas do que tá por vir, porque a Opna recentemente comprou uma empresa que é do designer do iPhone. Então, o designer do iPhone que trabalhava na Apple, ele ele eh saiu faz um tempo, fundou uma nova empresa de dispositivos físicos que meio que revolucionários.

A Openai comprou essa empresa, chama Love from IO. O o nome do cara é, se eu não me engano, é Jeff Ive, eu acho que esse é o nome dele, ou John Johnny Ive é o nome do do CEO. E agora parece que a Openei quer lançar um novo dispositivo, não vai ser um celular, vai ser uma coisa, sei lá, que você vai prender no pescoço, que você vai, não sei, que vai talvez embarcar essa IA toda para ser esse super assistente.

Tudo isso, Marisa, eh são muitos desafios pela frente, né? Mas do jeito que a Opna está realmente comprometida e tá jogando tudo, talvez a gente vai ver, né, eh, a o documento vazado dizer que é a meta do primeiro semestre agora, né, desse ano, de 2025. Eu acho que não chega, mas quem sabe chega até o final do ano a gente tenha, digamos, esse super assistente.

Não sei. Pois é, isso imaginando uma grande escala ainda, né, Pena? Porque se é o projeto de fazer parte da vida como um assistente pessoal, imagina-se que vai incorporar a vida de muita gente.

Praticamente todo mundo que usa ali um celular vai querer ter o seu assistente. Aí precisa saber o realmente a capacidade de entrega disso, né? Bom, vamos acompanhar para ver se esse vazamento se consolida nesse ano ainda.

Agora, pena, vamos para um outro tema que é uma tecnologia recém-lançada que a 11 Labs trouxe uma nova inteligência artificial que é voltada para conversas. O que ela traz de novidade? Conta pra gente.

Eh, legal que a Eleven Lev está aparecendo aqui. Eh, eh, normalmente ela não aparece numa dessas empresas que a gente sempre fala, né? não é uma bigtech, enfim, mas ela cavou um nicho muito específico, Marisa.

Então, ela se especializou em voz, em sintetizador de voz, gerar vozes realistas, gerar vozes eh que realmente clonagem de voz. Então, muitas pessoas acabaram usando os recursos para, né, digamos, uma pessoa como eu, que faz conteúdo, então a pessoa fala assim: "Eu vou ter que ficar narrando meus textos o tempo todo, eu vou treinar minha voz e aí eu ponho o roteiro, a voz fala por mim", né? seria, por exemplo, um uso, mas tem vários usos diversos para as pessoas que precisam de vozes que falam.

Então, a Lev se especializou nisso, mas agora ela tá vindo com uma novidade, ela tá entrando também para entregar o modelo conversacional. Então, não é só a voz, eu entrego também a inteligência junto. Claro que ela integra isso de outras, né, Gemini, Open, etc.

Mas o que que ela tá entregando? Então, o modelo avançado de voz deles é melhor do que o que a gente tem, por exemplo, na Open AI ou no Gemini. Por quê?

Porque eh, para quem usa esses modelos sabe que se você tá conversando e de repente dá uma hesitada, né? Digamos que eu tô lá pedindo uma informação, ah, hoje eu quero saber sobre, aí eu tô tentando buscar na minha cabeça o que eu quero saber, a resposta já vem toda errada, porque a pessoa, o modelo, a, a inteligência artificial não ouviu você até o fim. Ela não conseguiu sacar que a sua informação ainda estava esperando, hesitando.

É normal conversa com humanos, o humano esperaria, né? Se eu tô conversando com alguém, a pessoa não vai me interromper no meio e fala, ela sabe que tá precisando de mais informação que eu tô buscando na mente. Então isso é o diferencial que agora Eleven Labs tá trazendo, o modelo esperto suficiente para saber que, opa, você tá hesitando, vou esperar um pouco mais, vou ficar aguardando aqui para pegar a informação.

Mas tem outras coisas legais também que esse modelo dá. Então, a outra é você poder colocar várias vozes diferentes numa mesma conversa. Então, isso pode ser útil.

Você tá gravando um podcast que você tem vários pessoas ou sei lá, um filme que você precisa de vários atores. Eu não sei que que as pessoas vão querer fazer com isso. Então, assim, você pode jogar várias vozes na mesma conversa.

Isso é bem legal. Ele detecta automaticamente idioma também. Então, você começa a falar em outra língua, você não precisa passar informação nenhuma.

Já automaticamente esse modelo de voz de conversa já muda para outra língua. E também ele faz o que a gente chama de hag interno, que é um sistema de você passar informações específicas, digamos, você é um médico, você tem uma empresa ou sei lá, tem uma empresa que tem um regras específicas que você quer que esse esse esse agente de voz seja uma um, sei lá, um assistente para essa empresa. Então ele tem que saber a as diretrizes da empresa.

Ele não pode fazer alguma coisa que vá contra a empresa. Então você passa, digamos, um corpo de um documento contando tudo essas diretrizes, ele a eh faz em tempo real essa informação pro modelo de voz. Tudo isso parece muito legal.

Então, é mais um modelo promissor, é mais uma empresa promissora aí entrando nessa questão de conversação e a vantagem deles é que é muito rápido, viu, Marisa? É dos que eu testei, é assim, mais o mais realista e o mais rápido que a gente tem até hoje. Pois é.

Agora, falando ainda em empresas e falando ainda em inteligência artificial, a empresa Sacana Ai apresentou uma inteligência artificial. Nome diferente esse, né? Sacana.

Essa piada pronta, né, Marisa? Essa aí piada pronta. Bom, mas enfim, a Sacan aí lançou uma inteligência artificial que pode reescrever o próprio código e melhorar sozinha.

Como isso é possível, Pena? Tem mais, estamos diante de uma inovação preocupante ou fascinante, ainda mais com um nome desse, não é? Então, sacana, eu acho que ambos, viu, Marisa?

É, é fascinante, é preocupante, é tudo. Mas vamos entender então. Primeiro que essa empresa é uma empresa que já eh e lança artigos científicos de de eh em alguns momentos, já vem lançando sempre artigos inovadores, propondo novas técnicas, novos usos, enfim, muito legal.

Eu já já li vários, mas esse novo aí me chamou atenção. Por quê? Porque ele coloca um um tipo um sisteminha, né, um processo que pode rescrever o próprio código.

E aqui a gente precisa entender, abrir um pouco o capô, entender o que tá acontecendo por trás. Então, eh já existe a ideia do algoritmo evolucionário, algoritmo evolutivo, né? Esse é o termo que se usa, que é replicar mais ou menos o que acontece na natureza.

Então, como é que na natureza funciona? você tem eh uma mutação, alguma coisa acontece, um novo ser, o filho, né, o o os pais têm um novo filho e eh os genes não são cópias fiéis, tem alguns eh algumas diferenças, são mutações genéticas. E se essas mutações geram comportamentos ou coisas melhores, eh vai sendo selecionado, né?

Aqueles que se adaptam melhor vão sendo selecionados, aqueles genes vão pra frente. Os filhos desses desses novos filhos vão conseguir, vão passar adiante, porque os genes são bons, são gênos que fazem coisas legais. aqueles filhos que vieram com gênes defeituosos, que que não servem para, né, que de repente eh geram problemas, eles vão ter mais dificuldade de passar os genênes adiante e então vai selecionando.

Esse é o mecanismo da natureza. Então a ideia é meio que replicar esse mecanismo. Então eh como é que funciona?

Você tem lá o primeiro, a base, o o modelo modelo base, modelo pai, que vai tentar fazer uma certa tarefa. Que que é essa tarefa? Tanto faz, a tarefa que eles quiserem, é um benchmark que eles rodam.

Então, pode ser fazer conta bem, gerar um código novo, responder perguntas. Você gera a tarefa que você quer e ele vai pontuar nessa tarefa. Foi lá, fez 50 pontos na tarefa.

Beleza? Agora ele vai gerar um filho. O que que é isso?

vai ser um novo código que uma outra vai pegar e vai falar assim: "Eu vou alterar algumas coisas desse código e vai ser meio aleatório. Ela vai: "Ah, vou alterar aqui, vou ter aqui, vou ter aqui. " A altera o que for, tá gerando a mutação.

Esse novo filho vai tentar fazer a mesma tarefa e de repente vai ter um score pior. Fez 40 pontos, joga fora. O filho é pior que o pai, não nos interessa.

Gera um novo, gera um novo filho. E assim gera um novo filho. Se esse filho for melhor do que o pai, né?

Gera uma linhagem. Fica o filho, o pai vai embora. E agora esse filho pode ter mais filhos.

E esse processo vai sendo sozinho. Você gera uma ela faz um faz um benchmark, faz uma tarefa, é pontuado. As que são, só que você gera várias gerações ao mesmo tempo.

Você não só gera uma, você tem vários filhos do mesmo pai. Cada pai tem 10 filhos e cada filho vai ter 10 filhos. Daqui a pouco você tá com um monte de modelos de a, todos eles competindo na mesma tarefa.

Aqueles que vão indo melhor vão sendo selecionados. É um jeito da IA reescrever o próprio código. Por quê?

Porque no final desse processo inteiro, você vai ter uma nova IA que vai ser muito melhor para aquela tarefa do que a original. Você pode pensar que de certa maneira ela reescrever o próprio código, embora seja meio aleatório, embora pareça uma coisa evolutiva, mas não deixa de ser um processo válido que copia a natureza. Eh, então assim, embora já se conhecia esse algoritmo evolucionário evolutivo há muito tempo, não é uma novidade por si só.

A novidade foi como aplicar ele usando as IAS de hoje, porque não é muito simples aplicar em qualquer tecnologia. Então, parabéns aí a sacanei. Espero que não sacaneia a gente e que isso realmente eh eh seja útil, né?

Seja dado pro nosso benefício. E aí agora lança-se essas questões, Marisa, eh será que é uma preocupação a gente ter uma IA que vai poder eh ir se automelhorando? Será que no meio desse processo de automelhoria não pode vir algum comportamento que a gente não está vendo?

Porque veja, ninguém tá supervisionando isso. Então aí vem a parte da preocupação. Então a parte do deslumbre é essa, a gente realmente ter conseguir hoje ter um jeito de maximizar, criar essa evolução, essa explosão de inteligência, porque no momento que a IA começa a gerar o próprio código melhorando, você tem uma explosão de inteligência, não precisa mais ter humano no meio.

Mas a preocupação é por não ter humano no meio. Será que isso vai ser bom? Então, mais uma vez, eu faço o convite aí paraas pessoas da segurança de a precisamos garantir protocolos, precisamos garantir governança, porque aí sim a gente, o nosso mundo, a gente tem que ter um órgão fiscalizador disso tudo para para nenhum modelo desse pode sair de graça, sair livre, assim, a gente tem que ter um órgão fiscalizador.

É isso que eu defendo. Então é isso, Marisa. Com certeza.

Pena porque você imagina o sistema pronto que faz alguma coisa, você tem que saber o que tem ali no meio, né? que tá escondido e que você não viu realmente precisa mesmo ter um apoio aí do ser humano. Bom, assuntos interessantíssimos mais uma vez na nossa coluna da semana.

Fala aí, Pena. Semana que vem temos mais assuntos para discutir por aqui. Obrigado, Marisa.

Boa noite. Boa noite, pessoal. Até semana que vem.

Até. Ótima semana para você, Pena. Beijo grande.

É isso aí, pessoal. Mais uma coluna super bacana com Roberto Pene Pinelli trazendo as novidades para vocês aí hoje falando sobre empresas e inteligência artificial e todas as alternativas que estão surgindo e vocês acompanham tudo aqui sempre com a gente no Olhar Digital. E semana que vem tem mais coluna.