Existe uma forma completamente diferente de editar imagens com inteligência artificial e ela não usa promptes longos nem tentativa e erro. Em vez disso, você controla a imagem usando o código JSON. Sim, como se estivesse programando a imagem.
Nesse método, a Ia primeiro extrai toda a estrutura visual de uma imagem, como objetos, texto, iluminação, estilo, enquadramento e assim por diante. E transforma tudo em um arquivo de organizado. Depois disso, você pode simplesmente editar o Jon para mudar qualquer coisa, trocar texto, alterar objetos, modificar o estilo da fotografia ou até recriar a imagem inteira mantendo a mesma composição.
O resultado é um nível de controle absurdo, muito mais preciso do que pedir mudanças em linguagem natural. Então, antes de mostrar tudo isso para vocês, não se esqueçam de se inscrever no canal. E para dar aquela moral aqui pra gente e ainda ver os vídeos sem anúncios, é só clicar no botão seja membro, fechou?
Então, bora pro vídeo. Bom, pessoal, hoje eu quero mostrar para vocês como utilizar o Gemini para editar suas fotografias, as suas imagens, enfim, o que você quiser usando códigos Jon. E por que que isso é importante?
Quando a gente tenta editar uma imagem, seja ela qual for, por exemplo, para modificar um texto, a gente sabe que muitos modelos de inteligência artificial, inclusive os mais modernos, t dificuldade para manter a consistência. Então ele pode até conseguir trocar o texto, mas muitas vezes ele altera outros elementos da imagem, como iluminação, o rosto, os objetos e assim por diante. Utilizando essa técnica que eu vou mostrar aqui para vocês agora, a gente reduz muito a chance do modelo de inteligência artificial alucinar na hora de editar a imagem e fica muito bom.
Eu fiz alguns testes aqui e agora vou mostrar para vocês. Vamos começar editando uma imagem que foi gerada por inteligência artificial, só que eu quero trocar o texto dela. A imagem é essa daqui.
Eu fiz esse infográfico dentro do notebook LM. E aí eu quero alterar o título que eu achei que tá muito longo. Que que eu vou fazer?
Eu vou salvar essa imagem no meu computador em formato JPG ou JPEG, tanto faz. Aí eu vou fazer o seguinte. Dentro aqui do Gemini, eu vou clicar no sinal de mais, pode ser na sua conta gratuita, não tem problema nenhum.
Vou subir o arquivo desse meu infográfico que eu acabei de salvar e aí eu vou digitar esse prompt. Todos os prompts que eu utilizar aqui vão estar aqui embaixo na descrição do vídeo, OK? Então esse é o primeiro prompt.
Extraia todas as informações visuais desta imagem, incluindo todo o conteúdo de texto e formate tudo como arquivo JSON estruturado. Para essa etapa, você vai selecionar aqui o modelo rápido do Gemini. E aí é só enviar o comando.
Pronto, ele já terminou e trouxe aqui para mim um código de descrevendo todos os elementos da imagem. Então, tudo o que ele visualizou aqui tá descrito no meu código Jon. Agora, como eu faço para trocar o texto dessa imagem?
Nesse primeiro exemplo, eu vou editar o arquivo JSON. Então, você vai fazer o seguinte, você vai usar esse prompt aqui, gere uma nova imagem usando estes dados em JSON. Aí eu vou copiar aqui o código que ele acabou de gerar.
Vou colar no prompt e aqui eu vou fazer a edição. Em vez de terras raras, o coração da tecnologia e a corrida pela autonomia, eu vou apagar aqui essa parte final e vou fazer apenas essa alteração. Só que para isso eu preciso fazer o upload novamente da imagem.
Então eu vou clicar aqui no sinal de mais, enviar arquivo e subir a imagem de novo. E agora você precisa usar o modelo Pro porque se você deixar aqui no rápido não vai dar certo. Então selecione o Pro e aí é só enviar.
Quando você seleciona o Pro, automaticamente ele já carrega o nano banana 2. Se você deixar no rápido, isso não vai acontecer, pelo menos nos testes que eu fiz aqui em casa. Pronto, ele já terminou.
E vejam o resultado. Primeiro aqui a imagem original. Eu tenho aqui o título completo, terras raras, o coração da tecnologia e a corrida pela autonomia.
E aqui a imagem que acabou de ser editada. Vejam que ele eliminou aqui a última parte do título. Vamos comparar a consistência.
Vejam, do lado esquerdo, imagem original. do lado direito, imagem editada utilizando o código reparem que tudo que eu tenho aqui do lado esquerdo permanece igual do lado direito. A única coisa alterada foi o título do jeito que eu editei lá no meu código de então isso é muito legal porque às vezes quando a gente pede pro próprio nano banana 2 executar essa tarefa, ele dá uma alucinada e entrega uma imagem um pouquinho diferente.
Aqui não. Tudo que eu tenho na imagem original permanece na imagem editada, apenas a alteração que eu pedi é que foi implementada. Agora, será que também funciona para imagens que não foram geradas por inteligência artificial, como é o caso dessa daqui?
Então, é uma foto que eu peguei lá no Pxels normal. Tenho aqui uma placa que tá por trás de uma cerca e eu vou pedir para que a inteligência artificial mude o texto que tá aqui, traduzindo para português. Vamos ver se ela vai conseguir.
Vejam que eu pedi a mesma coisa aqui. Extraia todas as informações visuais desta imagem, incluindo todo o conteúdo de texto e formate tudo como o arquivo de estruturado. Ele fez a análise aqui primeiro utilizando o modo rápido e trouxe aqui para mim o código JSON.
Aí eu fiz o mesmo procedimento, coloquei aqui o prompt. Gere uma nova imagem usando esses dados em Jon. Só que aí em vez de utilizar o texto em inglês, eu fiz a tradução pro texto em português.
Enviei o comando e esse daqui foi o resultado. Temporariamente fechado para obras. Detalhe, o texto permanece atrás da cerca.
Então essa é uma imagem complicada porque o texto tá atrás da cerca e mesmo assim ele conseguiu fazer a tradução que eu pedi simplesmente editando o código em Jon, comparando aqui lado a lado as duas imagens. Do lado esquerdo imagem original, do lado direito, a imagem que foi editada usando o código JSON. Reparem que eu tenho a mesma iluminação, os mesmos elementos, o texto permanece atrás da grade, enfim, uma edição perfeita.
Agora vamos tentar uma outra técnica em que eu vou pedir paraa própria inteligência artificial alterar o código JSON. Eu não vou editar nada. Então eu vou subir essa imagem para cá.
Vejam só, tenho aqui um desenho. E aí eu vou pedir o seguinte, a mesma coisa que antes. Extraia todas as informações visuais desta imagem, tal, tal, tal.
E vou enviar. Pronto, já tenho aqui o meu código Jon. E agora, em vez de editar o código propriamente dito, eu vou colar esse prompt aqui.
Gere uma nova imagem usando esses dados em JSON, mas troque o relógio na parede por um quadro da Monalisa. Mesmo assim, eu preciso copiar o código, colar aqui novamente e fazer o upload da mesma imagem. Lembrando que eu preciso trocar aqui do modo rápido para o Pro.
Pronto, terminou aqui. Vamos fazer o comparativo direto. Do meu lado esquerdo, a imagem original.
Tenho aqui a estante com o mesmo número de livros, a mesma iluminação, as bandeirinhas, a lousa, as carteiras, a outra mesa, mais livros, os quadros que aparecem aqui, o globo terrestre, só que em vez do relógio, eu tenho aqui um quadro da Monalisa, mantendo o mesmo estilo da imagem. Ou seja, ele não criou apenas um novo elemento, ele adequou esse elemento à imagem original. Então, ficou muito bacana porque reparem que a consistência permanece a mesma e a única alteração que foi feita foi a troca do relógio pelo quadro da Monalisa.
Então, percebam que essa técnica também funciona. Se você não quiser editar diretamente o código em JSON, você pode fazer o upload da imagem novamente, copiar o código que ele acabou de extrair e aí você pede pra própria inteligência artificial fazer alteração para você. Agora, outra coisa legal que dá para ser feita com essa técnica é copiar o estilo de uma fotografia e passar para outra.
Vejam só esse exemplo. Eu vou usar essa foto aqui que eu achei na internet. Aí eu vou pedir o seguinte: descreva as técnicas fotográficas presentes nesta imagem em formato e modo rápido, vou enviar.
Então, qual é a ideia aqui? Não é copiar a pose, o ambiente, nada disso. O que eu quero é que ele copie as técnicas fotográficas, a iluminação, a textura e assim por diante.
Vamos ver se ele vai conseguir. Pronto, já tenho aqui o meu código Jon. Agora eu vou subir uma outra imagem para cá.
Eu escolhi essa imagem aqui. Vou usar esse prompt. Gere uma foto desse sujeito com base no seguinte arquivo JSON.
E vou copiar o arquivo em que ele descreve as técnicas fotográficas da imagem original. Mudando novamente aqui para o Pro e vou enviar. E vejam só esse resultado aqui.
Eu tenho a minha imagem original com todas essas técnicas fotográficas aqui que foram aplicadas. Aí eu subi essa imagem aqui que não tinha nada a ver com a foto original e ele me entregou esse resultado aqui. Olha que bacana que ficou.
Ou seja, ele conseguiu copiar exatamente as técnicas de fotografia que foram aplicadas à imagem original para mim entregar esse resultado aqui. Se você quiser editar essa imagem que foi gerada, também dá. Que que você precisa fazer?
A primeira coisa é o download aqui da imagem. Aí eu vou fazer o upload da imagem para cá novamente. E agora eu vou pedir o seguinte: apague o texto cloud trow do terno desta pessoa no código JSON.
Então para isso, eu vou ter que copiar novamente aqui o prompt original. Aí eu vou colar, já tá aqui no pro e vou enviar. Pronto, terminou aqui.
Vamos comparar a consistência. Do meu lado esquerdo, a imagem original com o nome dele aqui no terno. Do meu lado direito, a imagem editada.
Agora sem o nome, reparem que eu tenho a mesma iluminação, a mesma textura, o mesmo ângulo e a mesma expressão no rosto. Então essa técnica, ela é simplesmente incrível, porque quando você pede pra inteligência artificial quebrar a imagem num código de, ela vai examinar exatamente todos os elementos que estão presentes nessa imagem. Quando ela faz isso, ela consegue entender todo o contexto e a partir daí você pode pedir a edição que você quiser.
Dessas formas que eu acabei de mostrar para vocês, editando o código de O diretamente, pedir pra inteligência artificial fazer essa edição para você sem ter que mexer no código ou pedir pro Gemini replicar as técnicas fotográficas para você poder aplicar em uma outra fotografia. Então pessoal, testem aí porque essa técnica de utilizar código para editar imagens é uma das mais eficientes que eu já testei aqui no canal. E aí, que que vocês acharam dessa dica?
Dá para usar no dia a dia? Você já conhecia essa técnica? Contem para mim nos comentários, tá bom?
Te vejo no próximo vídeo. Existe uma forma completamente diferente de editar imagens com inteligência artificial e ela não usa promptes longos nem tentativa e erro. Em vez disso, você controla a imagem usando o código JSON.
Sim, como se estivesse programando a imagem. Nesse método, a Ia primeiro extrai toda a estrutura visual de uma imagem, como objetos, texto, iluminação, estilo, enquadramento e assim por diante. E transforma tudo em um arquivo de organizado.
Depois disso, você pode simplesmente editar o Jon para mudar qualquer coisa, trocar texto, alterar objetos, modificar o estilo da fotografia ou até recriar a imagem inteira mantendo a mesma composição. O resultado é um nível de controle absurdo, muito mais preciso do que pedir mudanças em linguagem natural. Então, antes de mostrar tudo isso para vocês, não se esqueçam de se inscrever no canal.
E para dar aquela moral aqui pra gente e ainda ver os vídeos sem anúncios, é só clicar no botão seja membro, fechou? Então, bora pro vídeo. Bom, pessoal, hoje eu quero mostrar para vocês como utilizar o Gemini para editar suas fotografias, as suas imagens, enfim, o que você quiser usando códigos Jon.
E por que que isso é importante? Quando a gente tenta editar uma imagem, seja ela qual for, por exemplo, para modificar um texto, a gente sabe que muitos modelos de inteligência artificial, inclusive os mais modernos, t dificuldade para manter a consistência. Então ele pode até conseguir trocar o texto, mas muitas vezes ele altera outros elementos da imagem, como iluminação, o rosto, os objetos e assim por diante.
Utilizando essa técnica que eu vou mostrar aqui para vocês agora, a gente reduz muito a chance do modelo de inteligência artificial alucinar na hora de editar a imagem e fica muito bom. Eu fiz alguns testes aqui e agora vou mostrar para vocês. Vamos começar editando uma imagem que foi gerada por inteligência artificial, só que eu quero trocar o texto dela.
A imagem é essa daqui. Eu fiz esse infográfico dentro do notebook LM. E aí eu quero alterar o título que eu achei que tá muito longo.
Que que eu vou fazer? Eu vou salvar essa imagem no meu computador em formato JPG ou JPEG, tanto faz. Aí eu vou fazer o seguinte.
Dentro aqui do Gemini, eu vou clicar no sinal de mais, pode ser na sua conta gratuita, não tem problema nenhum. Vou subir o arquivo desse meu infográfico que eu acabei de salvar e aí eu vou digitar esse prompt. Todos os prompts que eu utilizar aqui vão estar aqui embaixo na descrição do vídeo, OK?
Então esse é o primeiro prompt. Extraia todas as informações visuais desta imagem, incluindo todo o conteúdo de texto e formate tudo como arquivo JSON estruturado. Para essa etapa, você vai selecionar aqui o modelo rápido do Gemini.
E aí é só enviar o comando. Pronto, ele já terminou e trouxe aqui para mim um código de descrevendo todos os elementos da imagem. Então, tudo o que ele visualizou aqui tá descrito no meu código Jon.
Agora, como eu faço para trocar o texto dessa imagem? Nesse primeiro exemplo, eu vou editar o arquivo JSON. Então, você vai fazer o seguinte, você vai usar esse prompt aqui, gere uma nova imagem usando estes dados em JSON.
Aí eu vou copiar aqui o código que ele acabou de gerar. Vou colar no prompt e aqui eu vou fazer a edição. Em vez de terras raras, o coração da tecnologia e a corrida pela autonomia, eu vou apagar aqui essa parte final e vou fazer apenas essa alteração.
Só que para isso eu preciso fazer o upload novamente da imagem. Então eu vou clicar aqui no sinal de mais, enviar arquivo e subir a imagem de novo. E agora você precisa usar o modelo Pro porque se você deixar aqui no rápido não vai dar certo.
Então selecione o Pro e aí é só enviar. Quando você seleciona o Pro, automaticamente ele já carrega o nano banana 2. Se você deixar no rápido, isso não vai acontecer, pelo menos nos testes que eu fiz aqui em casa.
Pronto, ele já terminou. E vejam o resultado. Primeiro aqui a imagem original.
Eu tenho aqui o título completo, terras raras, o coração da tecnologia e a corrida pela autonomia. E aqui a imagem que acabou de ser editada. Vejam que ele eliminou aqui a última parte do título.
Vamos comparar a consistência. Vejam, do lado esquerdo, imagem original. do lado direito, imagem editada utilizando o código reparem que tudo que eu tenho aqui do lado esquerdo permanece igual do lado direito.
A única coisa alterada foi o título do jeito que eu editei lá no meu código de então isso é muito legal porque às vezes quando a gente pede pro próprio nano banana 2 executar essa tarefa, ele dá uma alucinada e entrega uma imagem um pouquinho diferente. Aqui não. Tudo que eu tenho na imagem original permanece na imagem editada, apenas a alteração que eu pedi é que foi implementada.
Agora, será que também funciona para imagens que não foram geradas por inteligência artificial, como é o caso dessa daqui? Então, é uma foto que eu peguei lá no Pxels normal. Tenho aqui uma placa que tá por trás de uma cerca e eu vou pedir para que a inteligência artificial mude o texto que tá aqui, traduzindo para português.
Vamos ver se ela vai conseguir. Vejam que eu pedi a mesma coisa aqui. Extraia todas as informações visuais desta imagem, incluindo todo o conteúdo de texto e formate tudo como o arquivo de estruturado.
Ele fez a análise aqui primeiro utilizando o modo rápido e trouxe aqui para mim o código JSON. Aí eu fiz o mesmo procedimento, coloquei aqui o prompt. Gere uma nova imagem usando esses dados em Jon.
Só que aí em vez de utilizar o texto em inglês, eu fiz a tradução pro texto em português. Enviei o comando e esse daqui foi o resultado. Temporariamente fechado para obras.
Detalhe, o texto permanece atrás da cerca. Então essa é uma imagem complicada porque o texto tá atrás da cerca e mesmo assim ele conseguiu fazer a tradução que eu pedi simplesmente editando o código em Jon, comparando aqui lado a lado as duas imagens. Do lado esquerdo imagem original, do lado direito, a imagem que foi editada usando o código JSON.
Reparem que eu tenho a mesma iluminação, os mesmos elementos, o texto permanece atrás da grade, enfim, uma edição perfeita. Agora vamos tentar uma outra técnica em que eu vou pedir paraa própria inteligência artificial alterar o código JSON. Eu não vou editar nada.
Então eu vou subir essa imagem para cá. Vejam só, tenho aqui um desenho. E aí eu vou pedir o seguinte, a mesma coisa que antes.
Extraia todas as informações visuais desta imagem, tal, tal, tal. E vou enviar. Pronto, já tenho aqui o meu código Jon.
E agora, em vez de editar o código propriamente dito, eu vou colar esse prompt aqui. Gere uma nova imagem usando esses dados em JSON, mas troque o relógio na parede por um quadro da Monalisa. Mesmo assim, eu preciso copiar o código, colar aqui novamente e fazer o upload da mesma imagem.
Lembrando que eu preciso trocar aqui do modo rápido para o Pro. Pronto, terminou aqui. Vamos fazer o comparativo direto.
Do meu lado esquerdo, a imagem original. Tenho aqui a estante com o mesmo número de livros, a mesma iluminação, as bandeirinhas, a lousa, as carteiras, a outra mesa, mais livros, os quadros que aparecem aqui, o globo terrestre, só que em vez do relógio, eu tenho aqui um quadro da Monalisa, mantendo o mesmo estilo da imagem. Ou seja, ele não criou apenas um novo elemento, ele adequou esse elemento à imagem original.
Então, ficou muito bacana porque reparem que a consistência permanece a mesma e a única alteração que foi feita foi a troca do relógio pelo quadro da Monalisa. Então, percebam que essa técnica também funciona. Se você não quiser editar diretamente o código em JSON, você pode fazer o upload da imagem novamente, copiar o código que ele acabou de extrair e aí você pede pra própria inteligência artificial fazer alteração para você.
Agora, outra coisa legal que dá para ser feita com essa técnica é copiar o estilo de uma fotografia e passar para outra. Vejam só esse exemplo. Eu vou usar essa foto aqui que eu achei na internet.
Aí eu vou pedir o seguinte: descreva as técnicas fotográficas presentes nesta imagem em formato e modo rápido, vou enviar. Então, qual é a ideia aqui? Não é copiar a pose, o ambiente, nada disso.
O que eu quero é que ele copie as técnicas fotográficas, a iluminação, a textura e assim por diante. Vamos ver se ele vai conseguir. Pronto, já tenho aqui o meu código Jon.
Agora eu vou subir uma outra imagem para cá. Eu escolhi essa imagem aqui. Vou usar esse prompt.
Gere uma foto desse sujeito com base no seguinte arquivo JSON. E vou copiar o arquivo em que ele descreve as técnicas fotográficas da imagem original. Mudando novamente aqui para o Pro e vou enviar.
E vejam só esse resultado aqui. Eu tenho a minha imagem original com todas essas técnicas fotográficas aqui que foram aplicadas. Aí eu subi essa imagem aqui que não tinha nada a ver com a foto original e ele me entregou esse resultado aqui.
Olha que bacana que ficou. Ou seja, ele conseguiu copiar exatamente as técnicas de fotografia que foram aplicadas à imagem original para mim entregar esse resultado aqui. Se você quiser editar essa imagem que foi gerada, também dá.
Que que você precisa fazer? A primeira coisa é o download aqui da imagem. Aí eu vou fazer o upload da imagem para cá novamente.
E agora eu vou pedir o seguinte: apague o texto cloud trow do terno desta pessoa no código JSON. Então para isso, eu vou ter que copiar novamente aqui o prompt original. Aí eu vou colar, já tá aqui no pro e vou enviar.
Pronto, terminou aqui. Vamos comparar a consistência. Do meu lado esquerdo, a imagem original com o nome dele aqui no terno.
Do meu lado direito, a imagem editada. Agora sem o nome, reparem que eu tenho a mesma iluminação, a mesma textura, o mesmo ângulo e a mesma expressão no rosto. Então essa técnica, ela é simplesmente incrível, porque quando você pede pra inteligência artificial quebrar a imagem num código de, ela vai examinar exatamente todos os elementos que estão presentes nessa imagem.
Quando ela faz isso, ela consegue entender todo o contexto e a partir daí você pode pedir a edição que você quiser. Dessas formas que eu acabei de mostrar para vocês, editando o código de O diretamente, pedir pra inteligência artificial fazer essa edição para você sem ter que mexer no código ou pedir pro Gemini replicar as técnicas fotográficas para você poder aplicar em uma outra fotografia. Então pessoal, testem aí porque essa técnica de utilizar código para editar imagens é uma das mais eficientes que eu já testei aqui no canal.
E aí, que que vocês acharam dessa dica? Dá para usar no dia a dia? Você já conhecia essa técnica?
Contem para mim nos comentários, tá bom? Te vejo no próximo vídeo.