Bom é o que que é al né é aquela coisa você tem uma uma uma fábrica de bonecos todos bonitinhos bonitinhos de repente aparece uma al lá pronto É isso aí totalmente fora do padrão tô falando para você que é d do demônio é o Chuck brother eu tenho Unos Chuck bonitinho de repente da hora para outra aconteceu alguma coisa estranha o pré-processamento de dados é a tarefa Com certeza mais importante é a tarefa Mais importante da ciência de dados e em Inteligência Artificial por quê tem uma ideia assim mesmo que seja vaga pode dizer
o que você quiser por que que pré-processamento de dados ou seja analisar e tratar esses dados é tão importante porque a gente precisa limpar essa sujeira antes tratar eles analogia direta combustível dentro da máquina se você colocar besteira vai sair besteira beleza eu gerei esse formulário aqui tá Exatamente como eu quero beleza eu dei a informação para ele que Nenhuma das perguntas são obrigatórias nenhuma beleza Vocês vão responder esse formulário aqui em 5 minutos olha como é fácil Obrigatoriamente Obrigatoriamente atenção todos prestem atenção no que eu vou falar agora Obrigatoriamente Todos devem Deixar uma questão
em aberto por favor meninas né Não fique deixando a idade aberta que aí pô aí já vai avacalhar o nosso l nós form lá entendeu nem que você Minta não tem problema não tem problema mas coloque sua idade certo eh mas veja procure alternar algumas coisas tipo eh alguma D aqui ó e desala você pode deixar aberto certo pode ser Um numérico mas Obrigatoriamente deixe somente uma questão sem responder só uma só uma beleza agora eu vou pincelar pessoas aqui no grupo somente as pessoas que eu falar vai fazer isso C somente ISO que eu
falar professor Marcelo professor Marcelo nosso gênio aqui Marcelo você você Marcelo você tem 100 anos de idade carec eu já sou é 100 anos beleza só o Marcelo hein só o Marcelo Tá eh [Música] ô ô Rose ela tem cara disso Oi fala ela tem cara ela tem cara que faz isso Rose você é você é a única no grupo que passa 36 horas por dia na rede sociais 36 certo só a ros Você entendeu o que eu disse não eu sou a única no grupo que passo 36 horas nas redes sociais exatamente só só
ar Rose certo você vai tentar responder se você for responder vol direto o pessoal tá rando na sua cara ó Rose a Rose é a única que passa 36 horas na rede sociais beleza 36 horas por favor ninguém ultrapasse o tempo de de horas do dia né aqui certo vamos tentar responder ou você deixa vazio ou responde certinho só a ros vai passar aqui os as 36 horas dela que eu estou passando para ela beleza e eu tenho 100 anos e você tem 100 anos Marcelo eiro as horas Marcelo esse smoco minha careca Vamos colocar
aqui ó e quem mais Edson Rapaz você Você tem uma cara que você você realmente tem um cara uma cara de gente nova você não tem você é um cara novo cara entendeu então o edon tem dois anos de idade 2 anos 6.0 não você tem dois [ __ ] hoje você tem dois cer certo só 2 anos Beleza TDH é tempo relativo é beleza e vou mais uma pessoa aqui vou colocar aqui mais uma pessoa vou selecionar aqui deixa eu ver aqui pronto a PH ela passa menos 5 horas em redes sociais Deu para
entender Ana menos C só essas pessoas que eu indiquei Vão colocar esses valores vocês vejam que não existe nome de ninguém aqui tá tá tá beleza gente por favor para que dê certo o que eu vou fazer com vocês tem tem um Objetivo que eu vou mostrar agora o por que eu tô fazendo isso entendeu primeira coisa é porque a gente sabe que usuário é bicho do capeta né se deixar a coisa livre para ele escrever o que ele quiser ele vai escrever porcaria certo então eu tô tentando simular com vocês aqui uma série de
problemas certo primeiro primeiro problema que eu vou que eu vou simular com vocês é falta de informação cada um vai deixar um dado Vazio aleatoriamente aí a gente vai tentar tratar esses dados que vão faltar porque na vida real não é igual a base de dados bonitinha lá que chegou todo mundo certinho né a vi real não é assim vem uma bagunça dos infernos entendeu né Outra coisa exatamente o que eu falei por exemplo o Rogério vai vai vai vai confirmando você Rogério tá me ouvindo Tô tô ouvindo sim Rogério no TCC do Rogério nós
nós fizemos a seguinte o seguinte trabalho né Nós criamos uma Redeal que era capaz de prever se um aluno do IFG que acabou de entrar no em um curso por exemplo no curso sistema de Formação se ele ia deixar o o curso ou não entendeu usando Inteligência Artificial ele acabou de se matricular esse cara vai deixar o curso com quantos por de certeza tem outra coisa comecei a disciplina de Inteligência Artificial rodeio o nome de todo mundo lá quem vai reprovar eu já sei antes de fazer prova de eu dar aula Sei nem quem são
os cara mas pela Inteligência Artificial El já pode dizer que vai reprovar entendeu então eh como é que eu faço isso com base em dados só acontece quando você abre a base de dados de notas do IFG tá uma coisa maravilhosa a nota 11 lá falei [ __ ] aí sim né bicho o cara tem a nota 11 meu irmão na base de dados ah chamo nota menos um menos um nota o cara conseguiu reprovar por menos um você Entendendo então assim esse esses problemas que a gente tem então vou passar formulário para vocês Vocês
vão ter 5 minutos para responder eu vou baixar Os dados aqui e a gente vai começar analisar o que o esse esse esse essa resposta de vocês a ideia é o quê começar a partir de hoje Se não der tempo a gente continua a semana que vem mas é a gente tentar Enxergar como é que é o grupo aqui né como é que é o grupo de pessoas que estão aqui nesse nossas Aulas eh como é que eles se relacionam Será que é possível a gente ver pessoas que têm aptidão por umas coisas ou outra
ou tem preferências por uma coisa outra certo coisas que a gente é é é muito importante pra gente né então vamos lá ó a aí tá o formulário prega fogo 5 minutos eu estou aqui de olho no formulário E eu como é que ó tá aqui tá aqui respondam por favor chegou o link aí não passei o link Aí Ah chegou conseguem acessar Sim vamos lá agora não tem nenhuma resposta tá uma resposta pra gente deixar em branco Só uma pergunta você deixa em branco aleatoriamente beleza aleatoriamente você botou em que grupo porque no grupo
do data Science não tá não tá chegando não aí pô no grupo aqui do da aula aqui no Ah aqui mesmo no me eu procurando no Zap aqui Que nem um louco aqui pera aí um minuto só posso colocar lá no Zap também p p aí já coloquei lá no grupo também já colocou o rog colocou R rápido na bala vou abrir começar a abrir aqui beleza chegando aqui os dados né vou começar então a aula de hoje que vai ser podemos ir até umas 9 e alguma coisinha alô Sim preenchendo aqui o formulário tem
5 minutos PR Prova 5 minutos aí paraa resposta temos quantas respostas aí já sete isso Beleza oito agora temos aqui várias pessoas que estão as respostas chegando aqui para mim legal que ela é imediata né lembre-se que tem pessoas aí que vai responder de uma forma né lembrem-se já temos aqui nosso gênero Beleza Aqui nós temos aproximadamente as horas já temos aqui arroz contabilizado Aqui com 36 horas que é absolutamente real isso aqui nossa Quem me dera que eu tivesse botar menos 5 horas é eu mandei colocar mesmo quem é que foi quem colocar C
eu mandei alguém colocar 55 vai demorar aí não ó aí ó já tem um já tem um já tem um um um um alguém colocou horas tá vendo ó e é o dado numérico e eu faço o que com esses horas e eu faço o que com esses dois pontos Entende E aí vamos ter que trabalhar isso aqui não tá certinho tem eh sandeco tem como encostar o mouse em uma desses e aparecer pergunta relacionada pergunta tá aqui em cima a pergunta Tá aqui em cima certo Ah pensei que fosse um esquema geral da aqui
a contagem daa coluna duas horas em seis pessoas não eu eu entendi errado eu pia que fosse um apanhado Geral do do questionário entendeu É certo aí ó outro Fi cré colocou 1 hora e meia Aí vamos ver né com hinho no fim esse é o desafio hein vamos lá porque a gente vai ter que enxergar esses problemas e tratar isso aqui né O que que é 0 pon O que é 02.20 20 minutos não sei entendeu eu tava com um banco de dados de preço de imóveis de São Paulo eh o desafio era esse
filtrar arrumar fazer Uma é aul de hoje cara é difícil demais cara eu tentei ISS como é difícil tratar cara e olha que eu fiz um Prom ele viu rodei no final ele falou olha tenta de novo vamos lá eu acho que vai dar pra gente fazer uma coisa bacana aqui Aqui tá legalzinho porque né É É só clicar né então aí o o usuário dos infernos não consegue bagunçar beleza claro que aqui eu não tô chamando vocês 20 horas o cara colocou a macul só de sacanagem mas aqui Claro vocês estão simulando exatamente o
Que o usuário usuário comum responde eles fazem isso mesmo e a gente tem que se virar de deita s é isso galera entendeu isso aqui é o petróleo com areia ó petróleo com areia beleza Tá vindo petróleo com borra aqui ó puxou e misturou um pouquinho e aí faz o quê joga fora o petróleo tem que limpar Beleza já temos 43 respostas tem 52 pessoas aqui dentro né Então tá faltando Tem que ser mais rápido gente não tem como ser tão lento assim tá ok maioria do pessoal aqui é o Home Office ó que lindo
Rapaz do céu galera com essas projeções aqui eu não vou eu não vou fazer plotagens lá no chat PT porque eu acho desnecessário Concorde a não ser que eu queira combinar coisas por exemplo se eu quiser saber entre as mulheres como é que é a questão do regime aí eu faço certo Posso até fazer algumas Visualizações se vocês quiserem porque no chat PT a gente consegue eh dentre as mulheres diga quais qual o regime de trabalho ou então dentre as pessoas que T menos de dentre as pessoas que tem menos de 20 anos de idade
como está o regime de trabalho entendeu que aí você pode ver aí você pode setorizar aí as pessoas acima de 30 e as pessoas acima de 50 e as entendeu vou poder dar umas uma série de de de de ranges né de espaço para você poder entender melhor Seus dados mas a princípio aqui com esses dados gerais né porque ele tá dando aqui somente a distribuição geral dos dados mas eu posso combinar os dados para distribuir certo mas isso aqui pode ser também uma questão do trabalho tá que eu vou passar para vocês ainda aí
vend nota eu sou eu sou para valer nota meu amigo olha eu passando no trabalho eu sou eu sou cão bicho eu quase matei o Rogério no TCC dele eu sou ruim você vê o bicho tanto que ele é magro é fui eu Bicho eu sou ruim eu eu passo o pau mesmo eu não quero nem desça o [ __ ] Olha ele aí ó é não ten nem cabelo para arrancar é tô brincando eu gosto de brincar o Rogério ri disse que eu sabe que eu sou o professor mais de suça Eu sou professor
mais de primeiro que eu não faço prova nem lascando com meus alunos não gosto de fazer prova não faço prova Nem [ __ ] e os trabalhos cara são todos de boa entendeu assim então eu falo essas coisas na verdade é Porque eu sou exatamente o contrário né É certo Roger aí ele vai dizer assim é não é mentira Olha aí terminou 5248 eu vou terminar aqui beleza vou baixar aqui a base de dados eu quero começar a analisar ó VM pra planilha né então vou criar uma nova planilha criar aqui em cima quem respondeu
quem respondeu quem não respondeu não responde mais certo eu vou ter Aqui vamos ver esses dados aqui né Ó tem alguns dados faltantes gente que pedi tá ó híbrido aqui faltando né tá vendo ó aqui ó a hora que tá mais complicada né essa horinha aqui beleza é é bem isso que eu queria mesmo ó certo aqui tem dados faltando e tal é isso aí beleza vou fazer o seguinte vou baixar isso aqui como csv fazer um download desse troço aqui como csb eh com vírgula certo e aí a gente vai começar a trabalhar com
esses Dados né então ó CS V aqui resposta formulário respostas pon csv Deixa eu só fazer um negócio aqui deixa eu só colocar assim esse aqui é um teste que que eu fiz esse aqui vai ser o [Música] respostas sim beleza vamos começar então Ó vou vir aqui pro chat PT vou trabalhar com o chat PT Plus né sabendo que tudo que eu disser aqui basta você dizer crie um código em Python que e ele vai fazer A mesma coisa para você você copia o código executa lá no colb Beleza vamos lá eu vou subir
aqui para ele duas coisas basicamente eu vou as respostas que eu recebi de vocês e e as perguntas tá aquela formatação de perguntas que eu comecei certo vou fazer o seguinte ó vou executar esse esse PR aqui ó em perguntas t t estão definidas as Definições de formulário que foi respondido por algumas pessoas em resposta csv algumas pessoas 20 pon né em tem um português em resposta estão as estão as resposta reconheço a estrutura do formulário em perguntas TX e carreg resposta sv em pandas tá eu quero a sa desse reconhecimento bem resumida vamos nessa
senão ele vai processar e vai dizer o que que tem não sei o eu quero Que ele resuma facilmente aqui então vai ler ele vai ler a estrutura das perguntas que eu já criei anteriormente eu vou passar tudo isso para vocês tá posso passar até esse respostas que vocês mesmo fizeram vocês trabalharem Então tá aqui ele vai começar agora a reconhecer todos os dados né E veja que aquele dado lá inicial de do horário ele meio que ignorou tá vendo ó porque não tá definida lá em Pergunta certo isso é legal Ah tá ele ele
tá dizendo que tem então primeira coisa que eu vou fazer aqui porque não me interessa a hora que o cara respondeu certo ó vamos lá exclusão de dados primeira coisa que a gente vai fazer aqui certo exclusão de dados o que que não me interessa aqui nesse caso exatamente essa esse carimbo de data e hora a não ser que eu queira fazer uma uma análise dos O pesso respondeu ou menos respondeu entendeu ah qual qual é o horário do dia que o pessoal mais responde as minhas pergunta qual é o dia da semana que o
pessoal mais responde aí sim aí faz sentido como a gente respondeu aqui agora não me interessa essa informação fazer o seguinte vou pedir pro chat Exu aqui exclua né exua a coluna carimbo data or beleza muito bem ele excluiu aqui tá Aqui o comando ó Exatamente esse comando drop aqui é um comando de exclusão e ele colocou exatamente o nome né que estava lá na nessa coluna e esse impl through aqui é para que ele faça isso internamente no objeto de dados se vocês essa aqui é muito muito específico para quem programa em orientação objeto
alguma coisa assim eu só explico mais a fundo quando eu tô ensinando Python juntamente com inteligência artificial né aqui ele Disse que vai listar As cinco primeiras informações e aí ele verificou se isso aconteceu mesmo então de forma que aqui nes cinco primeiros dados ó realmente não existe mais o tal carimbo beleza alguma dúvida vou fazer o seguinte agora ó Vamos então começar a tratar a entrar na nossa aula de hoje eu quero fazer aqui um tratamento de dados ausentes tá então lembra que eu falei para vocês que vocês deixaram algumas algumas informações sem Sem
informar né vou fazer assim ó eh vou perguntar para ele tá existe existem dados Ausentes ele vai procurar na base de dados se existem Campos vazios né Ele tá dizendo que sim e aí ele vai pegar por por pergunta né Ou seja a primeira pergunta que é que é a idade todo mundo respondeu certo aí quando tem no gênero aqui teve uma pessoa que não respondeu horas em redes Sociais teve 14 pessoas que não responderam isso pode comprometer um pouquinho aqui tá tem um volume muito alto mas tudo bem Vamos tentar trabalhar confiança em tecnologias
uma entendeu então aqui ó 29 dos problemas está em horas em redes sociais beleza é um número alto de falta de dados certo mas a gente vai tentar tentar resolver esse problema aqui pergunta que que você faria se você achasse uma linha de Dados uma linha de dados assim ó uma pessoa respondeu tá aqui aa pessoa respondeu e existe uma resposta aí aqui o miserável respondeu tudo eu falei para deixar uma é sem jeito né ó aqui ó 24 O que você faria se você encontrasse uma linha de dados faltando dados aqui ó sabendo que
sabendo que em Inteligência Artificial nas nos algoritmos de inteligência artificial a gente não pode Passar dados assim vazio ele dá problema certo porque vai ter multiplicação lá dentro alguns cálculos e se isso chegar vazio como como se fosse um vazio pode dar problema dentro da multiplicação beleza que que você faria pode abrir o microfone e falar colocar colocaria o número um número um aqui eu ia eu ia colocar um condicional se fosse um dado que precisa ser multiplicado colocaria um senão colocaria uma média uma média de Se for numérico né pode ser uma média é
eu também acho que iria na média hein [ __ ] qual essa idade 9 9 99 1433 pô era era só o Marcelo bicho entendeu aluno é tudo igual bicho é tudo filha da mãe não dá para pir umad não vamos ver né A gente vai ver Exatamente isso aí beleza primeiro problema que a gente tem é exatamente os dados faltantes né esse é que a gente conhece como missin é que vocês simularam aqui eu pedi para vocês colocarem informações suas e deixassem Pelo menos uma linha em branco certo então vamos vamos vamos pensar como
é que a gente poderia fazer nessa analogia aqui da Copa das cores olha só mas Imagine que você tem alguns times que eles vão receber camisetas cinco camisetas e um balde de Tinto para pintar as camisetas beleza Olha que legal aí o cara vai lá pinta a camiseta do time e tal pá Claro não vai ficar igualzinha né porque a tinta não vai bater ou seja essa o fato de não ser Igualzinha ou seja entenda que isso aqui é uma linha de informação que tem informações que não são iguais beleza mas você percebe um padrão
outra coisa que timeo Amarelo vou pintar o time aqui com amarelo out tá vou tem um time ciano vou pintar o time ciano aqui as camisetas bonit bonitinha e aí veio o time vermelho perceba que o baldinho do time vermelho é um pouquinho menor não foi foi um erro de Foi um erro de compra entendeu o que vai gerar no fim das Contas que quando o cara vai pintar as camiseta uma camiseta ficou sem pintar ou seja eu tenho exatamente aqui uma falta de informação o que eu poderia fazer com isso primeira coisa que eu
posso fazer com isso a solução número um que eu posso fazer é desce o pau e tira o time tira o time P acabou com o campeonato mano qual que era para ter quatro times senão não dá certo né aí o que que falou aqui elimina a linha então É exatamente isso né drop data se por exemplo a linha For muito problemática vamos supor que eu falei pro cara olha deixa pelo menos uma em branco aí o cara entendeu que era para responder somente uma olha ou se seja não tem condição certo essa linha tá
totalmente comprometida só tem uma resposta de 12 não consigo extrair nada daqui certo só uma resposta então eu não vou deixar essa linha vou excluir mas não é esse caso aqui né esse caso aqui é é só uma Camiseta eu vou tentar fazer uma abordagem diferente Pensa bem que eu vou fazer analogia bacana Olha eu vou pegar o seguinte eu vou pegar essa solução dois aqui ó eu vou usar olhar a coluna dades certo eu tenho essa coluna de dades aqui essas informações aqui se eu pegar a tinta que sobrou um pouquinho da tinta que
sobrou aqui ó e eu fizer uma mistureba que a vermelha acabou né mas eu fizer uma misturbando na mão aqui ó tá aqui as Tintas misturei na mão vai me dar um vermelho ah certo um vermelho mais ou menos mas é vermelho pô aí eu pinto essa essa camisa de de vermelho essa técnica em machine learning ou em ciênci de Dad chama-se imputação que que eu faço eu posso pegar a média de dados aqui dessa coluna calcular essa média certo e imputar essa média aqui no meio porque Pensa bem se você tem o dado branquinho
aqui eu vou voltar aqui ó você concorda que de Acordo com a análise de dados a gente sabe que numa distribuição normal 50% dos estão próximo da Média certo a média no meio aqui eu tenho 25 para cá 25 para cá tem a média distribuição normal beleza e aí acontece a chance de eu jogar a chance desse cara aqui ser próximo da média é grande certo ou seja pelo menos 50% concorda então quando eu coloco a média nessa Informação n eu eu eu eu eu consigo o que acontece eu consigo atribuir esse dado certo deixando
com que ele não influencie tanto no padrão que tá no me na minha base de dados e eu não perco as outras informações que são essas outras camisetas vermelhas aqui deu para entender Deu para entender analogia então a imputação da média é uma imputação média mediana ou moda é uma imputação que você pode usar para você recuperar esses dados Faltantes por exemplo aqui né eu tenho dados faltantes aqui ó por exemplo aqui em Q3 eu tenho uma cetada de dados faltantes aqui tá Isso aqui vai ser um problema mas por exemplo idade não tem nenhuma
né era para idade eu Dev ter falado quem eu falei para deixar vazio não deixei não né Falei não vou fazer o seguinte mas que é dado estranho vamos lá aqui por exemplo ó essa aqui ó pera aí essa aqui tem um dado faltante prend Uma escala de 0 a 10 Alguém deixou aqui então a chance de dessa informação dessa pessoa aqui o que ela responderia Possivelmente ser está perto da média é muito grande beleza muito grande por isso eu coloco a média e essa e a média ela não vai influenciar tanto assim a média
é uma ideia você vai ver que existe uma métrica mais robusta que a média certo já já vou mostrar vou mostrar um problema da Média já já Quando a gente chegar em dados Eh anômalos né deu PR end aqui então guarda isso aí ó média mediana ou moda professor não não sei o que que é média mediana ou moda não tem problema matematicamente como funciona eu não sei mediana não tem a menor ideia que que diabo que é isso não tem problema entendeu Só saiba que eu posso usar essas três métricas aí beleza mas mais
para frente vai ficar mais claro quando a gente for usar é porque a gente vai mandar o comando só pro chat GPT ó façil Imputação por média mediana nessa coluna e resolve o problema aí que eu não quero saber em [ __ ] nenhuma entendeu é com você vamos paraa frente uma outra técnica que eu posso fazer ó a solução três lembra que a primeira é excluir todas as linhas toda a linha certo segunda é colocar uma imputação via média median moda a terceira solução é uma solução Bem mais robusta Tá mas não é tão
usada assim na prática o pessoal usa mais a média mediana ou moda mas é Possível você fazer isso aqui ó você enxergar a base de dados como um todo passar essa informação para Inteligência Artificial ela reconhecer o padrão do conjunto de dados E aí quando ela é conhecer aprender com esse padrão de conjuno de dados você vai passar as informações ela vai virar tipo uma sabe a a analogia aqui é o seguinte você pintou na camisa anterior usando média mediana ou moda É como se você tivesse você mesmo misturado a tinta e você Mesmo pintado
a camisa entendeu aqui é igual aquelas máquinas de mistura de tinta sabe como é que é que você pede uma tipo de tinta ela mistura e fica perfeitinha então A ideia é mais ou menos essa é mais robusto né com certeza é mais robusto quem já foi nessas lojas de material construção tipo aar mer linha essas coisas assim sabe como é que isso funciona essas máquinas de mistura de tinta né então você passa as as as cores para ela aqui ela vai misturar na Máquina que no caso Nossa Máquina aqui é a inteligência artificial e
por fim sai a cor que eu quero veja que agora tá bem mais próximo do que deveria ser né Aí eu faço a atribuição na camisa que era essa camisa aqui ó ficou bem melhor agora beleza então isso é um ponto dúvida Edson aqui no caso da média é apenas para eh os atributos eh numéricos né isso e para os outros atributos categóricos Categóricos a gente vai usar moda ah ok obrigado o que que é o que que é uma coisa que está na moda e se repete né uma coisa que está na moda é
uma coisa que tem alta quantidade no mercado concorda ou não por exemplo né e sei lá como é que eu posso dizer esta garrafa aqui está na moda então se eu olhar se eu olhar se a gente abrir as câmeras aqui vai vai ter pelo menos aí uns 40% das pessoas 50% usando essa Mesma garrafa Beleza então como é que eu uso a moda a moda é é um no categórico certo então o que que é a moda eu vou contar Qual é a categoria que tem mais beleza por exemplo volar aqui na na base
de dados ó eu posso vir aqui né aqui ó como você Se informa Parará né aí o pessoal aqui ó sites notícias YouTube YouTube YouTube vamos olhar no formulário aqui que a gente vai ver qual é a Moda qual é a moda do regime do Q5 que é a qual é a moda Home Office Home Office por Home Office é o que tem mais beleza é a informação que tem mais então os dados faltantes que tiver vou met Home Office lá porque a probabilidade de ser Home Office também é grande entende então aqui ó Qual
é a moda qual é a moda aqui de como você Se informa sobre a isso aqui é maior ainda né Bicho 73% Us Youtube então nos dados faltantes eu posso atribuir YouTube e quando é fer a 10 que daí já fica uma coisa mais né De zero a 10 que que você acha tipo tá tu olha mesmo que tu tenha a maioria não fica não fica menos preciso que YouTube Digamos que respostas mais prontas né cara esse Brasil é maravilhoso ó o sutaque do cara bicho que aqui moram em São Paulo seu ne ah Garoto
aqui tem tudo lugar pessoa Venezuela Nordeste pessoal do Rio Grande do Sul São Paulo ah maravilha esse Brasil maravilhoso né bicho ó Deus o que que eu tenho aqui números né Beleza então eu vou usar aqui provavelmente uma métrica que use número ou seja eu posso usar a média ou eu posso usar a mediana certo eu vou explicar a mediana mais para frente não vou explicar a mediana agora porque ela Vai ser uma solução para um problema da Média que é o chamado dado do capeta vamos lá com calma olha aí o dado do demônio
já já gente chega lá do dado do demônio atribuímos aqui então estamos aqui resolvendo o nosso problema de miss invos posso chegar aqui simplesmente no chat PT agora ó e pedir para ele resolver esse problema de dados ausentes olha só tem um pron bacaninha aqui que eu vou trabalhar com vocês aqui ó vou Pôr isso aqui ó vamos lá chat PT pá pá pá Cadê você meu filho rapaz tá bagunça tudo isso aqui viu aqui tem coisa demais aberto aí aqui chat PT tá aqui tudo na mão agora vou fazer o o seguinte ó vou
dar um tratamento especial que é três certo vou fazer o seguinte ó vou fazer aqui ó tratamento de dados ausentes avalie o conjunto de dados para identificar qualquer valor ausente ele Já fez isso utilize estratégias como imputação ou substituição por valores estatísticos média mediana certo exclusão não é opção aqui eu não quero que você exclua Nem [ __ ] Não faça isso não [ __ ] entendeu quero meus dados aqui tem letra maiúscula né ó Conforme o que for mais adequado para natureza dos dados e contexto por causa dos outliers US mediana ao invés da
Média eu vou explicar isso aqui já Já Eita he o explicite o que foi realizado Mas não deixe de forma nenhum dados ausentes Bele mu atenção em dados que são numéricos Eu já vi isso né mas que contém Strings beleza chega o pau ele vai fazer um tratamento aqui vamos ver o que que ele vai fazer coluna Tratando o que a gente vai melhorar a coisa aqui o final é que eu quero um dado um um um um conjunto que tenha um pelo menos um padrão salvo né entendeu ele tá aqui ó avaliando tudo aqui
e tal e agora vai começar a tratar os dados certo ó lá vou abrir aqui a codificação ele tá pegando os dados que tem dados ausentes Beleza acho que esse aqui são categorias Provavelmente o que que ele vai usar aqui ó moldes tá vendo aqui ó Viu que ele veio molde ó que que ele usou que que ele usou edon a moda né a moda garoto ou seja usou o que está na moda certo essa palavra moda é bem legal porque dá pra gente fazer essa essa essa essa analogia né eu vou usar o que
tá na moda o que tá na moda que vale então categórico provavelmente Tá respondido né resolvido o problema ele agora vai verificar lá os que provavelmente estão com problemas e Ó deu um erro aqui ó que8 escala de 0 a 10 parece que houve um erro devido dar o nome incorreto em uma das colunas que a coluna que me referia como que8 ele errou o nome da coluna vamos ver se ele consegue se recuperar disso aqui tá aqui listou o nome da coluna primeiro para poder depois fazer alguma coisa foi mais inteligente agora né ó
que7 que8 é igual não né Ó tratou os dados com sucesso não tem mais dados ausentes agora eu quero ver eh bom ele falou que tá tudo ok né Vamos fazer o seguinte ó eu quero o Download Esse dataset é bom sempre vendo sabe Vou baixar esse dataset para ver o que aconteceu se ele resolveu o problema né sobretudo na questão dos dados lá das horas se ele resolver esse problema senão a gente vai ter que vai ter que fazer algum comando a mais Vamos ler Abrindo ih cara Só que eu acho que [Música] não
é a terceira pergunta né Então tá aqui ó ó olha viu o que ele resolveu viu o que ele resolveu não tem nenhum nenhum string mais ó olha ele ele arrumou aqui aqui eu acho que é só uma quebra de linha aqui tem não determinado mas é a terceira né Tá certo teve uma pessoa que escreveu não determinado como sexo né do Aqui viu aí ó não tem problema mais na terceira coluna ó ele arrumou ó e era a mais problemática primeiro tinha muitos dados faltantes segundo tinha você vacar com os dados [ __ ]
aí é demais né colocou hora sei o qus vees viraram usuário mesmo né mas aparentemente assim tá tudo certinho beleza resolvido os dados faltantes não tem mais problema com dados faltantes agora vamos em frente Ah eu vou pedir fazer o seguinte só para Para para para reforçar faça uma segunda verif verificação dos dados faltantes se você quiser você pode pedir para ele explicitar o que ele fez em cada coluna entendeu ah aqui eu col a média aqui eu coloquei a moda você pode pedir Ó você aplicou técnicas dados faltantes nas colunas por favor crie uma
tabela dizendo coluna 1 foi essa técnica coluna dois foi essa técnica coluna TR Foi essa técnica entendeu Por exemplo eu apliquei a média na coluna TR Tá mas que média foi essa beleza ele fez a segunda verificação ó vou mostrar aqui o código procurou é um log do que ele fez do registro que ele fez ele também vai me dar né Vai Com certeza é só você pedir explicitamente ele ele gera para você veja aqui que ele tá pedindo aqui ó o SN Né que é essa esse comando do pandas ele busca dados faltantes dentro
do pedi para somar os dados ISS se deu vazio certo Deu vazio então estamos bem não tem mais dados faltantes resolvemos em um comando resolvemos tudo em um comando de pronos show de bola ou não vou até copiar esse prompt aqui e vou e vou a fazer um update aqui né uma uma atualização porque a prática mostrou que se é possível Vacalaura próximo passo é o que a gente chama de outlier certo ou seja são anomalias de dados proposital eu coloquei aqui são os dados né estão plotados em uma uma plotagem aqui cartesiana e aqui
propositalmente eu coloquei esse dado demônio aqui é exatamente isso que a gente vai ver agora procurar os capetas aí ô Sand Fala de novo o nome da fase anterior a fase anterior é Aqu bom a esse process essa aqui é outlier a outra que nós nós acabamos de fazer aí veja o processo o nome do processo chama-se pré-processamento de dados sim primeira técnica encontrar dados faltantes certo isso e tratar dados faltantes Então esse é miss inv em inglês Miss invers segundo tratar out Live certo ou seja anomalia de dados certo beleza posso em frente pode
em frente obrigado bom é o que que é Outlier né é aquela coisa você tem uma uma uma uma fábrica de bonecos todos bonitinhos bonitinhos de repente aparece uma outlier lá PR É isso aí totalmente fora do padrão tô falando para você que é o d do demônio é o Chuck brother eu tenho Unos Chuck bonitinho de repente da h para outra acontecer alguma coisa estranha por exemplo a Rose passar 36 horas por dia na rede social isso é uma coisa é um Chuck certo de dados não é Você ter 99 anos de idade P
isso é o Matusalém é um chuque de dados certo chuque tudo é chuque esse demônio mas é exatamente isso é o é algo que sai realmente sai realmente do padrão certo exemp tem um padrão de construção dos dados tá ali todo mundo tá respondendo bonitinho aí Existe alguma coisa isso pode ter isso pode ser ocasionado de várias formas tá Às vezes nem sempre o o Chuck aparece eh por causa do do usuário não pode ser Até erro de máquina mesmo certo pode ser um erro de comunicação por exemplo trunc a comunicação a comunicação chegou errada
a máquina entendeu de outra forma o que chegou nos dados que veio comunicando por exemplo pode ser uma comunicação via rádio uma comunicação via fibra isso pode dar um problema entendeu tudo isso é é é é é aquel lance que eu falei para vocês Lembra que eu falei que em Big Data a gente tem o problema da veracidade lembra o quarto Terceiro V que é veracidade queer seja você recebe os dados da internet é uma zona aí você tem que arrumar entendeu então tenho em mente sempre essa questão quando eu trabalhar com m l lembro
sempre dessa figura aqui é o Chuck eu tenho que achar o Chuck porque o Chuck se ele tiver na no meu no meio da minha base de dados ele é o ruído desgraçado que pode destruir a minha análise entendeu sim ou não Sim ô sandeco eu me Lembrei aqui os dados financeiros ou uma cirurgia robótica assim telec sirurgia assim um bichinho desse pode matar uma pessoa pode matar uma pessoa né um ch por exemplo o cara trocou o sinal do o cara trocou os dados e virou Chuck o prédio foi construído para baixo né em
vez de para cima entendeu o engenheiro trocou o sinal lá e os caras Constru enfim é isso né um outro problema eu vou mostrar um problema interessante aqui ó que é o problema da Turma de bilionários certo turma de bilionários é um problema interessante que essa turma aqui de 1966 todos eles são bilionários olha só tá vendo aí a turma de 1966 L nos Estados Unidos todos eles são bilionários certo você pergunta assim cadê o Chuck cuidado tá essa imagem foi gerada pelo dawi então tem alguns chucks aqui no meio você ah esse menino Esse
menino do zaro aqui é um Chuck cuidado é o preconceito não é bem assim esse não é O Chuck então pela média da turma pela média da turma essas crianças patrimônios que as colocam na categoria de bilionárias entendeu a pergunta é Cadê o Chuck quem é o Chuck dessa história aqui o Chuck é esse cidadão aqui ó por essa turminha tem 16 alunos aqui e o e o e o Bill Gates né fez parte dessa turma e se eu fizer a média todos virarão bilionários porque se eu pegar 110 Bilhões de Dólares divido por 16
D Dá 16 bilhões Se não me engano para cada um é 6 bilhões uma coisa assim é muito dinheiro certo então você percebeu que claramente aqui a média ela é um dado ela é Ela é uma métrica né Ela é uma um dado estatístico problemático concorda ou não se eu pegar aqui e fizer a média desse dessa galera aí todo mundo é bilionário Isso é verdade não é verdade por isso que vem a mediana agora né Exatamente então uma solução que eu posso fazer aqui com isso aqui ó então exatamente a média é sensível ao
Chuck beleza a média é sensível ao dado do demônio ele cai mesmo é tipo aquele pastor que tenta fazer Ô Padre tenta fazer Exorcismo não dá conta vai tem que chamar o outro mais forte a média a média distor todo o resto né se a variação for muito grande muito ABS Exatamente porque se você pegar o salário você pegar né O que Esses caras têm como patrimônio e fizer a média com do Bill Gates vai dar todo mundo vai aí vai distorcer completamente Beleza então você perceba por exemplo se eu pegar as 36 horas da
Rose e fizer a média com com as horas de vocês vai destorcer concorda isso pode ter sido um erro de digitação ela queria digitar 3,6 e digitou 36 e foi Deu para entender então média não é um dado assim a não ser que você olhe primeiro para os dados veja o Que o que tá eh nos dados né a distribuição se tiver mais os correta e não tiver outlier vale a pena usar a média certo caso contrário a gente tem uma outra abordagem mais interessante que já vaiar aqui uma abordagem melhor seria fazer o seguinte
ó eu vou pegar a galera da da turminha aqui e vou ordenar pelo patrimônio dele Certo Então o patrimônio de cada um é esseo aí ó o primeiro tem 400.000 o segundo tem 467.000 o terceiro tem 700k o quarto tem 1.3000 milhões né milhões o qu a quinta aqui tem 1.5 milhões e tem o nosso Bill com 110 Bilhões de Dólares certo em patrimônio o que eu posso fazer aqui é pegar esse dado a medida do meio eu não ordenei do menor pro maior pego a medida do meio aqui se eu tiver um valor ímpar
Na quantidade de pessoas é em cima o dado é em cima Beleza contrário que esse aqui são D Peguei seis pessoas aqui eu tenho esse meio aí agora agora eu faço a média aqui entendeu eu faço a média desses dois e aí eu tenho a saída da mediana deu PR entender certo alguma dúvida poderia repetir Professor eu não peguei muito bem que que eu vou fazer vou pegar aqui os valores que eu tenho na minha na minha coluna de dados no nesse caso aqui é o o quanto que cada um tem de patrimônio certo eu
ordenei menor Para o maiori do menor para o maior E aí eu vou no meio do no meio dessa ordem se eu tiver cinco pessoas a terceira pessoa por exemplo se eu tiver três pessoas quem é a do meio essa né Se eu tiver quatro pessoas eu não tenho um meio eu tenho esses dois que estão no meio então o que que eu faço eu faço a média dos dois eu somo os dois divido por dois certo acho aqui a média a média dessas a média dessa saída Desses dois nesse caso como eu tenho seis
a a medida do meio vai tá aqui né entre esses dois aqui ó a a medida do meio vai tá bem aqui ó como é que eu acho então somos dois divido por dois acho a m do Meio preciso fazer isso saber disso só precisa saber o que é uma mediana mediana o que que é ordenado menor para maior pegar o meio o resto o chat PT faz por você beleza por isso que no meu prompt Eu falei prefira usar a média aqui ó po ver no meu prompt aqui ó meu prompt eu escrevi Exatamente
isso ó eh por causa dos outliers usa mediana ao invés da Média beleza escrev a mediana ô sandec ela trabalha com 33% dos dados então não ela trabalha com todos os dados a só que ela vai ela vai pegar na tendência Central beleza é não mas o cálculo da da dela vai ser feito o Cálculo da média vai ser feito em cima de 33% dos dados porque o primeiro terço nós desprezamos o último terço Eu desprezei também não não não se tivesse 10 Car aí não seria 33% é não seria 33% se tivesse 1000 pessoas
aqui fosse só esses dois tá mas se fosse 999 tá você vai pegar o do meio vai pegar o do meio direto Ah um um só Ah tá Um Só um só se se se a quantidade de pessoas for se a quantidade de pessoas 999 n é ímpar é não tá eu imaginei que ia ser os 333 do meio tá bom tá bom eu se eu tivesse aqui o b fosse tirado né vou mostar Já já uma média sem o Bills né Eh a mediana sem o Bills eh eu eu teria eu pegaria quem for
só esses meninos fora o B seria esse carinha aqui direto ó 700k um valor direto tá entendi obrigado é isso dúvidas mais alguém vamos em frente né pra gente concluir né então o que que eu vou fazer vou aplicar então para resolver o problema Né eu posso para resolver esse problema aqui para tratar esse outl aqui Posso fazer algumas coisas se eu sei que esse se eu sei que isso é um outline mesmo assim é um erro o cara Queria colocar aqui 1.1 milhões certo e o cara meteu 110 bilhões aí foi um erro de
digitação né a gente sabe que não é um erro de digitação mas se fosse eu poderia tratar isso aqui via mediana como é que faria isso eu metia 1 Milhão pro pro B Tá vendo até ficou tristinho ó por qu 1 milhão é exatamente a média desses dois valores que é a da mediana certo do centro Aí eu resolvi o problema entendeu é É como se eu tivesse enxergado ele como se fosse um dado faltante entende tá eu tô tô dando aulo é meu eu fico mais novo certo eu eu Eu trato el como se
fosse um dado faltante e aí eu atribuo essa informação se isso se isso foi que eu falei é um dado que tá errado beleza Ah não cara o bio é s mesmo pô Então a gente vai fazer outra coisa exclui ele certo por quê porque acontece ele tá atrapalhando nesse caso aqui né então é uma abordagem um pouco mais radical eu posso só olhar para aquele dagão o o cara realmente tem esse 110 bilhões então ass bicho pra gente saber essa Média aí dos alunos dessa turma aí eu acho que o bio não rola não
cara tem que tirar ele aí certo e não dá pra gente atribuir 1 milhão pro cara né porque o cara vai chorar então a gente dá umip B aqui tira ele e beleza aluma dúvida nesse caso Qual que é a melhor abordagem aí geralmente utilizada é aplicar a mediana ou retirar depende depende nesse caso especificamente eu Tiraria Certo os dados do bi Tiraria ele do contexto certo mas dependendo do caso você se você não quer perder informação você faz a transformação que levantou a mão seja rápido professor no caso como exemplo tá falando dentro dessa
dessa mediana se eu excluir 50% mais e 50 para menos eu teria o você não vai excluir 50% cara você vai trabalhar só com os outliers certo você vai procurar quem Quais são os dados que Estão com problema você não vai excluir os dados entendeu assim não não chega Nessa não chega Nessa radicalidade toda Não beleza quem mais levantou a mão Ô Professor Boa noite Sim hoje por coincidência cara também fui numa aula lá na USP falando sobre limpeza de dados show e e eles exp por tá fazendo esse negócio eu fui lá e e
ficaram falando explicaram que 80% dos do trabalho quando você vai Trabalhar com dado é fazer essa limpeza que é algo muito complexo exatamente trabalhoso Exatamente é um dado científico tá é um dado científico exatamente pensando antes da Inteligência Artificial esse dado foi feito eu eu perdi um pouco da aula Professor mas eu queria saber se a inteligência artificial automatizar Pois é pode explicar esse processo para você veja o que que provavelmente eles falaram para Você é de todo o processo de de extração de conhecimento de uma base de dados beleza todo o processo desde você
ir lá por exemplo no nosso caso aqui a gente não criou um formulário depois eu peguei esse formulário e não trouxe para cá aí eu fui lá excluí a coluna que não queria tal tal tal tal você veja que o processo de limpar esses dados é o processo mais demorado é o que gasta Dá mais trabalho que gasta mais tempo certo Eh organizar esses dados é o é é nesse processo inteiro o que gasta mais desde você obter os dados tratar os dados passar para para treinar uma inteligência artificial e depois pegar essa inteligência artificial
e implantar em um sistema de toda essa linha de produção para criar uma inteligência artificial ativa por exemplo chat PT certo eles tiveram que coletar dados tiveram coletar dados eles tiveram que criar o Modelo tiveram Mas eles tiveram que fazer pré-processamento de dados ou seja esse pré-processamento de dados que a galera da UPI fez com chat PT limpar os dados organizar para que o mod delo fique bom com certeza custou dos 6 meses de trabalho 80% entendeu desde você coletar o dado criar o modelo tal tratar até você começar a usar chat PT todo esse
tempo 80% do trabalho foi limpar os Dados entendeu Por isso que esse processo é importante e aí entra entra é o que eu tava discutindo ontem com o Rogério né porque o que a gente fez por exemplo nesse problema n problema do do do prediction que é o sistema que ele fez lá de predição de evasão de alunos do IFG certo rapaz cara fazer limpesa de dados da lá foi o inferno foão Fala aí sua experiência é foi a maior parte do Esforço foi só nisso né assim olhando um a um cada Campo cada tributo
tentando identificar Qual que é a razão dele né e ver qual que é o melhor tratamento fazia voltava fazia voltava né o sofrimento quase todo nesse aí exatamente aí a pergunta que eu não quero calar Sand A Iá vai conseguir fazer essa esse processo de análise humana essa seleção sozinha em quanto tempo quantos anos mas eu não tô mostrando é isso Aqui eu estou eu estou eu estou explicando o que ela vai fazer Beleza ela vai fazer sozinha esse processo de de de mediana e tal a gente vai ter que dizer para ela para ela
fazer assim ué já fez né hum ó ó veja bem eu acho que os caras não acredit né eu escrevi esse prompt aqui veja vou ler de novo pronto para você eu acho importante isso tratamento de dados ausentes você pja eu tenho 12 colunas Beleza avalie o conjunto de dados ou seja avalie coluna a coluna para identificar qualquer valor ausente utilize estratégias como imputação ou substituição por valores estatísticos ou seja média mediana exclusão não é uma opção aqui ou seja não quero excluir de jeito nenhum ou seja tem que trabalhar para limpar [ __ ]
dos dados certo conforme o que for mais adequado para natureza dos dados aqui tem um de Português tá aqui tem uma vírgula ISO aqui vírgula conforme que for mais adequada para natureza do dados e o contexto beleza por caus dos Altos use medianas ao invés de média e explicite o que foi realizado Não deixe de forma nenhuma dados ausentes muita atenção nos dados que são numéricos e contm Strings Bele cara você fazer isso aqui coluna poruna na mão D um trabalho inferno você não tem noção eu acho que eu vou passar o trabalho vai ser
isso aqui faça na mão Coluna por coluna e homenagem ao Marcelo aqui que tá não tá acreditando no nosso passel Entendeu cara é um trabalho enorme é só e assim você pode pedir para ele criar os códigos que fazem isso entendeu já é já é muito trabalho bicho Então você ve aqui ó ele ele analisou dado a dado primeiro ele verificou Quais que tem dado faltante ou não depois de cada um ele verificou que tipo de dado que é então é categórica então a gente Vai ver pela moda beleza Esso aqui é hora então vamos
pela variar numérica tá E aí ele tratou tudo cara fez tudo na mão um por um um por um é isso aqui que é o doido cara É um por um agora isso aqui eu só tenho 12 questões imagina um base de dados que tem 200 colunas certo ou então uma base de dados você tem 1 milhão de colunas por 1 bilhão de 1 bilhão de linha um b 1 bilhão de linha imagina fazer Isso deu para perceber a potência disso aqui agora a gente tá trabalhando com essa base de dados aqui de 12 colunas
por 100 linhas né Isso aqui é tranquilinho entendeu as bases de dados mais reais assim são coisas desse nível assim né coisa muito muito grande então ele fez tudo isso pra gente aqui ele executou todo esse código aqui você também pode pegar esse código e salvar e colocar no colab lá para executar que é show de bola né fica tudo muito lindo no Final das contas eu pedi para ele tratar tudo lá e acabou eu tô explicando aqui eu tô explicando para vocês aqui o outl só para vocês agora também entenderem que eu agora vou
mostrar aqui como é que a gente faz para poder para poder eh tratar para poder tratar vi esses outl Primeira coisa eu quero ver o lance do box alguém quem foi que viu o vídeo que eu mandei ho tarde do do me eu assisti gostei muito do Mura Beleza né Ele é muito bom explicar né não e muita coisa que você falou aí já Putz já já fiz correlação com o vídeo dele lá muito bom e tanto é que o box plot Se você olhar o box plot o k z code ele é baseado nesse
Box plot entendeu só o isolation Forest aqui que US de máquina aí você passa os dados ele vai aprender os dados e vai tentar fazer a o tratamento de dados entendeu a inteligência artificial pode falar Gabriel levanta a mão e pode falar Pessoal vamos falar mas vamos tentar ser um pouquinho mais rápido tá nas nas perguntas porque senão a gente não termina hoje não vai lá pode falar quem levantou a mão pode abrir o microfone e falar Professor viajando na maese aqui eu acho fazer a pergunta base conci n nes inl coment é interessante gente
saber fazer a pergunta certa para facilitar a vida Né não fazer na mão masem olha como aud vocêde perar el or outlier concorda ou dados faltantes certo ou dados anômalos você só precisa disso Como assim professor é você pode dizer assim chat PT Quais são as técnicas para detecção e tratamento de outlier aí ele pro aí você copia assim Execute elas então você não precisa decorar nada entendeu Entendi é pegar as palavr chave né fal é você pega a palavra de entrada A chave exatamente a chave qual que é outlier ou dados anômalos né Você
pode assim você pode tentar tentar ser ousado com ele assim chat PT como é que eu trato o dado do capeta do demônio dentro da minha base de dados tentar resolver para você Beleza deixa eu ir em frente senão a não termina bota plot rapidinho aqui ó que é que a gente vai ver então esses dados aqui ab b c d a b c d f g h primeira coisa aqui eu tenho b E f que são máximo e o mínimo dentro da minha essa aqui é como fosse uma coluna de dados certo então aqui
é uma visualização dos dados esse BF aqui é uma coisa interessante porque BF não significa que são os valores de máximo e mínimo que é encontrado dentro da base de dados certo é feito um cálculo para dizer olha a gente tem um limite de dados aqui pelo padrão de dados eles podem ir até tanto em cima no máximo e até embaixo no mínimo certo Deu para Entender não significa exatamente que esses valores que ele vai enxergar aqui em máximo e mínimo Box plot seja máx mínimo mesmo certo são valores calculados certo outra coisa aqui ó
em D está a minha mediana ele mostra a mediana tá aqui ó ele tem o primeiro quarti segund par Ai diabo Pronto agora fodeu entrou na matemática meu Deus eu sou dade de humanas eu fiz letras eu fiz Ciências Sociais bicho calma Isso só vai servir para você Saber que 50% dos dados da sua base de dados lá da sua coluna tá dentro disso aqui ó então se eu tenho um valor mínimo aqui será 0,5 e aqui eu tenho 0.75 os outros valores 50% dos dados tá aqui no meio incluindo a mediana beleza E além
disso aí que para quem saca de matemática pouquinho mais essas informações aqui são usadas para calcular esses valores de máximo e mínimo certo é isso agora pergunta o que que é o a o g e o H lers hã L é exatamente o Chuck e o é o Bill é o Bill é o Chuck a g h Então quando você então quando você você pode dizer assim ó Será que essa minha coluna tem outlier você pode dier chat PT ó chat PT desenhe para mim o box plot dessa coluna se ele desenhar o box plot
aparecer uns pontinhos aqui fora desses bigodin aqui ó você já sabe que é atilar você só precisa saber disso Só não precisa saber de mediana quartil o máximo mínimo não precisa entendeu só precisa saber que aparecer os p fora aqui é HL e você precisa tratar entendeu desse jeito sandec o desenho para mim ele vai fazer isso aí vai fazer rapaz certo Box plot faz Exatamente isso Beleza dúvida vamos fazer aí nesse nessa nossa base vamos lá vamos lá calma aí agora Existe existe o alt L é bom olha Car desse bicho o dai é
maravilha por causa disso né eu sabe o que que eu fiz Para gerar essa imagem aqui eu peguei a imagem do Gato de Botas sabe qu O Gato de Botas fazer aquela carinha assim tipo sabe do sh e passei pro chat PT descreva para mim essa imagem ele descreveu aí eu pensei agora chat PT pense que o Gato de Botas é um Chuck bonequinho do Chuck como é que seria aí ele descreveu aí aí eu joguei no da me deu isso aqui ficou legal né ficou muito bom o Chuck bom quando que o Chuck é
bom Tem um caso quando o Chuck é bom Alguém pode me dizer cadeira parte dia que casou com a outra doida lá e o fundo cara ele tirou eu tirei ele gerou um fundo né Aí eu passei para dentro do canva e pedi pro canva retirar o fundo olha que perfeição do cabelo do Chuck ficou muito perfeito esse boneco né parece parece parece de verdade mesmo assim som Sem grilos quando o outlier é bom eu não sei não Para remover ruídos por exemplo reconhecer um determinados ruídos aí o alter é importante para poder Não mas
aí aí aí você tá reconhecendo aí você tá achando exatamente o HL mas quando é que ele é Oh achei o HL que coisa massa ele achou lá f n Gramado um bate palma na empresa para você já vai já vai abrindo cerveja champanhe sei o que quando os dados anteriores forem bons o será bom também ou tô viajando não não não tá viajando Não quando o for positivo e tiver fazendo análise dos meus investimentos ué Opa quase lá hein ó aí o Rogério Rogério vaiar p foi meu aluno gram detectar fraude pô detectar fraude
você tá procurando uma Fraude que que é uma fraude que que é uma fraude certo uma fraude é um antil você pegou os dados rodou seus dados achou a out L num determinada coisa lá pô isso aqui é um grande Indício de de de fralde que que você faz Fora coisas fora do n Exatamente exatamente como é que você sabe como é que você pensa que veja como é que você acha que um um um banco determina que uma compra de cartão de crédito é uma fraude Deu para entender out L é bom que aí
o que acontece eu eu treino aí nesse caso eu não vou fazer Pro box SP essas coisas não pelo amor de Deus também né eu vou ter uma rede neural que enxerga Outl entendeu ele é ele tem o olho treinado para achar out Live aí ele achou out L imediatamente ele grita né ó L aqui ó eles gastaram quase R 10.000 no cartão da minha mulher é mas mas o banco gritou E aí resolveu né mas se não fosse o detector de de outl como é que ia ser a vida da gente entendeu então o
outl é bom quando você é aquele outl você não exclui você não mexe com ele você tá é atrás dele entendeu você quer ele então Esse aí é o check bom certo alguma dúvida pessoal dados categóricos já já já já eu ven para dados categóricos aqui não é hora não é hora dele não vamos então tratar os outl aqui no chat FT o tempo tá corrido mas não tem problema não acho que a aula tá sendo produtiva né Deu para todo mundo entender aí o processo todo mundo entendu o processo aí tô vendo só as
coisinhas subindo aqui Que que é ah mudo bem Ok posso ir em frente aí mais um pouquinho fechar aqui tem muita coisa aberta no meu computador aqui também preciso fechar Tá bom já chega já chega já chega de trem piscando tá bom chega chega eu posso primeira para ele fazer o seguinte ó detect out O coluna de dados beleza ponto e não ponto não e mostre a contagem de cal coluna nem uma tabela ele vai fazer a técnica de detecção de outline provavelmente ele vai usar usar o o ikr ou zscore beleza vamos lá esse
Prom el não tá aqui vou ter que Atualizar aqui aqui Maravilha cara o prompt aqui tá meio um pouco desatualizado aqui ó o ikr tá vendo aqui ó olha achando ikr aí ó o qu não o ikr é a base do box plot beleza ele é ele para gerar o para gerar ele usa o quartil terceiro mais um e me do iqr entendeu Ó exatamente ó do I né esse izinho lá tem um nome tá quando Você olhar aquele vídeo do que eu passei para vocês você vai saber o que eu tô falando porque quando
você aqui ele tá calculando o mínimo e aqui pode falar levantou a mão pode falar o ikr seria o desvio padrão Não ele tá calculando aqui o ikr o iqr na verdade é o é o i né mas ele nomeou o iqr o i é é o valor que contempla o o entre o Q1 e Q3 beleza que é aqueles dois quartis entendeu certo o Q1 é o primeiro quartil A mediana é o segundo quartil e e Ah desculpa lá no no slide tá errado hein no slide tá errado tá segundo quartil terceiro quartil que
o segundo quartil ele é mediana certo então esse iqr é é o tamanho dessa caixinha ó o iqr é essa caixinha aqui ó Qual é o tamanho disso aqui é o iq R ou I né lá no no no no no no mur cama você vai ver que ele é aí então o primeiro quartilho tá aqui que tá errado tá pessoal ó Vou até arrumar na verdade aqui não é primeiro quartil é Terceiro tá o segundo quartil é a mediana você pode ver o primeiro quartil menos vezes alguma coisa do iqr ele acha esse valor
de mínimo ó lá qu veru ó ó ó esse valor Q1 quem é Q1 é esse carinha aqui ó primeiro quartin certo - 1,52 xz o iqr ou seja 1,5 vezes esse valor aqui ó do iqr que é esse aqui aí ele acha este valor aqui ó de B certo e agora ele vai achar a segunda parte que é a máximo que é o Q3 ou seja esse cara aqui mais 1,52 vezes de QR aí Ele encontra o máximo beleza só falando para quem tem interesse na matemática quem não é da Matemática não precisa nem
se preocupar e aí ele acha o iqr tá aí ele consegue contar por qu o que que ele vai fazer ele vai contar os outliers acima e abaixo do mínimo e do máximo igual ele tá achando aqui ó beleza entendi nada Professor Beleza então faz o seguinte Eh Eita demorando demais ó a gente demorou demais eu vou vou restaurar a resposta tratada é importante fazer o download a sessão apagou você viu resposta tratada respostas tratadas P CV para ele continuar né perdeu a sessão né Eu como eu parei aqui para poder explicar Demorei demais ele
perdeu a Sessão então ten que recuperar então que eu vou fazer aqui ó eh vou pedir mais uma vez para ele fazer isso eu acho que el já vai fazer isso automaticamente tá quando ele carregar ele vai fazer vai fazer isso ó tá fazendo automaticamente tá vendo ó bastou eu carregar o dataset de novo porque ele perdeu o dataset da sessão Então agora ele vai carregar novamente pessoal se liga porque tudo isso vocês vão ter que fazer no trabalho Que eu estou passando para vocês beleza todo esse processo então construir aí ele travou Eh ok
então parece que tem uma coisa Antes aqui né tá dizendo que ainda tem out tem Nan aqui dentro ó para não gerar n né não tá aí tá trazendo aí pra gente ó resolveu qual cidade tem quatro autol foi o Marcelo com 100 teve um desgramado que escreveu 1400 tem o com dois né e teve alguém que Escreveu 99 acertou ele achou certinho que a gente colocou tá vendo ó vamos fazer o seguinte ó plot o box plot da coluna E1 eu devia ter pedido a biblioteca curn que fica mais bonitinha mas mas vamos ver
coisa eu peço para plotar de novo ó tá vendo Aí ó viu aí aqui provavelmente é 100 aqui é o 99 e aqui é o 1433 que alguém respondeu Tá vendo de que ele acertou ele achou certinho vou pedir para el para ele plotar com usando a biblioteca tcnica C C certo perceba que eu estou explicando tem uns conceitos matemáticos e tarará e tarará mas quando você tiver analisando ficou melhor não mas quando você tiver analisando é só pronto direto e manda bala não tem o que fazer entendeu seus Dados é isso aqui foi melhor
pra gente ver bem colocar na esse grama pedir para ele colocar na horizontal Será que ele faz faz faz faz eh eu vou pedir para ele fazer esse Box plot eu não vou pedir para cibone não ficou bonitinho não né na Hori horizontal belezas Olha aí fez na horizontal mas por quê Porque os valores por que que ele tá bem destorcido aqui né porque os Valores aqui ó tão muito altos né então ele bem que comprimiu aqui os valores entre 20 e 50 e pouco entendeu veja que o Marcelo com 100 ficou Pertinho aqui ó
essa fuleiragem aqui que eu não sei por que que fizeram isso impedi mas vamos faler o seguinte ó um tratamento logarítmico é vamos fazer assim ó trate os a Po falar ah não is aqui é para entrar né da coluna Q1 eu vou pedir Especificamente da coluna Q1 a gente trabalhando mas quando você no PR você di assim ó trata o todo mundo nessa bagaça aí vamos perca tempo não eu só T mostrando didaticamente para vocês vocês aprend isso aqui nunca mais esquece n olha lá ação de dados imputação por quartistas o que que vocês
querem fazer aí você pensa que que você quer fazer né Aí ele vai escolher né Parece que ele vai escolher por ele Mesmo ele vai usar o máximo mínimo lá se eu não me engano ó certo para quem é um se for o máximo ele vai colocar um valor aqui e aí a gente vai ver no box SP tratado vai ele vai imprimir ó vai imprimir pra gente ver Opa ó [Música] Opa certo Senhores temos agora os dados tratados aí ó galera que inventou a moda aí se Lascou acho é pouco vai ter 80 anos
vamos lá ó aqui é o valor de m possível dentro possível não quer dizer que ali tem um valor de mínimo aqui certo tanto é que eu eu posso aqui ó aqui vai ter o quê Isso aqui é 20 aqui pode ser na metade 10 pode ser 7 anos certo eu posso pedir aqui por exemplo qual ó Qual o valor mínimo De tô pulando os acentos tá gente por causa do tempo Q1 certo você vê que não vai bater aqui não ó 14 anos beleza alguém colocou 14 anos você veja que tá dentro da tá
dentro do limite aceitável né então esse dado aqui agora essa coluna aqui ela não tem dados faltantes e também não tem atil tá Prontinho para ser usada da Inteligência Artificial esta coluna são 12 Beleza então agora que eu vou fazer ó agora vamos vamos para as cabeças Né Vamos para as cabeças então o que que eu posso fazer ao invés de eu ficar fazendo esse trabalho todo dia analisando vou descer o pau aqui nesse Prom vou pedir para ele fazer tudo uma vez só entendeu remova Faça o que quiser resolve o problema para mim que
eu quero ter o trem pronto essa bagaça certo então para quem não não sabe da área de matemática quem da áre de humanas quem áre biológica isso aqui é a mão na roda cara que é muito trabalho isso aqui dá Muito trabalho O Marcelo falou aí o tanto que ele teve trabalho para resolver o problema de análise de dados né então agora ele vai mostrar pra gente aí ó depois eu vou procurar ver verifique mais uma vez se existe ó eu vou pedir para ele verificar mais uma vez e o que eu vou fazer vou
salvar Esse passo aqui entende Você não precisa dizer para ele mas ser mais explícito Dizendo que todas as colunas não você pode é eu pode sim com certeza você pode dizer você pode dizer coluna por coluna pedir para ele retornar para mim entendeu Ó El já falou aqui que o que eu não tem mais porque TRS tinha 18 ele resolveu certo quatro não havia um foi tratado ele capou né Eh aí ele foi colocou nos nos nos limites De de de do iqr foi embora agora eu vou pedir para ele verificar mais uma vez ó
verifique mais uma vez se existe outl o importante aqui é você saber o conceito e saber que existe esse tipo de coisa que quando você pega o dado na mão a a tabela de dado na mão você sabe o que fazer não tem mais da L O que que eu vou fazer agora ó quero fazer o download is tá tá S out L tá tratados ó vou salvar só com respostas tratadas aqui certo que é O que eu já tava fazendo bom agora o meus dados aqui ó se eu for fazer alguma por exemplo posso
fazer assim ó eh plot slot um gráfico os dados estão limpinhos certo para potagem de gráfico para fazer todo o tratamento que você queira agora os dados estão limpos na mão entendeu processo tá limpo ainda não está pronto para machine learning mas para você mostrar gráfico analisar dados olhar o que tá acontecendo ele já está beleza certo Quem levantou a mão pode falar ninguém Beleza então PR um grafic gráfico que eu falei para vocês né [Música] eh deixa eu ver a pergunta aqui Quero combinar respostas Quero combinar perguntas aqui ó eu quero que você combine
para mim chat PT eh que é Q2 aqui é o sexo tá mulheres mes Eho gráfico mostrando mostrando mostrando o tempo mostrando o tempo tempo mostrando a distribuição a distribuição mostrando distribuição de horas em redes sociais aí você diz qual a questão que é A Q3 Q3 por mulheres beleza quer saber o quanto tempo que as mulheres gastam nas redes sociais eu tô combinando aqui quer dizer já é um pouco fora daquele formulário que a gente viu né então eu e aí eu posso combinar homens né e traga distribuição combinado para ver os dois então
traga a distribuição de horas Em redes sociais por sexo por exemplo tá tentando acessar o dado mas parece que tá Tá com [Música] erro aí Ox mulher das 2 horas se está certo eu sei vai ter que vir certo mas tá tá aí eh posso pedir por exemplo outras coisas aqui eh Tim gráfic [Música] mostrando eh mostrando o regime de trabalho [Música] mostrando a distribuição de regime em que você trabalha certo para para pessoas com com idade até 25 anos vamos ver se ele vai se se adaptar Aqui sem sem eu dizer qual é o
que né Deu para entender a ideia o quatro né você ele vai entender o que eu quero dizer aqui senão vou ter que explicitamente dizer que idade está em Q1 e o regime está em Q5 para ele poder fazer essa vamos lá até 25 anos três pessoas responderam não trabalho presencial é híbrido é isso que tá dizendo Né certo e aí vai você você pode fazer uma série de combinações a partir de agora fazer outro tipo de análise né que você queira perguntar fica mais fácil porque nesse caso aqui você está simplesmente conversando com os
dados certo você tá olhando pros dados e tentando conversar com ele para poder resolver alguns problemas beleza na próxima aula o que que eu quero que vocês façam agora beleza Trabalho pessoal a lista a lista está aumenta a idade né colocar aqui então pessoas entrem entre 25 e 50 anos vou colocar aqui a pergunta que pergunta é aqui ess falsidade aqui vamos ver talvez que agora vai entrar mais Gente a distribuição vai ser melhor né né Eu posso também pedir Pizzas que talvez seja mais interessante né do que barra aí ó essa é a distribuição
então a maioria do pessoal tá em Home Office isso aqui bate com o que a gente tinha lá mas eu posso restringir mais né Por exemplo eu posso posso pegar aqui e colocar as a a posso colocar aqui entre entre 35 ok em eu quero não quero distribuição mostrando a o gráfico De pode falar Professor nesse caso eh Será que ele aceitaria ao invés de por exemplo escrever pegar um exemplo aqui tá Q5 em que regime você trabalha e colocar só Q5 ele entenderia ou não acredito que sim tem que testar a deu show e
deu show e não deu show né Não apareceu escreve aqui ó não Apareceu ele pode tá começando a chegar no fim das das interações das 50 interações que eu tenho direito lembra por ISO você tá começando ó já viio não foi grato de pizza mas tudo bem olha ficou legal né também Então veja eu posso combinar mais coisas eu posso pedir mais por exemplo eu posso pedir para combinar aqui com com com pessoas Que tá com pessoas que usam eh Smart [Música] Smartphone para estudar ver se ele se adapta aqui tá Ó tem a pergunta
né o tipo de dispositiv se para estudar então eu quero saber dessa faixa etária certo pessoas que usam Smartphone Selecionei mais ainda qual é o regime de trabalho certo fiz mais uma restrição percebe essas restrições só vou conversando ele deu erro porque eu não passei a pergunta certinho mas ele vai se adaptar espero só que não é que6 É que9 tá tá vendo agora achou que no A tá tentando se adaptar né eu dei dei só o caminho para ele el tá tentando se adaptar ele achou a coluna que é nov e Agora vamos tentar
então D para fazer muita coisa aqui tá gente só usando PR veja se eu tivesse executado direto veja que não é muita coisa né ó não é muita coisa Veja quantos prontos eu fiz aqui vou contar tá 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 22 prontos se eu tivesse feito isso Aqui em sequência sem tá dando para vocês eu faria isso aqui em 15 minutos Deu para entender ó galera que trabalha 35 e 50 que smartphone 100% é presencial ó sacou
fala fé Professor essa pagem por exemplo que o senhor fez eh at algum jeito da gente colocar isso lá no inicial para que ele mesmo conte que a gente cheg exemplo se eu chegasse lá no final F assim ah deu 15 deu o qu Contagem qu pera aí ó quantos prontes eu escrevi para você até agora vamos ver contando com esse né 44 PR desse chat bom errou né porque não foi isso ou então eu contei errado mas eu acho que foi menos pelo menos a metade disso aí tá beleza Gente vou fazer o seguinte
eu vou mandar uma coisa específica para o Trabalho para vocês eu só preciso que vocês me mandem agora no chat lá no no WhatsApp o o a lista dos trabalhos e aí eu vou especificar o que vocês devem fazer Mas vocês devem chegar no trabalho de vocês neste ponto que nós estamos aqui beleza Vocês vão criar o formulário do tema de vocês vamos lá vou só explicar por alto vocês vão paraa próxima semana tá vocês vão criar o formulário do tema de vocês do do jeito que eu ensinei usando Chat ept criando script executando o
script lá no Script Google App beleza aí o formulário quem vai preencher esse formulário Beleza você pode pedir para algumas pessoas preencherem entendeu usa sua rede de contatos aí pede paraa pessoa preencher e tal beleza Professor eu não consegui uma rede não tenho rede de contato nosso grupo é muito fraco não sei o qu tal Existe uma forma de criar dados Sintéticos dados sintéticos ou seja você passa aquela pergunta as perguntas pro chat ept e diz para ele assim ó eu posso até passar esse Prom crii um csv que conté a resposta de 100 pessoas
entendeu então você sinteticamente vai fazer com que o chat ept preencha respondendo os seus formulários como se fosse uma pessoa mas ele não vai lá no formulário né ele vai acessar Direto o csv e vai preencher para você deu para entender dat sintéticos é uma possibilidade tá eu prefiro que seja dados reais pessoas reais por quê Porque vai dar mais padrão vai aparecer o padrão o sintético dele é meio bagunçadinho você vai ter que você não não é fake News tá esse aqui dat sintético isso é um conceito da da Inteligência Artificial Não é fake
News eh dat sintéticas ele faz sentido tem tem tem Um sentido por quê Tem até um conceito chamado aumento de dados que usa imagens e vídeos e tudo mais dado sintético é um por exemplo dados usando dados usando Eh dados sintéticos usando Eh geração por por Reds Gun né dados sintético elas funcionam e dão certo melhor a rede noral né então Eh vocês podem criar os dados sintéticos mas aí no pronto da criação do dados sintético é interessante que você diga assim ó tome cuidado na hora De preencher essas 100 respostas procure colocar algum tipo
de padrão criando cluster de pessoas entendeu E aí na hora que ele for responder você ele cria para você os dados S aí ele vai ó vou criar esse cluster esse esse e vou responder de acordo com esses clusters entendeu Aí fica legal deixa ele preencher todos os dados só depois eu quero que vocês façam isso é obrigatório Tá vocês vão ter que sacanear os dados de vocês igual a gente fez agora Ou seja eu quero que vocês vão lá na base de dados exclua dados de propósito inclua alguns dados incluo alguns dados lá chck
dados do demônio mesmo certo para vocês tratarem essa informação ver se vocês conseguem detectar e se Vocês conseguem tratar beleza porque não adianta de nada você pegar as a base dados limpinha bonitinha E a vida da Disney [ __ ] entendeu não é assim tem que pegar na bagunça e aí tentar arrumar certo então façam isso que que vocês vão fazer vocês são nove grupos certo vocês vão executar isso essa semana vou dar o prazo para entregar esse trabalho até tem prazo viu prazo eu sou rigoroso do meu prazo bicho vocês vão entregar isso até
vocês vão entregar isso até Eita [ __ ] o meu prazo é que tá [ __ ] eu ainda vou viajar pro Nordeste esse esse mês para dar palestra [ __ ] um de novo Novembro 31 de Novembro não existe essa data não Pô você tá doido eu procurando né lesado eu sou lesado mesmo ó vou dar o prazo aqui pro dia eu acho que dia 13 tá de bom tamanho hein vocês têm aí 1 2 3 4 dias 13 até meio-dia para fazer isso são oito pessoas ok sandeco O que que a gente vai
Te entregar Você já viu que o chat é pt quando a gente tá eu tô aqui eu vou mostrar para vocês quando a gente faz um um chat tem essa opçãoincorreta vocês vão compartilhar comigo esse você pode compartilhar esse Sand a o anál não deixa não né não deixa não você pode mas você pode copiar selecionar tudo e imprimir em PDF não vou fazer assim quarta-feira que vem eu vou dar 5 Minutos para cada um apresentar seu projeto beleza para todo mundo aqui 5 minutos ó a gente fez assim tá depois feriado de qu Que
feriado ah dia 15 cara dia 15 é é feriado cara dia 15 vocês vão querer ter aula não é mesmo né É você mesmo vai aqui Aqui tem um feriado em em Paris Paris Aparecida também né Aparecida você vai querer seu churrasco não é feriado de Aparecida não Éons não você fosse em Goiânia até que você tá fora Aparecida cidade vizinha aqui de Ô sandeco mas eu não entendi é um bairro chique de Goiânia Eu não entendi como que nós vamos encaixar o assunto lá que nós elegemos lá dentro desse desse trabalho aí não cara
é simples não tem um assunto você não viu que eu fiz qual é qual é o meu assunto eu queria verificar Eh qual o perfil dos meus alunos do curso aqui do chat APT pô percebeu ô ou não Sim perfil Então pensa eu quero analisar o perfil de alguma coisa levem por por esse caminho porque vocês vão ter depois fazer uma clusterização dos seus dados você ter que vocês vão ter que achar grupos entendeu então o que acontece eh eh é isso qual é qual é o seu tema fala para mim o meu tema é
monetização com chat GPT monetização com chat GPT Beleza Então seu você vai escrever pro chat ept ó crie um formulário eh que possa analisar o perfil das pessoas que que estão procurando eh monetização utilizando chat APT use perguntas numéricas e categóricas não use perguntas abertas já falei que lá né e pá p p aí ele vai te girar uma série de perguntas e você vai modelando essas perguntas até chegar a ficar legal de forma que você vai entender o perfil das pessoas que querem monetizar certo Querem ganhar dinheiro usando o chat PT pergunta eh você
tem você você tem o chat APT Plus primeira coisa certo qual chat PTT você tem Plus é 3,5 n o cara quer monetizar se ele não tá usando nem o o mais Fodástico né você usa api do chat PT para alguma coisa percebeu Olha eu pergunta boa sim ou não você usar api não é é uma possibilidade Então são esse tipo de pergunta entendeu direcionada aí aqui vocês tem que quebrar a cabeça pô Senão vou ficar dando a dica para tudo aqui né a gente tem um número de formulários que tem que enviar ou um
só o grupo não mas eu digo quantas pessoas a gente tem que enviar o formulário 100 pessoas 50 pessoas 20 pessoas 12 aí aí vou fazer uma pergunta Tem um limite tem o limite vou fazer vou devolver a pergunta PR inteligência já quantos dados é suficiente sei lá Um é a aula passada lembra da aula passada não tem limite Quanto mais melhor é sim sim sim é só tem um problema tá eh Não façam Se vocês forem fazer de uma forma sintética Vamos trabalhar ali em torno de 100 entendeu porque eu já percebi que que
o advancer data anális aqui ele tem um problema de memória entendeu então vai ter um momento aqui a gente vai gerar um chamado método do cotovelo a a computação tem essas coisas Engraadas né tem o algoritmo guloso Dea eu falar o algoritmo do valentão esses nome engraçado de algoritmo E aí a gente vai usar o método do cotovelo certo e se você tiver dado demais nesse caso aqui talvez a máquina dê uma travadinha aqui na máquina do chpt aí para você funcionar talvez tem que usar o goab Então vamos trabalhar aí em torno de Entre
50 e 100 respostas beleza até pros sintéticos tá bom Carlos pode falar Sandeco a gente pode botar o link da pesquisa no grupo principal pode show era essa a pergunta que eu ia fazer é uma boa então é uma boa é uma boa para saber o perfil do pessoal então aí aí é questão de vocês baterem um papo entre vocês aí os grupos né para se conscientizar porque você se você responde teu responde o meu e aí a gente vai entendeu rapidão vocês vão resolver 1000 pessoas no grupo se 20% responder é mas eu acho
que vocês vão conseguir mais Aderência com o grupo do do do do curso porque todo mundo tá precisando entendeu lá no canal tá aquela G Ah vou responder p nenum não sei o que entendeu já no curso is é aquela coisa se tu não responde o meu também não responde o teu eu me vingo Eu sou nordestino né Beleza galerinha ó 10:6 acho que deu né bicho po acabar 8:30 [ __ ] 1 hora e30 a mais bicho ô sandec deixa eu fazer uma pergunta pessoal para você não aí é Demais não é mas é
bem pessoal você você vai responder porque você não vai se negar a responder isso nãoc sou eh desde que eu conheci o seu canal lá antes de eu entrar no grupo tal que eu assisti aos seus vídeos lá do seu canal eu ficava me perguntando eu olhei lá os históricos do vídeo você tem vídeo lá de 5 anos atrás eu fiquei eu fiquei me perguntando como que esse cidadão dá aula desse troço há tanto tempo então a pergunta é como é que você dava aula Desse assunto aqui até ano passado até [Música] 2022 Ué como
assim mudou muito não mudou não meu jeito daa Eu não entendi você pergunta não mas porque porque agora por exemplo você tem nós temos uma ferramenta que é o chat PT pra gente fazer tudo isso agora imagina se não tivesse cara você tinha que de alguma forma ensinar o cara a programar o p você explicou melhor você explicou melhor Ah com certeza quer dizer esse Curso aqui por exemplo pessoal da humanas a gente teria que fazer usando o Orange né Marcelo é show ó tô te cobrando viu a gente usaria o or cvas né mas
mudou muito deve mudar muito o até o conteúdo de aula não vai Ah com certeza considerando as novas ferramentas É eu tô de licença né mas assim eh quando eu voltar da minha licença eu eu vou os meus alunos que não usar porque assim os caras os caras na Academia Estão dizendo assim na Universidade Federal e disto Federal né Tem gente que fala assim ah se usar chat PT é dou zero não sei o que tal eu se o cara não usar eu dou zero Eu já eu já tô dizendo para os professores colega meu
Entendeu Se não usar vai tomar [ __ ] porque veja eu tô preparando vocês pro mercado certo ó tô falando de vocês como se fosse meus alunos da afg de FG Tô preparando a galera pro mercado E o mercado tá usando isso Se você não souber usar esse troço você vai ser passado por cima com catep sabe como é que é Sabe aqueles troces que alisa asfalto que as bichonas que tão umas rodonas assim de Ferro vão passar por cima de você é isso que vai acontecer Entendeu então e eu digo isso agora eu digo
isso sem medo e com propriedade eu vou até vou até descompartilhar aqui minha tela para ficar melhor pra gente ver eu vou trazer vocês aqui pra frente Eu digo isso para qualquer área a partir de agora isso é para qualquer área da não só mais da Computação mas em qualquer área de conhecimento se você não utiliza Inteligência Artificial vai vir um profissional que utiliza Inteligência Artificial e vai passar por cima de você certo vai vai passar Bonito não é então é por isso que eu resolvi eu por isso que eu resolvi isso é uma coisa
que eu já desde 2017 que ten Um canal já é algo que eu já vinha com isso na cabeça né assim a inteligência artificial vai tomar um uma uma dimensão que as pessoas elas vão ser impactadas quando eu li eu eu fui muito impactado quando eu li pela primeira vez o relatório de Oxford quando eles falaram lá que 47% dos tipos de trabalho nemia acabar né então esse Impacto chegou em mim assim bom né fala assim cara eu tenho que fazer alguma coisa porque é a minha área de pesquisa então assim meus Alunos precisam disso
eu tenho meus sobrinhos que estão na na área também tenho minha irmã que da área de é da área médica tem outra irmã que é da área de de de de da área de de de de da humanas tem a minha mulher que é da área psicologia certo eu tenho meu filho agora que é da área de educação física né então assim se eu não fizer alguma coisa nem que seja para você registrar a informação que tá aqui dentro para fora eh isso vai se perder e Aí comecei a expor is no canal e a
coisa foi crescendo entendeu virou isso que tá agora então Eh o cara que não usar chat PT daqui pra frente esse tipo de tecnologia que a medida vai acelerando cada vez mais o cara fica para trás entendeu então na minha sala de aula eu já digo ó agora eu já vou dizendo cara se você não se você se você se você não usar esse troço eu vou dizer com você Você vai sair você já vai sair assim em desvantagem em relação aos Outros né assim profissionalmente falando que o chat ept é para é para tirar
as amarras do seu pé entendeu Por exemplo olha veja bem eu tô falando de deita Science com vocês a gente falou que 80% do trabalho de Science é pré pré-processamento de dados né pré-processamento de dados trabalho dos infernos que dá esse troço trabalho mecânico jpt vem e resolve o problema então agora bicho eu vou tomar meu café tomar minha cereste Jog no Vasco vou estudar outras coisas vou estudar Arquitetura de Rede neural que é o que eu gosto se já estudar é isso entendeu vamos nessa galera muito bem vou passar aqui os prontos para o
professor Marcelo que vai juntar com esse vídeo agora aqui pode parar de gravar agora Rogério por favor