[Música] Vamos então concluir o nosso trabalho aqui está a versão final do meu gráfico já vou explicar para você todos os detalhes de como chegamos a este resultado bom o finalzinho do vídeo anterior eu tinha pedido para colocar o iqr também só que eu achei o gráfico muito poluído então eu não inclui o iqr no meu gráfico Ok então seleciono gráfico clica aqui em análise na parte de cima veja que eu tenho cinco linhas constantes no eixo Y exatamente as estatísticas mediana que um que é três limites superior e limite inferior aí eu coloquei a
linha Rosa coloquei transparência zero que é para a linha ficar mais forte contrastejado Além disso aqui embaixo eu habilitei a opção de sombreamento de simetria Porque assim fica mais fácil fazer a leitura do gráfico quando você tem muitos pontos não é se eu não colocar o sombreamento o gráfico fica um pouco carregado é mais difícil fazer a leitura sombreamento suaviza um pouco a aparência Além disso eu usei aquele tema exatamente a exibição aqui em cima escolher o tema com o fundo azul também para dar um contraste um pouco maior e apenas alinhei aqui os elementos
na minha área de dados ok uma outra mudança clique aqui em formatar modifiquei os marcadores do Círculo para o losango porque assim também deixa aparência um pouquinho melhor que a vontade Claro para customizar o gráfico aí no seu próprio ambiente Vamos então agora o trabalho de análise que é o que realmente importa Então vou Minimizar isso aqui Observe que nós temos tem uma linha rosa bem no meio aqui ó Isso aqui é a linha da mediana que é o Q2 Ok é o segundo partiu tem uma linha Rosa logo abaixo que é o Q1 o
primeiro Partiu e uma linha Rosa logo acima que é o terceiro partiu Além disso nós temos essas duas linhas rosas que estão nos limites não é o limite superior e o limite inferior eu coloquei um ponto 5 para cima um ponto 5 para baixo essa é uma medida amplamente usada para você classificar outlares Pronto agora é só olhar para o gráfico qualquer ponto de dado acima da linha Rosa do limite superior e abaixo do limite inferior qualquer ponto de dado fora das Linhas é um outline é a classificação é uma das possibilidades não é você
vai decidir no final das contas até onde você vai classificar como outline isso depende por exemplo do tipo de problema que no curso de Cyber Security um dos custos da formação engenheiro de ar lá nós fazemos um trabalho um projeto inteiro de detecção de fraudes em cartão de crédito nesse trabalho nós temos que exatamente olhar para o Outlander então não estou interessado por exemplo nas transações normais eu quero olhar para as transações fraudulentas então eu crio gráfico exatamente para olhar para os out fazer a partir daí fazer os tratamentos lá usamos uma chinelane aprendizado de
máquina para ajudar detectar e prever e o gráfico nesse caso é usado exatamente para olhar para o outline estou reproduzindo aqui para você um exemplo eu particularmente prefiro usar o box uma ferramenta muito mais rápida e fácil para você observar essas estatísticas e detectar os outlines mas o Power Bey não traz nativamente o boxe pode eu teria que usar minha conta corporativa de estudante para poder baixar uma opção lá da loja da Microsoft ou então eu pego o gráfico de inspeção como eu fiz aqui coloca as linhas com as estatísticas que foram criadas através de
medidas condax e pronto Problema resolvido nosso trabalho não é usar Power resolver problemas não é só tem que resolver o problema entregar o gráfico analisar e resolver a questão de negócio Ok vamos usar a ferramenta que estiver a minha disposição aí está para você o gráfico que indicariamente Quais são os hotlines né agora não tem mais dúvida veja que eu tenho um pontinho aqui bem próximo da linha Rosa superior e os pontinhos que estão desgarrados bem distantes ou seja não estou apenas dizendo que tem Outlander estou mostrando provando usando estatística para dizer para você esses
valores estão bem distantes do centro da distribuição alguma coisa tem que ser feita com esses valores você vai manter vai deletar as linhas vai fazer a interpolação vai substituir por um outro valor aí outras análise Talvez teria que ser feitas né para escolher e tomar a melhor decisão uma outra coisa importante hein veja que eu tenho esses pontinhos também desgarrados são outlaias claros né mas eu tenho um que está muito próximo do limite superior e agora tem que tomar decisão Exatamente isso não é esse ponto que está próximo da linha é a altura de 2,4
m 204 cm aquelas estão lá bem distantes são dois metros 70 78 bom dois metros e quatro não é nenhuma absurdo não é Ou seja tem pessoas que têm essa altura é absolutamente normal na NBA tem várias pessoas por exemplo na liga de basquete Estados Unidos no Brasil também então eu vou manter aquele ponto que está um pouquinho acima porém parece fazer sentido mas eu vou eliminar os pontos que estão muito distantes da distribuição Quando eu fizer isso agora é claro que o gráfico vai mudar não é porque eu vou eliminar os pontos que são
outlares e como eu vou fazer isso vou substituir os valores pela mediana que é o 72 vamos fazer isso então volta lá para cima acesso página inicial clique em transformar dados vamos para altura botão direito substituir valores eu sei que um dos hotline ou substituir por 172 que é a mediana também tenho 278 então botão direito substituir valores 278 substituir por 172 perfeito clique em Ok clique então em fechar e aplicar fica olhando para o gráfico ele vai mudar já já pronto mudou completamente né porque porque os Outlets foram removidos eu substitui os valores outlares
pela mediana veja como gráfico agora tem uma outra aparência porque os outlanders eles afetam diretamente a distribuição afetam a média tem várias implicações em relação aos hotlines os outlares podem ser um problema podem ser um erro de medição podem ser uma característica válida aí uma série de questões para ser analisadas não é o propósito aqui discutilas mas sou estudado em detalhes na formação analista de dados cientista de dados engenheiro de ar entre outras aqui nosso portal o fá concluímos o nosso trabalho como eu disse no começo não é não tem glamour Cadê o gráfico dashboard
lindo não é exuberante não é isso que estamos fazendo aqui aqui é um trabalho de limpeza processamento manipulação organização dos dados que é o trabalho mais importante é o trabalho que realmente faz diferença no dia a dia e nada adianta ter um gráfico lindo e maravilhoso que entrega informação errada isso vai causar prejuízo é causar problemas até perigoso Agora sim temos o nosso conjunto de dados limpa e organizado Fique à vontade para usar esse conjunto de dados e criar um gráfico dashboard eu vou concluir aqui o lado vou concluir o capítulo mas você não tem
que concluir utilize esse conjunto de dados que agora já está limpo não é então faça algumas análises faça com cruzamento de dados por exemplo Qual é a média de idade de clientes do tipo ouro Qual é a média de peso de clientes do tipo prata Qual é o limite máximo e mínimo de limite de crédito Quais são os valores não é máximo e mínimo para limite de crédito Qual estado por exemplo tem maior média de limite de crédito transforme esse conjunto de dados em um exercício complementar crie perguntas de negócio responda e crie seu gráfico
dashboard com tudo que eu Já ensinei para você aqui no curso você consegue fazer sem maiores dificuldades considerando Ainda que os dados já estão limpos e organizados concluímos assim o nosso trabalho concluímos mais um capítulo e espero que esse capítulo tenha trazido para você algo valioso tenha mostrado que análise de dados ciência de dados é muito mas muito mais do que só ficar criando gráfico existe um trabalho prévio que é importante em qualquer projeto de análise e ciência de dados qualquer um Você vai precisar Em algum momento explorar o Dato limpar manipular processar para seguir
adiante com outras tarefas no próximo capítulo eu vou trazer uma introdução a linguagem M Não perca hein para quem adora a programação será um dos melhores Capítulos do curso para quem não gosta vai ser tão bem porque eu vou trazer algo muito interessante você encontramos Então no próximo capítulo Muito obrigado até lá