Olá, seja muito bem-vindo a mais um vídeo desse conteúdo de dados que estamos trabalhando juntos, né, nessa parceria. Eu sou o professor Anderson Gonçalves, fazendo para você a minha descrição. Eu sou um homem branco de cabelos castanhos, uso barba e estou vestindo uma camisa preta, tá?
Fundamentos de dados. Módulo 4: Identificação de padrões nos dados. Bom, e nesse nesse vídeo, nesse encontro, nós vamos começar a estudar então os padrões que nós podemos encontrar nos dados, tá?
Através de de um gráfico ou então através de uma retratação de uma tabela de alguns de alguns registros, né, de alguns valores que estão no banco, tá? através dessa representação, entender ali alguns padrões e também como extrair, né, eh, decisões ou então como fornecer esses gráficos da melhor maneira possível para que a equipe de gestão tome decisões assertivas. Tudo bem?
Vamos lá no quadro e eu quero apresentar para você o objetivo desta aula de hoje, tá? De mais este encontro aqui. Bom, a aula então identificação de padrões nos dados.
Objetivo entender o conceito de padrões e tendências em conjuntos de dados. Então, eh existe ali uma eh alguns princípios, né? Por exemplo, o princípio da causalidade, né?
Então, são alguns princípios que a gente estuda ali para eh tentar encontrar esses padrões. Será que os dados eles nos mostram padrões, né, ou não? Segundo lugar ali, detectar padrões de crescimento, queda ou sazonalidade.
Então, lembra ali dos gráficos que nós já construímos juntos, aquele de vendas, né? Então, a gente viu ali, por exemplo, eh, o produto, né, que é o arroz, eh, a cada mês ele ia caindo ali o número absoluto das vendas, né? Então, esse padrão aí não era de crescimento, né?
Na verdade, era eh estavam caindo ali as vendas, né? não tava crescendo, tava diminuindo. Então a gente vai detectar também se existem esses padrões, né, e de crescimento, de queda ou então da sazonalidade.
O que que é uma coisa que é sazonal? É de época, né? Por exemplo, ah, chega na Páscoa, é claro que é comercializado o produto chocolate, né?
Muito mais do que nas outras eh épocas do ano, porque ele é sazonal ali, né? a venda desse produto, o consumo desse produto é mais sazonal, né, tanto na Páscoa quanto no final de ano também, certo? Eh, aplicar a análise de padrões na tomada de decisões.
Perfeito. Bom, então vamos lá. Aí eu trago para você aqui uma reflexão, né?
Descobrindo padrões nos dados. Então, os dados podem revelar muito mais do que imaginamos. Como identificar padrões que ajudam a tomar decisões estratégicas?
É isso que veremos na aula de hoje, tá? Então, como eu disse, né, já teve um pequeno spoiler ali na nossa última aula, que eu ia trabalhar com você nesse vídeo em um conteúdo, né, numa programação em Python. Você vai ver que e são poucas poucas linhas de código.
Ali a gente já consegue gerar um gráfico, porque o Python ele é uma linguagem de programação que tem algumas bibliotecas muito interessantes justamente pra geração de gráficos. Então, a gente consegue criar gráficos de colunas, de pizza, de barra, né? Eh, igual nós estamos trabalhando com esses gráficos dentro do Google Sheets, você consegue também trabalhar na programação.
Isso para qualquer linguagem, mas o Python ele é uma linguagem que ele tem esse viés específico de estatística. Então, se você estudar um pouquinho de Python, você vai ver que ele é uma linguagem que foi criada justamente com esse objetivo para trabalhar com dados, para trabalhar com análise de dados. Então, com poucas linhas de código, você consegue gerar ali gráficos eh de base de dados, de conjuntos de dados.
E você consegue trabalhar com o Python, com bancos de dados, igual lá, eh, por exemplo, os bancos de dados que nós vimos, eh, dentro do do Oracle, MySQL, SQL Server, né, bancos de dados dentro dos seus SGBDs, dos sistemas gerenciadores de banco de dados, ele consegue trabalhar com dados em formulários ou planilhas do próprio Google e ele também consegue trabalhar com os arquivos CSV. Lembra que teve um recorte que eu utilizei até de um eh até do próprio Python aqui, né? Eu mostrei ali os dados de alguns produtos, né?
Produtos eletrônicos, né? Nós tínhamos lá televisão, notebook, fone de ouvido, né? Então tinha uma tabela, só que essa tabela ela estava no padrão CSV.
Então, se essa tabela conter, né, ou se dentro dela estiver ali todos os dados que eu quero analisar, eu também consigo fazer uma programação, montar um código em Python que vai eh acessar os dados dessa tabela e eu consigo então representar os dados em forma de gráficos e fazer o que eu quiser ali via programação eh no Python com esses dados. Perfeito. Você tá vendo aí a minha tela, tela de projeção, e eu tô com o meu código em PTE que eu quero compartilhar com você, tá?
Essa ferramenta aqui somente a título de informação que você está visualizando é o VS Code ou Visual Studio Code, OK? É uma ferramenta da Microsoft. Ele é um editor de texto que é claro que ele não é somente um editor de texto comum como Notepad, que eu já mencionei para vocês aqui.
Ele é um editor de texto específico paraa programação e ele é muito completo porque dentro dele você consegue trabalhar com várias várias linguagens, não é só Python não, tá? você trabalha com Python, trabalha com Java, com C, até Portugal já conseguir fazer alguma coisa dentro aqui do VS Code. E ele é uma ferramenta que é muito bem aceita no mercado de trabalho, ou seja, a comunidade de dev, a os desenvolvedores de softwares, programadores, pessoas que estão ligadas diretamente a essa área de desenvolvimento de sistemas, elas utilizam muito essa ferramenta, o VS Code, tá?
Então, todo mundo que tá estudando programação, todo mundo que está fazendo um curso de programação ou já está no mercado de trabalho trabalhando em uma empresa, com certeza em algum em algum momento aí utilizou ou vai utilizar ainda essa ferramenta. Bom, aqui eu tenho um código em Python, tá? Estamos visualizando aqui 15 linhas de código.
Eu vou trabalhar um pouco com o zoom, vou aumentar um pouquinho o zoom aqui. E eu tenho ali das linhas um até a linha 15, como se fosse um editor de texto e algumas linhas de código em Python. Perfeito.
Do lado lado esquerdo é uma estrutura de pastas e arquivos similar ali ao Windows Explorer, né, da minha máquina, do meu dispositivo. E eu tenho os arquivos, tá? Eh, aqui na parte de cima, né, eu tenho vários arquivos abertos, abertos, tá?
Tem um que é uma outra linguagem aqui que linguagem R, mas esse arquivo aqui que tem 15 linhas é o teste. pi. Eu já mencionei, mas a extensão de um arquivo em Python, então é o P, tá?
PY. Então, se eu for lá no Explorer, lá no file da minha máquina aqui, você vai ver que tem um arquivo que está armazenado lá dentro dessa desse diretório que se chama teste. pi aqui embaixo, na parte de baixo, tem o meu terminal que como se fosse o meu prompt.
Não é o prompt igual do chat GPT, é um prompt de linha de comando, eh, para você trabalhar dentro do seu projeto. Então, se eu digitar aqui clear, ele vai limpar a tela aqui do terminal para mim, do meu prompt. Vou dar um enter.
Ele limpou a tela para mim. Vou digitar novamente o comando clear e vou dar um enter. Ele vai limpar para não ficar poluído, para que eu possa digitar outros comandos.
Então, como que funciona aqui? Eu vou codificar geralmente como que funciona? Eu codifico o programa, vou colocando as minhas linhas de código em Python e eu executo via comando.
Tem a opção de executar via ferramenta, que é aqui na setinha aqui do lado direito, canto superior direito da minha ferramenta. Aqui eu seleciono e tem uma opção ali que é o run code, rodar o código, executar o código. Ou então eu posso também fazer isso por linha de comando, por linha de comando no terminal aqui na parte de baixo da ferramenta.
E aí eu só basta eu digitar ali Python espaço nome do arquivo mais a extensão. Então vou colocar ali Python espaçoteste. py, que é a extensão do meu arquivo.
Ele vai executar esse código. Primeiro vamos entender o código. Eu quero explicar aqui brevemente para que você entenda um pouco o código.
Você vai entender que nós temos dados aqui dentro, tá? Claro que pensando em uma aplicação, eu vou ter esses dados aqui no meu banco de dados. Então você já viu ali, né?
Você já deu uma olhada ali, eu tenho ali dois conjuntos de dados. Um é a altura, um são as as alturas e o outro é um conjunto de dados que tem o nome de pesos. Então, como se fosse alturas, né?
Altura e peso de algumas pessoas. É claro que eu poderia ter esses dados dentro do banco de dados no MySQL. poderia também ter esses dados dentro de um arquivo CSV, poderia também ter esses dados dentro de uma planilha lá no meu drive no Google Sheets, tá?
Aí, é claro, eu vou ter que fazer o download da planilha desse arquivo, né? Colocar no mesmo diretório do meu projeto aqui no Python para eu conseguir trabalhar com ele, tá? Poderia fazer assim, mas o Python ele também, e aí a programação não é só uma particularidade da linguagem Python.
Qualquer linguagem você consegue fazer isso que eu vou falar. você consegue criar conjunto de dados dentro do próprio código. Conjuntos, conjunto, conjuntos simples, conjuntos com poucos dados dentro do do próprio código, fonte para você fazer um teste, tá?
Que é isso que eu fiz aqui com esse teste que eu quero apresentar para você. Então, vamos lá no note novamente. Olha só que legal, você tem na linha seis um conjunto de dados com nome de alturas e um outro conjunto de dados na linha nove com nome de pesos.
E aí eu tenho o sinalzinho de igual. Logo depois eu vou só aumentar um pouquinho o zoom para acompanhar melhor. E eu tenho entre conchetes que daí assim, ó, professor, por que que depois eu tenho que ter um igual?
Por que que depois eu tenho que ter o conchetes e depois de cada valor eu tenho uma vírgula? Isso são regras aqui da linguagem Python, tá OK? Então, para você criar uma estrutura, que é um conjunto de dados e colocar valores lá dentro, você tem que respeitar a regra da linguagem, tá?
Isso aí é para toda linguagem. Você vai ter que proceder ah dessa forma. Cada linguagem tem a sua regra, mas toda linguagem tem uma regra que tem que ser seguida, senão o código não roda, vai dar vai dar erro.
Por exemplo, se eu viesse aqui, tirasse esse esse conchetes na linha seis, ele já vai apresentar um erro. Ele grifou ali porque não tá no padrão, tá faltando alguma coisa. Então eu vou coloco con jeitos respeito à regra, ele conserta e entender que que eu estou respeitando as regras de sintaxe.
Isso isso chama sintaxe a forma de escrita da linguagem, da linguagem de programação. Então tem que ser dessa forma. Eu vou colocar um nome para o meu conjunto de dados.
alturas, não pode ter espaço. Depois desse sinal de igual, eu abro e fecho conchetes e dentro eu vou colocando os valores, separando por vírgula, tá? Essa é a regra.
Perfeito. E aqui na linha cinco, eu posso colocar comentários. Comentários são linhas ou textos que você escreve no seu código que não são interpretados pela linguagem.
Coloquei aqui o sinal de chiqueirinho sustenido hashtag. É esse é esse sinal aqui, né? Esse caracter.
Coloquei ele. A partir daí na frente aqui eu já posso escrever qualquer coisa e eu posso colocar uma anotação. Posso colocar quem mexeu no código, eu posso colocar o meu nome aqui, Anderson Gonçalves.
Perfeito. Aí aqui na linha 8 também, ó. Eu tenho mais um mais uma linha de comentários, né?
Dados dos pesos em quilogramas. Eu posso acrescentar ali na frente eh eu posso colocar aqui a data de minha data de nascimento, 22/03 de 1979, só para colocar alguma coisa. E aqui na frente do meu nome, na linha cinco, eu vou colocar professor de dados.
professor conteúdo de de dados. Tá perfeito. Então aqui na linha oito, depois aqui do da data eu vou acrescar, vou colocar linguagem Python.
Aí então são linhas que independem. Eu coloquei aquele sinal, coloquei aquele sinal de hashtag na frente, eu posso anotar o que eu quiser que vai ser ignorado. Outra coisa legal, qualquer coisa que eu alterei nesse arquivo, eu mexi aqui, né?
Coloquei o conchetes, coloquei algumas coisas de comentários. Então, eh ali em cima na no Python em cima, ele vai colocar uma bolinha nesse arquivo que eu tô mexendo. Test.
P. Isso indica que esse arquivo tem alteração, ele não foi salvo, tá? E aí eu tenho que salvar.
Vou dar um contrtrl S. E aí ele salva, ele já vai sumir a bolinha e vai aparecer o xizinho ali. Qualquer mudança que você fez é importante salvar, porque senão você pode compilar eh compilar o arquivo sem a última mudança que você fez.
Vamos analisar então os dados aqui na linha seis. Eu tenho aqui alturas, eu tenho altura em centímetros. Então aqui é 150 é 1,5 m.
Então 150 1,60 m, 170, 175, 180 e 1 85. Então, quantas alturas eu tenho? 1 2 3 4 5 6 7 alturas de sete pessoas.
Perfeito. Qual o padrão? Nossa aula é para descobrir os padrões dos dados, OK?
Esse é o título dos conteúdos da nossa aula. Descobrir os padrões. Então aqui eu já tenho um padrão.
A minha altura ela está crescendo. Olha só, ela está crescendo. Ela tá em ordem crescente.
Ela tá ela tá em ordem de altura crescente. Então eu tenho 1,50 na esquerda e uma altura maior lá na direita, que é 1,85 m. Então, os meus dados estão em ordem de altura do menor pro maior, em ordem crescente.
Esse é o padrão que eu tenho aqui. Vamos olhar aqui os pesos na linha nove. É um outro conjunto de dados.
Linha nove. Aqui eu tenho as linhas de código, ó. Linha 1, 2, 3.
Eu tenho 15 linhas de código aqui repetindo para você. Quando você compila um código e tem algum erro, ele vai falar. O o compilador fala: "Ó, o erro tá na linha 13.
Então você vai lá, alguma coisa você fez errado, eh, faltou uma vírgula, você não colocou alguma coisa assim. As ferramentas ajudam hoje o programador nesse sentido também. Claro que não é tão simples assim, mas tem essas facilidades.
Então, os pesos aqui na linha nove eu começo do 50, 50 kg, 60 kg, 65 kg, 70, 75, 80 e 85 kg. Perfeito. Maravilha.
Então, o que que eu posso entender com os padrões aqui? Eu vou fazer uma associação da altura e do peso. Então, essa pessoa aqui que tem 50 kg, qual a altura dela?
É o primeiro valor aqui do conjunto de dados alturas na linha 6, 1,50 m. O, a segunda pessoa que tem 60 kg, né? A altura 1,60 m.
O último 85 kg é o peso dessa pessoa e ela tem 1,85 m. Então, qual é o padrão aqui? De acordo com o peso, de acordo com a altura dessa pessoa, né?
uma pessoa que é 10 cm ou 5 cm mais alta que a outra e vai aumentando o peso e assim sucessivamente. Então é uma questão aqui de causalidade. Conforme o peso aumenta, a altura também aumenta.
Isso serve para fazer uma pesquisa, né? Por exemplo, será que funciona assim? Ou tem alguém fora do padrão ali?
Eu posso ter também pessoas e de 1,50 m que pesam aí 80 kg, tá? Aí ele vai estar fora desse padrão de crescimento aqui dos nossos dados, ok? Então, simplesmente esses dados eles apresentam que existe um padrão bem claro de crescimento.
Bom, aqui eu tenho algumas opções a partir da linha 11. Eu tenho algumas algumas linhas de código, a linha 11, 12, 13, 14 e a 15, que são cinco linhas de código. Na primeira linha aqui, na linha 11, eu vou colocar o o no gráfico os dois conjuntos de dados, alturas pesos.
Ele colocou os dois conjuntos de dados dentro do gráfico. Esse skater é o padrão do meu gráfico, se eu não me engano, eh é um gráfico de dispersão. Ele vai representar os dados através daquelas bolinhas dentro do meu gráfico, que é um outro tipo de gráfico que nós temos também.
Na linha 12 eu tenho X label, é o eixo X, então é a legenda que eu vou colocar ali no meu gráfico. E aí eu vou escrever ali dentro, ó, altura em centímetros, tá? Então é a legenda que vai aparecer lá no eixo X do nosso gráfico, tá bom?
É o rótulo da base X do nosso gráfico. No Y, a mesma coisa. Peso entre parênteses KG.
Se eu quiser mudar o que vai aparecer escrito, é só alterar esse texto. Na linha 14 é o título do gráfico, ó, plt. title, relação entre altura e peso.
E na linha 15 é o PLT. Show, que é realmente para plotar, para apresentar o gráfico na tela. Então, show é o comando show e em inglês, né?
Mostrar. Então, pltshow, ele vai apresentar o gráfico na tela para mim, certo? E aí, como é que eu vou fazer isso?
Eu vou colocar aqui linha Python. Vou escrever aqui no meu terminal Python. Depois eu vou colocar o nome do meu arquivo.
Lá em cima eu consigo saber o nome do meu arquivo, ó, teste. py. E vou dar um enter.
E aí ele vai executar. Ele já rodou e ele apresentou o gráfico na outra tela, porque eu tô compartilhando aqui o outra tela, ó. Puxei aqui o gráfico e apresentei na tela para você.
Então é esse gráfico, gráfico de dispersão. Eu tenho aqui a altura em centímetros, a legenda na parte do eixo X. Vou aumentar um pouquinho a tela.
Altura em centímetros e no meu eixo Y eu tenho aqui o peso em quilos. Se você observar, ele começou um pouquinho antes de 1,5 m, que seria a altura da minha primeira pessoa. Essa tela tá bem bacana, porque eu tenho a primeira pessoa de 1,50 m.
E aqui no meu código na linha se eu também tô mostrando aqui 1,50 m. A segunda pessoa é 1,60 m. 1,55 eu não tenho ninguém.
Então, olhando o meu gráfico, eu não tenho nenhuma bolinha representada ali no meu gráfico, só tenho 1,60 m. Depois a próxima pessoa 165, que tem o peso aproximadamente de 65 kg. Então, lá no meu no meu na linha 9, no meu peso, ó, terceiro também é 65.
E aí eu vou colocando, ele vai pilotando no gráfico as informações que estão lá na lá no meu Python, lá nas minhas nas minhas linhas de código. A última pessoa 1,85 m 85 kg. Então a bolinha tá bem certinho ali, representando os conjuntos de dados que estão lá na linha de programação do meu Python.
Então aqui essa bolinha ela tá um pouquinho abaixo do limite do gráfico, porque o gráfico ali no eixo Y ele vai até o 90, tá? Então tem como configurar essas questões. Vamos fazer uma mudança aqui em um dado.
Tá vendo aqui que ele tá eh ele tá crescendo linear, né? Ele tá crescendo linearmente. É um crescimento linear certinho aqui.
Lá no último, no último dado, ao invés de 85 kg, eu vou colocar 80 kg. Então, a bolinha vai ter que aparecer na mesma linha aqui, na mesma reta imaginária aqui do do 80 de da pessoa que tem 1,80 m, né? Então, vou fechar aqui o gráfico, ele vai parar a execução do meu código.
Vou diminuir a tela aqui mais um pouquinho. E aí eu vou limpar a tela aqui no meu prom de comando. Coloquei clear, dei enter, ele limpou.
E agora eu vou aqui no meu código fonte na linha seis, onde eu tenho ali a a altura, não, no pesos, né? Eu vou colocar 80 kg. Então, tão os dois 80 kg.
Salvei, deu conttrl S. Vou aqui embaixo e vou novamente compilar. Seta para cima.
Ele já escreveu ali para mim, python test. py. Dei um enter, ele compilou, já apareceu o gráfico e eu vou apresentar para você aqui na tela.
Perfeito, já tá sendo exibido aqui o gráfico. Vou dando zoom aqui. E aí, como nós suspeitamos, né, a bolinha ali do gráfico tá exatamente ali no 80 kg.
Então essa última bolinha que tava mais para cima, ela ela desceu. Tenho certeza que ele tá trabalhando com esse gráfico, com esses dados. Vamos mudar a legenda aqui nas alturas.
Tá escrito ali alturas e o centímetros tá entre parênteses, né? Só com a sigla cm. Vou fechar aqui o gráfico.
Vou direto aqui na linha 12 e eu vou colocar eh em forma por extenso. Vou colocar ali centímetros. Vou salvar.
Vou tirar um pouco do zoom. Vou aqui no prompt. Vou compilar de novo.
Seta para cima. Já executei, ele já plotou o gráfico. E aí o gráfico tá sendo exibido.
E aí ele eh não, ele não ele não apareceu. Eu acho que eu tô estourando o limite ali. Então vamos vamos colocar só o CM mesmo.
Voltando, voltaram pro CM. Vou mudar outra outra coisa, colocar o pesos, tá? Vou acrescentar um S ali na palavra pesos.
Vou salvar. Salvei de novo. Vou ali no prompt.
Vou dar um clear. Vou compilar de novo. Python test.
pi. Enter. E aí eu vou colocar o gráfico aqui.
E agora a gente pode observar que realmente ele trocou ali de peso no eixo X, ó, de peso para pesos. Só para você ver que é realmente esse gráfico que eu tô trabalhando. Esse gráfico no Python, olha só que bacana.
Ele eu posso salvar ele no meu no meu dispositivo. Eu posso printar qualquer computador você consegue fazer isso. Eu dei o comando aqui como de outift 4 e aí eu consigo fazer o recorte de qualquer parte do meu gráfico.
copia pra minha área de transferência. E aí eu posso, por exemplo, ir no WhatsApp e compartilhar essa imagem, a imagem desse gráfico aqui para um grupo, para algum grupo ou pro para uma pessoa em específico. Perfeito.
Bom, então é isso que eu queria mostrar aqui para você no código Python com esse exemplo, certo? Então olha só, poucas linhas de código, poucas linhas de código mesmo para você representar esse tipo de gráfico, né? E lembra que eu falei que o tipo de gráfico aqui, né, esse cara aqui era o skater na linha 11 aqui, ó, plt.
sks skater. Então, o skater pro Python aqui quer dizer que eu quero trabalhar com esse tipo de gráfico que você viu que é o de dispersão das bolinhas que aparecem representando os dados. Ah, mas eu quero trabalhar com gráfico de barras, tá?
Então eu posso eu simplesmente eu vou alterar aqui, ao invés de skater, eu vou colocar bar, tá? Bar. E ele vai entender que eu quero agora que esse gráfico aqui seja exibido não mais como dispersão, mas um gráfico de barras, tá?
Lembra que eu tenho que salvar? Vou dar um contrl S para salvar. Vou vir aqui no meu prompt embaixo, vou limpar clear enter e vou compilar de novo.
Python espaçotest. py. Enter.
Ele já imprimiu o gráfico. Eu já tô trazendo aqui pra tela. E aí ele já transformou agora o gráfico em barras, tá?
é o mesmo gráfico a partir do mesmo conjunto de dados e agora ele está sendo representado com essa visualização de barras, os pesos e as alturas. Perfeito. Bom, quero chamar então a sua atenção pro quadro e ali você tá vendo o assunto, né, da nossa próxima aula.
Então, como analisar gráficos e tirar insites. Então, vamos continuar falando ali como que nós tiramos ideias para trazer significado ali pros nossos dados. Perfeito?
Espero você na nossa próxima aula. Um grande abraço e até lá.