E aí E aí E aí Oi pessoal boa tarde vamos lá é estamos começando nosso efetivamente nosso semestre já tivemos aula na segunda-feira né iniciamos apresentamos a disciplina agora já vamos caminhar e já vamos para algum conteúdo já nessas duas primeiras semanas né hoje na segunda na quarta talvez até na outra Semana ainda nós não iremos entrar especificamente no conteúdo da disciplina né para a parte de estatística mesmo de análise fatorial de Cruz ter e regressão logística principalmente Principalmente esses conteúdos Mas nós vamos fazer aqui uma é digamos assim vamos colocar todo mundo na mesma
página né quando nós estivermos falando de análise de dados o que que se espera como que a gente pode fazer qualquer ideia de análise de dados para Suportar o processo de tomada de decisão então nessa aula de hoje a gente vai tratar um pouquinho disso de aspectos bem Gerais ao ver um de vocês já não seja exatamente novidade já trabalham com isso já estão no meio para outros Talvez seja então mas a ideia mesmo com aqueles que já tem usados como insumo do dia a dia que a gente possa então é fazer uma recapitular aí
os conteúdos conceitos é para gente trabalhar ok então Quarta-feira 14 de Julho 2021 disciplina análise da dos quatro curso gestão da informação fazem o urso estou compartilhando tela com vocês aqui então na nossa tela está compartilhada e até pelo que nós pelo feedback do Alexandre por algumas coisas que a gente tinha visto tá as minhas telas aqui elas estão maximizados e eu não os vejo a maximização a ideia mesmo objetivo né que a gravação fique mais legível fico melhor então que depois A assistir Quem foi porventura é assistir essas aulas novamente quem for usar dessas
aulas desse material produzido e gravado que no final das contas é esse esse material tem uma melhor qualidade visual E mais uma vez agradeço Alexandre pelo pelo retorno pelo feedback e posto isto Qual que é a ideia eu não os vejo né nesse momento de tela e maximizada que eu tiver aproveitando alguma coisa eu não os vejo eu não os verei então para vocês Interagirem comigo abre o microfone e fala aí tá porque eu não estou não estou vendo o pé e não tem como eu ver o texto que vocês estão postando tá bom eventualmente
a hora que eu não tiver apresentando tela alguma coisa aí eu vou conseguir ver eu minimizo aqui o ambiente de apresentação E aí eu consigo ver mas é não deixem as questões passarem não deixe em né de perguntar Boa tarde participar é de novo né então é um ambiente Nossa é o momento nossa é Uma construção conjunta é o momento de nós desenvolvemos para além de conteúdo de analisados para menos conteúdo estatística ok então fica em Beleza Zé Tá deixe navio estamos juntos Muito obrigado tá bom tá ok gente a calma Ok sem problema em
Se quiserem a qualquer momento fiquei muito à vontade para interromper as vezes eu me empolgo aqui vou falando direto tá então fiquem completamente à vontade para para comentar a comentário hoje lá no Formulário do Google Docs tá então é é para gente comentar dos Passos dos seis passos do processo de geração de conhecimento baseado em dados Então quais são esses seis passos e uma descrição breve de como que eles esses seis Passos funciona Tá bom então nessas podem postar isso sobre a mente até o final da aula até um pouquinho depois do final da aula
entendo dúvida aproveitem é lá no formulário eu capturo a hora de postagem da data e hora então né a Postagem ela deve ser feita nesse momento nosso se for feito e depois tudo bem mas a Gênese da participação da presença e se não será contabilizado tá bom bom então vamos lá é esse material aqui na verdade eu tenho usado esse material né ele tá com a cara do mestrado profissional tá então esse problema de pós-graduação em gestão organizacional e o mestrado profissional a capinha lá do mercado profissional mas o material ele Não foi produzido especificamente
pensando no mestrado profissional e foi produzido e aqui né Acho que o que tá de melhor o que eu gostei mais do que tá com uma cara melhor é esse aqui mas eu tenho ele em diversos contextos tá eu acho que eu não tenho ele lá no site lá no Moodle Se quiserem depois é só pedir eu posso disponibilizar isso lá sem maiores problemas mas o que que eu trago primeiro esse material tá gente precisa nós precisamos né Vocês do Meio para o Final do curso agora já bem no final do curso de gestão da
informação a gente precisa consolidar coisas que Nós aprendemos que nós vimos Nos períodos anteriores A gente precisa de entender contextos de aplicação as coisas que nós já vimos e a gente precisa obviamente aprender caminhar ver novas coisas então nós temos né a pretensão de tentar colaborar a gente tentar ajudar com todos esses processos aí tá isso aqui é um digamos assim esse Esquema Esse foi no work do processo é esse aqui tá é o processo são seis passos que que nós comentamos é esse esse processo né ele ele é adaptado né ele né aqui adaptação
dele ele é do do modelo do Framework Cristo de VM então Cristo é o cross industries Thunder processos em formato de mini então toda vez que a gente vai falando na história criada Originalmente para o processo de mineração de dados para o processo de ilumine mais obviamente né ele serve Para qualquer processo de análise de dados e não só especificamente para o para o processo de derramar Nem que depois eu posso falar para vocês e no projeto pedagógico novo Inclusive tem uma disciplina exclusiva na específica para da Ilha Magno tá mas eu ando comentando disso
Em alguns momentos também mas agora com menos carga e comendo as responsabilidades que foi criado uma matéria específica para tratar desse assunto muito embora ela Esteja sob responsabilidade da faculdade de computação não é uma responsabilidade Nossa da Vargem então eu procuro dar um recorte muito de negócio dos conteúdos técnicos nosso então análise de dados pensando em problema pensando em resolução de problema deira mini pensando em problema e resolução do problema e menos os aspectos técnicos Então quando você estiver em contato com essa disciplina especificamente ó qualquer outra né E vocês quiserem Entender o ter uma
abordagem mais de negócio como que eu uso isso efetivamente para resolver problema de negócio estou à disposição de vocês para vocês precisarem hora que precisar e quando precisarem tá então esse bom pros Industry Standard processos Fronteira Mini é muito legal é muito interessante eu fiz uma adaptação dele para o processo de geração de conhecimento baseado em dados uma forma geral então né alguns de vocês já estão Trabalhando com isso outros começam agora outros irão trabalhar e começa a desde professores de outras disciplinas fala olha eu tenho uma base de dados aqui você analisa para mim
ou nas empresas de vocês os nos projetos um serviço tem uma base de dados você analisa para mim então isso né as vezes vai ser de uma forma leve e Sutil em um contexto Ameno Às vezes isso é vai ser o seu trabalho mesmo a sua atividade mesmo então a gente entender esse acabou se Esse foi no olho esse grande desenho é muito relevante é muito importante para a gente tá então nosso gestores de informação EA nomenclatura de trabalho de profissão que vocês vão receber como ganhar e é né Vai depender da empresa da área
enfim vai depender de uma série de coisas muda o nome das carreiras das profissões mas não muda a essência do que a gente precisa fazer e a essência do que a gente precisa desenvolver Então Dentro desse contexto né o nosso insumo a nossa matéria-prima tá nós somos aficcionados por dados a gente precisa de dados nós queremos trabalhar com dados nós procuramos dados né então gestor da informação ele né ele parte do princípio que eu nós teremos base de dados nós teremos dados disponíveis para nós trabalharmos então é a gente começa muitas vezes a gente é
comete alguns equívocos é quando a gente é solicitado o quando a gente tem a necessidade de Trabalhar com os dados né recebemos uma planilha e já logo queremos produzir algum resultado alguma análise a partir da a partir dos dados que a gente que a gente recebeu que a gente tem em mãos mas a coisa não funciona assim né a coisa não necessariamente funciona assim quando recebemos os dados para nós produzirmos alguns resultados se nós conseguirmos entender e trilhar esse ciclo do processo de geração de Conhecimento baseado em dados nós conseguiríamos ser mais felizes conseguiremos ser
mais produtivos e conseguiremos entregar melhores resultados então o primeiro passo dessa história toda é entender Qual que é o negócio Qual que é o problema que eu sou tratando né E então foi assim olha eu estou fazendo uma disciplina de por exemplo de análise financeira de matemática financeira então vocês sabem o que aquilo significa eventualmente tem Os indicadores financeiros Boy errou a tem uma série de questões que vocês conhecem lá que vocês têm então né Vocês precisam saber o que que se trata o que que se trata essa variável e a Lisa esse negócio Como
que é analisado e interpretado or whole o que que análise financeira o que que análise de balanço né imagina que vocês estejam é o Lucas falou que ele trabalha com no setor de imobiliário né que ele trabalha com Negócios Imobiliários uma forma Geral e o Lucas recebeu uma planilha de dados por exemplo que tem possíveis compradores ou possíveis locatários e com algumas variáveis naquela planilha né para ele é relativamente tranquilo porque ele entende do negócio né então ele entende desse setor que ele tá desse trocar ele trabalha ele entende do setor imobiliário de alguma forma
mas se outra pessoa outros de vocês né receberem esses dados essas planilhas né ou receber uma demanda de estudo ou receber Uma demanda de análises é fundamental que não as conheçamos que nós entendamos Como que o negócio funciona é como que é o ciclo do negócio como que funciona a indústria de cartão de crédito como funciona o varejo né eu vou fazer um estágio na própria ufa por exemplo e vou lá para para Diretoria de processos seletivos e tenho base de dados então eu tenho base de dados por exemplo de alunos que se inscreveram não
é para vestibular uma coisa do tipo Então qualquer coisa que nós formos fazer baseado em dados o nosso primeiro estágio nosso primeiro passo o nosso primeiro desafio é entender do negócio que nós estamos tratando e a gente vai detalhar isso aqui daqui a pouquinho detalhar um pouco mais tá mas como que a gente entende do negócio como que a gente vai saber o que que a gente tá fazendo a gente tem alguns caminhos para isso né Se for e o Lucas lá no na empresa dele no negócio dele que Demandou para alguns vocês algum trabalho
vocês vão conversar com Lucas Lucas como que funciona esse negócio né como que os clientes são cadastrados ele entra na sua base de dados como né como que ele atualiza dados quem são esses aqui então de onde que isso vem o cara o cliente cadastra pela internet por aplicativo de celular eh depois que ele tá cadastrado o que que acontece alguém atualiza esses dados posteriormente ele compra ele só Consulta Qual que é o suco como que esse negócio acontece então qualquer qualquer qualquer momento em qualquer momento que nós formos é gerar algum conhecimento baseado em
dados né esse é o primeiro passo essa é a primeira essa é a primeira etapa que nós normalmente passamos por ela tá a gente vai detalhar isso aqui mas de novo tá em qualquer momento Se tiverem aí Se tiver em quando vida se quiserem fazer pergunta comentário colaboração fiquei muito à Vontade a qualquer momento tá então entendemos minimamente o negócio né então algumas vezes nós já temos a base de dados algumas vezes nós não temos a base de dados bom nós teremos que extrair esses das vezes nós mesmos não era o nosso projeto se eu
tiver lá na empresa ou se alguém tiver de mandando ou enfim As vezes nós teremos que extrair os dados então né não é essa é uma talvez essa seja uma parte um pouco Em algumas situações um Pouco mais difícil quando nós mesmos temos que extrair os dados mas é uma atividade muito rica tá então às vezes lá na empresa né se nós não estamos lá na área de TI né na área que tem acesso aos dados nós vamos pedir a alguém que tenha acesso aos dados mas nós temos que a partir do entendimento de negócio
nós temos que especificar é o tipo de dados que a gente quer então nós vamos falar para o pessoal de t.i. forró Eu quero uma base de dados que é Dos clientes eu quero as informações a b c então aí nós vamos especificar para alguém extrair tá Eu particularmente sempre que possível eu prefiro eu mesmo extrair né eu mesmo ir atrás eu mesmo extrair nesses dados então é é um passo interessante aí para gente conhecer também um pouco mais dos negócios nós estivermos trabalhando então nós fizemos o primeiro passo já sei substancialmente a respeito do
negócio que estão tratando e dos problemas que eu quero resolver Utilizando alguma base de dados nosses traímos os dados né Então o próximo passo após a extração de dados é nós entendermos esses dados entender os dados significa mais ou menos o seguinte né quantos arquivos eu tenho eu tenho um arquivo Eu tenho dois eu tenho três e onde que eles estão eles estão na web eles estão em um banco SQL né eles estão de que forma tá eles estão em planilhas Excel eles estão in tests P Tá então quantas linhas tem qual que é o
tamanho Desse arquivo né então tem quantas linhas Quais são as colunas desse arquivo Então a gente tem uma série de questões a serem respondidas ou a serem entendidas nesse processo de extração e entendimento dos dados tá nós usamos conhecer então minimamente os dados que nós estamos que nós vamos trabalhar para nos dar luz dar respostas sobre algum né sobre algum problema é que nós é eventualmente iremos resolver então fizemos o passo 1 entendemos um pouco Negócio fizemos o passo 2 né extração entendimento dos dados vamos então para o passo 3 que é preparação dos dados
em qualquer processo de é de dados para suportar o processo de tomada de decisão essa aqui a parte mais hard Essa é a parte mais trabalhosa tá não temos exatamente os números disso mas isso aqui costuma ser pelo menos uns setenta e cinco porcento a oitenta por cento do esforço de trabalhar com análise de dados então o que que a gente Faz em preparação de dados a gente vai trabalhar com isso na segunda-feira em Excel como que a gente usa o Excel para preparar dados na quarta a gente vai utilizar o spss para preparar dados
e na outra semana nós vamos usar o Python para preparar dado Então nós vamos usar essas três ferramentas Excel é o mais amplamente utilizado mas tem limitação de capacidade spss é muito fácil de utilizar e muito robusto mas é uma ferramenta paga e o pai então é o mais Amplamente um dos mais o pai tão e o r Tá mas então o pai tá bem a amplamente utilizados hoje e é free tem outras funcionalidades tem outras possibilidades não tem uma série de virtudes uma série de vantagens em se utilizar a que o Python para análise
de dados tá então essa parte né O que que a gente faz normalmente Nossa Nós é tratamos os dados o que que é tratar né então tiramos é dados duplicados valores me se faltante é nós juntamos As Ilusões De Mitos nós fazemos uma série de operações né uma série de atividades quando nós estamos fazendo a preparação dos nossos dados tá nós derivamos outras variáveis a partir de variados esse só existem na nossa base de dados então nós fazemos uma série de atividades nessa preparação dos dados tá e as assim a gente vai falando vai caminhando
né mas é quanto melhor eu a fase predecessora melhor desempenho eu terei na fase sucessora e quanto mais Lacunas quanto mais vulnerabilidade eu tiver na parte antecessora pior será o resultado que eu vou entregar na parte final na na etapa subsequente aí das minhas atividades Então olha só nós gastamos né quase noventa porcento do tempo que a gente vai utilizar para desenvolver o nosso projeto de análise de dados e nós ainda não fizemos efetivamente a nossa análise de dados tá aqui na etapa 4 Que Nós entramos então na fase de análise estatística e Modelagem de
dados é bem verdade que na fase 3 na fase de preparação dos dados inevitavelmente tá a gente já faz alguma análise estatística Mas normalmente nós fazemos análise estatística mas descritiva né mas a eu tenho aqui uma variável salário bom então qualquer água salário médio Qual que é o salário mediano Qual que é o salário de um padrão desse salário então a gente entende a gente trabalha a gente observa isso aqui na preparação Dos dados tá E nessa fase então de análise e modelagem estatística aí aqui nesse ponto Nós entramos na disciplina análise das quatro tá
então o que que nós fazemos aqui a Então a gente vai fazer uma análise fatorial exploratória a gente vai fazer planos ter a gente vai fazer logística a gente vai fazer séries temporais que vocês viram com o Marcelo ruim na na cidade estrias Vamos fazer uma regressão linear vamos fazer aplicar aqui alguma né redes neurais vamos fazer Alguns o que que nós vamos fazer aqui a gente tá falando da análise efetivamente dos dados lá mas para gente fazer as análises né para gente chegar nesse ponto de analisar os dados de fazer as modelagens fazer A
modelagem estatística nós já temos É trilhado algumas etapas alguns passos anteriores tá então nós desenvolvemos né então por exemplo né a nossa base a gente tem uma base de clientes e a nossa base de clientes com milhares milhões de Clientes aqui tá então a gente criou né nós fizemos análise de custo e Nós criamos os grupinhos de clientes para Nós criamos alguns Então a gente tem um segmento aqui tem outro segmento aqui tem outros segmentos de clientes aqui então Nós criamos o segmento né mas isso Que Nós criamos nessa fase quatro Então eu tenho segmento
a tenho segmento b e tem os segmentos e esse segmento Que Nós criamos então b não é no nosso segmento B tem aqui 250 mil clientes com Determinadas características não sei eu tenho aqui 50.000 É nesse segmento C 50.000 clientes 250 mil clientes aqui eu tenho 400 mil clientes Ah tá então eu sei quem são eu sei o que o código eu sei nome eu sei gênero eu sei rindo eu sei cada um dos perfis desses segmentos aqui tá que eu gerei então né imagina que esse aqui é um perfil de clientes alta renda tá
imagina que é que esses aqui seja o cliente de Perfil a partir da segmentação que eu desenvolvi nós temos a predominância aqui nesse nesse segmento de clientes alta renda esse aqui baixa renda por exemplo tá esse aqui né de renda intermediaries então Nós criamos a hora que a gente fez aqui aplicou a etapa quatro nós desenvolvemos E chegamos Aquele modelo ali mas a gente precisa testar avaliar validar se isso que nós produzimos está ok se isso que nós produzimos faz sentido se isso que nós Produzimos poderia ser utilizado para suportar algum processo de tomada de
decisão eu posso tomar decisão baseada nesses modelos estou desenvolvendo o desenho né trabalhei lá no Tribanco lá na minha vida pregressa EA u tá então uma das atividades que eu fazia não era desenvolver modelos para decisão de crédito de concessão ou não concede ou não concede crédito para os determinados clientes então nós desenvolvemos modelo é nós desenvolvemos modelos aqui mas Antes das pessoas começarem a usar aquele modelo para emprestar dinheiro para não emprestar dinheiro nós temos que ter grupo de controle nós temos que desenvolver testes nós temos que ter uma série de processos para ver
se o nosso Modelo ele é confiável ele era confiável e se eu posso tomar decisões baseadas Aquele modelo passou pela fase de teste avaliação e validação nós vamos concluir nós vamos recomendar e nós vamos implantar e essa situação é cíclica em Qualquer momento né E ela é cíclica mas não é só em uma direção muitas vezes nós estranhamos os dados e vamos voltar na etapa anterior para nós entendermos negócio porque tem a partir dos dados que eu que nós recebemos os dados não estão de acordo com o negócio ou nosso entendimento está equivocado então às
vezes a partir dos dados nós precisamos voltar não é etapa anterior às vezes nós estamos preparando os nossos dados EA gente vai ter que Voltar de novo na fase de extração entendimento dos dados olha não tenho todos os dados Eu precisaria de uma outra tabela de uma outra arquivo de uma outra situação então a gente volta na situação anterior ou eu posso voltar lá no primeiro herói a partir da preparação dos dados né o entendimento que eu tinha de negócios Não tá fazendo muito sentido então Eu precisaria voltar lá entender né de salário do Uber
de tirar dúvidas no estamos na fase de análise Estatística às vezes temos que voltar e fazer alguma transformação alguma modificação dos dados nós fizemos as hoje e voltar e extrair novos dados porque os dados que nós tivemos extraímos nós estamos trabalhando eles não são suficientes para para nossa análise para nossa modelagem às vezes vamos ter que voltar lá né Tava anterior então em cada uma dessas etapas nós precisamos né testei o meu modelo não é útil não é bom não é então ou ele tá Errado Tem visto no modelo erro de implementação ou alguma situação
né então eu posso voltar na etapa imediatamente anterior ou eu vou voltar lá na etapa de preparação dos dados ou eu vou voltar lá na etapa de extração de novos dados ou eu vou voltar lá na etapa de entendimento do negócio do problema então esse aqui é o nosso arcabouço de de ar de uso de dados para suportar o processo de tomada de decisão então resumo da Ópera aqui né É tem várias Etapas as etapas são de alguma forma é dependente suma E outra ela se é em cada etapa que nós tivermos nós podemos voltar
em etapas anteriores para nós entendermos para nós conhecemos a e é sim a gente não deveria né Toda vez que nós formos fazer alguma análise baseado em dados da gente já partir da análise dos dados por Clemente dito nós teríamos que né Faz parte das boas práticas do bom uso nós fazemos algumas atividades algumas etapas Anteriores então tô só descolorindo aqui um pouquinho quando eu vou falando tá então essa esse é o resumo você é a síntese tá então para não é para o comentário lá no nosso formulário do Google Docs é né falar dos
quais são esses seis passos e um comentário breve muito breve tá duas três linhas coisas se nem isso sobre cada uma dessas dessas seis etapas do processo de geração de conhecimento baseado em dados ok a gente detalhes E diz que a gente falou tem alguma pergunta alguma dúvida querem fazer algum comentário professor é só sobre o Formes vai ser aquele mesmo forme sou senhor vai criar outro é o mesmo lá eu consigo capturar por data Ah tá tá certo vou te mandar o link de novo só aí a gente já salva aqui mas sim só
instantinho que eu já faço isso agora beleza obrigado obrigado eu o professor só uma perguntinha também peço perdão se ficar arredondando de não Tinha galera pede um grande vai dar um perguntar a galera tá indagando aqui no grupo se este forme seu que vai contar a presença da gente tá falando que sim tem que colocar os exercícios a meio eu não conto presença então presença eu não ninguém vai ser reprovado por falta a ninguém absolutamente ninguém só que eu dou 16 pontos por participar essa 15 pontos por participação e essa participação e pelo formas e
é outra coisa também isso aí também Está sendo motivo de dúvida a garota forma gente tava falando que era 15 pontos ele tem gente que fala aqui esposa dentro do dentro do Senhor dentro do cinza e pronto dentro do sem cautela não fale se ele fosse acontecer tão então muito marido mata demais tá é quando é no no é que tá perguntando desculpa é o Lucas o Lucas quando era modelo presencial Lucas Eu normalmente eu distribuo porque tem prova prova aquele negócio chato e etc etc Eu Costumo distribuir mais pontos extras mas nesse modelo remoto
eu não via necessidade de distribuir pontos esses tá então porque a forma de condução dos projetos tirei prova tirei essas coisas e quem vai direitinho não tem não tem erro lá no final entendeu E aí quem não vai direitinho não faz sentido. Isso também tá é mais ou menos essa lógica tá beleza pessoal grande não imagina Vamos ver acho que esse link aqui vamos ver se vai dar certo aí ó E aí a gente entra nesse link toda vez todo às vezes que tiver aula aí eu não entendi muito bem o que que você quer
que a gente escreva você quer que a gente coloca tipo tudo e esses seis Passos aí e explica cada um deles número é cada dia vai ser uma coisa diferente que eu posso pedir entendeu para o de hoje você vai por lá só matrícula nome assim o que importa mesmo é matrícula E a resposta tá ela tem uma tenho aí tem que a resposta aí a resposta é a Pergunta que eu fiz hoje ó assim a né O que que eu tô pedindo hoje eu quero que vocês coloque né processo geração de conhecimento baseado em
dados etapa um entendimento do negócio problema diagnosticar perguntaram entender o problema que nós vamos usar os dados para tomar decisão é tapa dois né extração e entendimento dos dados verificar onde os dados estão buscar tratar então coisas bem elementares assim bem simples mas que eu vejo que Vocês pelo menos leram e entenderam para esse caso de O que que a gente tá falando a respeito tá bom ah tá claro não fica dúvida não é importante Oi e aí para cada dia a atividade será uma tá Liliane dá uma semana passada da segunda era só falar
de que nós plantamos na no nosso encontro na nossa aula Tá certo ok então não ninguém é reprovado por falta eu não é pros por Falta nesse modelo é moto tá é o que que eu tô fazendo diferente dos outros semestres é que eu tô valorizando muito quem participa tá quem tá junto quem participa quem comenta quem discutir Quem tá aqui com a gente é a todo instante então por isso eu estou pontuando É nesse modelo nesse formato mas não tem reprovação por falta tá não é essa não é assim que a gente tá mais
preocupado que eu fiquei mais assim era como você queria que fizesse essa Resposta entendeu o dia ela for mais rígida eu vou falar assim ontem que ser resposta precisa e nesse contexto mas o dia que for mais linda nesse nesse formatinho tá ó a beleza e obrigado pela pergunta não fiquei com dúvida não porque a gente tira dúvida aqui e não precisa ficar inibido e perguntar não tá de comentário de te perguntar Professor sim é só falar sim pode falar eu não sei se Já tinha falado é uma anaconda minhas gozar né de novo a
gente vai assim é livre você pode usar né instalar o Python na sua máquina se quiser você pode instalar o anaconda e usar o Júpiter notebook você pode usar direto no collab do Google por exemplo o uso é livro Agora sim ah mas o que que as aulas serão conduzidas com as aulas serão conduzidos né É sempre a primeira na semana que vem que eu vou dar uma introdução à análise e ao tratamento de Dados utilizando o Excel as aulas é os slides as explicações eu faço utilizando o spss e fácil utilizando o pai tô
Então faça os exames as duas as duas coisas tá mas o ambiente e eu uso eu tenho instalado anaconda eu tenho instalado o super notebook bom então eu descobri disponibilizo material né os notebook tudo pro Júpiter mas ele esses notebooks eles rodam no Google colab por exemplo você precisa nem de ter instalado na sua máquina né Se você criar um usuário no Google dá para usar lá pelo Google colab por exemplo tá bom não tranquila tava pensando em usar igual da última vez que eu fiz mais PSS e não há na conta de beleza perfeito
e outra coisa também é o seguinte né Se quiserem a vou utilizar o estátua por exemplo vou utilizar outra então podem a ferramenta não é a questão a questão mesmo é quanto mais ferramenta né para vocês conhecerem melhor é a questão de de mesmo de se equiparem Se aparelhar em para os desafios aí que a vida irá apresentar os mais né não não não tem exigência de ser uma ferramenta ABC é Particularmente eu conheço bastante quase todas essas ferramentas da pessoa vou fazer utilizando o estátua para mim tudo bem sem problema tá Eu consigo avaliar
eu consigo analisar eu consegui entender Sem problema nenhum o e as aulas gravadas as aulas ficam todas gravadas ou por exemplo a gente essa essa aqui essa aula tá sendo Gravada Aí terminou aqui não sei se hoje não sei se amanhã eu subo ela para o YouTube e eu disse Jobim que não mudou no Moodle tem também os links das aulas na nossa disciplina já está lá na eu vou liberando aos poucos mas já tendo semestres anteriores também Ah tá bom há mais dúvidas mais perder Professor sim uma pergunta a respeito do negócio até quando
eu posso responder do do do Google do documento sim até Hoje sete horas da noite a beleza o dia que for coisas mais complexas e que precisar de mais tempo eu até posso dar mais tempo mas o dia que foram coisas mais simples é meio o horário de aula mesmo Entendeu Tá certo tá bom e aí o meia hora depois é de flexibilidade também para as vezes Alguém teve que sair algum ficou até o final e precisar de aí tem esse tempinho aí também de flexibilização para não sei nem nem tudo no extremo tá bom
E seguimos então agora o que que tem nos próximos slides aqui eu detalho eu passo com mais é com mais detalhe por cada um por cada uma das etapas que eu comentei ali anteriormente tá então esse processo de geração então de conhecimento baseado em dados quando nós tratamos no entendimento de negócio então né a gente esse entendimento do negócio organizacional ou de problema de pesquisa a ser equacionado o que que o que que é esse esse entendimento né Então o Quais são as etapas o que que nós fazemos tá nós precisamos reunir e registrar o
máximo de informações sobre o assunto então se eu estou fazendo de uma determinada empresa imagina que eu tenho que fazer um projeto para rotina para Imobiliária Rotina Imobiliária Então quais são as possibilidades da gente registrar o máximo de informações sobre assuntos de gente conhecer o máximo de coisas a respeito daquilo né a gente A visitar o Website da organização a gente pode entrevistar conversar com pessoas a gente pode pesquisar sobre o setor de atuação né então não sei exatamente da rotina mas como funciona esse setor imobiliário né Tem eh setor de compra e venda Setor
de locação como funciona esse negócio a gente pode pesquisar artigos artigos científicos né a gente pode pesquisar normas e legislação então é muito relevante é muito importante assim da mental que nós Entendamos é sobre o problema sobre organização sobre o negócio que nós estamos tratando por exemplo nas nossas aulas da semana que vem e da outra que nós formos fazer a introdução análise de dados nós estamos utilizando uma base uma base de dados que diz respeito à operação de cartão de crédito imagina que fosse da empresa Tricard então né então gestão do limite o cartão
de crédito Então mas as possibilidades eh ir lá visitar empresa o site da empresa Em quais produtos essa empresa tem o quê que ela oferece Como que o funcionamento como que é como que é o negócio desse dessa empresa tem vezes nós teremos muitas dessas informações tem vezes que não teremos muitas mas essa é isso que a gente tem que fazer a gente tem que ir lá tem que conhecer tem que pesquisar tem que ir procurar saber coletar o máximo de informações possíveis acerca da da empresa do negócio e nós queremos trabalhar a imagina que
vocês vão fazer Um trabalho né que é para área pública e vocês vão ter que trabalhar com dados da educação então foi assim né E a gente tem que entender esse índice de desenvolvimento da educação básica então nós vamos trabalhar com dados da educação né então o ideia viu em desenvolvimento Educação Básica é a base da Dica nós vamos trabalhar então a gente vai lá para o portal do Ideb né a gente vai entender vai conhecer vai saber como que funciona então tem o Índice de desenvolvimento da educação BA o que nós vamos conhecer isso
aqui tá então tem o Ideb por escola tem as metas resultados sistemas apresentação de onde que isso vem do censo escolar do sistema de avaliação da educação básica então saiba mais legislação outros documentos então eu vou utilizar essa base de dados eu preciso saber o que que é esse negócio né quando eu estou falando de do Ideb jeans eu vou comer Educação Básica antes de eu ir analisar os dados Totalmente ditos né eu tenho que saber como essa coisa funciona né então eu tenho que ler e entender saber é isso eu já tô dando um
pouquinho de spoiler né aqui para vocês do trabalho que vocês tem que me entregar que eu trabalho da disciplina então na primeira etapa do trabalho de vocês é um pouco desse entendimento do negócio vocês vão ter que escrever um pouquinho tá Não precisa de fazer um tratado a respeito disso mas vocês vão ter que escrever um pouquinho Sobre o quê que vocês estão tratando né sobre né Ela é só os dados de uma empresa a empresa que faz o que os dados dizem respeito ao que são Dados Públicos como que esse negócio funciona então vocês
vão ter que produzir alguma coisa uma introdução e Fala aí um pouco desse entendimento do negócio tá é então é a gente precisa né então eu tenho que ir sistema de avaliação da Educação Básica o índice de desenvolvimento da educação Básica então eu coloquei exemplos aqui de portais de sites né aonde que a gente tem as informações que a gente precisa nós precisamos certificar que existem dados suficientes e acessíveis para nós analisarmos isso aqui é um grande desafio pessoal e né De agora para a vida para sempre Principalmente quando a gente tá pegando projetos quer
seja em consultoria quer seja na empresa que nós tivemos trabalhando que alguém nos pede olha precisamos de fazer uma análise de Dados para entender o comportamento dos nossos clientes né Então esse é um ponto crucial tá a gente a entender saber certificar que existem dados suficientes e acessíveis para nós analisarmos tá a coisa manda as coisas mais comuns mais normais né querer muita gente que é querer muitas áreas querem muitas pessoas querem mas muitas vezes nós vamos ver nós temos às vezes boa parte das vezes nós não temos dados suficientes às vezes quando temos dados
Suficientes eles podem não ser acessíveis então esses dois itens né sobre os dados suficientes e acessíveis eles são fundamentais para o nosso processo de análise dados para gerar conhecimento baseado em dados ok Aqui é um outro né um outro exemplo da indústria de cartão de crédito então o que que nós precisamos saber né então nunca por exemplo no cartão de crédito de onde que vem o faturamento né como que as empresas de administração de Cartão de crédito Oi tá de onde que vem o Né o dindin então o dindin vende seguinte né cada um de
vocês tem cartão de crédito aí cada um de nós tem um cartão de crédito tá então nós temos cartão de crédito e uma coisa que que as empresas operadoras de cartão de crédito elas observam é o ticket médio ticket médio o seguinte eu fui a passeio meu cartão de crédito e comprei lá 10reais e eu fiz a primeira compra comprei 10 Reais eu fiz a segunda compra e comprei 20reais eu fiz a terceira compra e comprei r$ 30 Então olha só Qual que é o meu ticket médio em média quando eu compro o meu ticket
médio vale quanto 2010 mais de 20 e 30 mais 30 60 60 / 3 20 o meu tíquete médio né o meu ticket médio é 20reais então esse conceito de Ticket médio de Ticket valor de Ticket médio às vezes ele muda de nome mas ele é um conceito fundamental em qualquer análise de compra de consumo de clientes Nós vamos fazer esse é um conceito importante né obviamente o que que normalmente nós queremos né Nós queremos elevar o tíquete médio dos consumidores nós queremos enquanto empresa enquanto alguém que tá usando usados para suportar algum processo de
tomar hoje nós queremos que as pessoas os clientes consumidores em média eles gastem mais com a gente né então que eles usem mais o nosso cartão é que as compras sejam de maior valor então um Dos indicadores né um dos kipiais Cadê você um dos kipiais um dos Capes que que significa esse escapes né é que é performance indicator indicador estado de performance então desses Capes que nós procuramos o que nós tratamos o tempo inteiro né está relacionado ao ticket médio em média cada vez que o consumidor consome com a gente cada vez que ele
usa o cartão em média ele gasta quanto um outro clipe aí o outro indicador importante é a frequência né Então é o que que essa frequência normalmente a gente relaciona aí só um ciclo por exemplo ao mês então o indivíduo Ele usou o cartão quantas vezes ele usou uma duas três quatro 16 quantas vezes ele usou isso no mês então se a gente tem o ticket médio e se a gente tem a frequência a gente já tem uma ideia de qual será o nosso faturamento gente consegue né começar a ter uma ideia disso o outro
muito importante na indústria de cartão de Crédito é esse índice de ativação o que que esse em si de ativação em um determinado período em um determinado mês a na minha base de dados tem um milhão de clientes que tem o cartão de crédito mas no mês de junho né só é setenta por cento dos clientes usar um cartão de crédito pelo menos uma vez Então o índice de ativação desse cartão foi de setenta por cento até então na o Puxa vida tem um milhão de clientes só 700.000 usaram e os outros 300 mil por
Que que não usaram Será que Eles escolheram um outro método de pagamento outra forma de pagamento ou será que eles têm outro cartão de crédito utilizar outro cartão bom então mais ou menos essa lógica né a base é a quantidade que eu tenho então nós falamos aqui por exemplo então de 1 Milhão né de clientes Então essa é a base de dados que eu tenho e os serviços que a gente pode pendurar né que a gente pode juntar nessa nessa operação Nossa Que a gente tá está ofertando né que eu posso vender Seguros eu posso
vender prêmios eu posso eu posso pendurar tarifas cobrar por isso Então como que nós podemos gerar serviços né os pais S vá serviço de valor agregado adicionado né Para a gente aumentar do outro lado aqui o nosso faturamento então qualquer negócio que nós estivermos pensando é bom a gente entender como funciona esse negócio Qual que é o modelo de negócio como que é né como que esses dados são Produzidos como que esses dados são gerados né Então essa é uma né esse a indústria cartão de crédito mas com adaptações Isso serve para qualquer coisa para
qualquer lugar né Às vezes aqui eu tô querendo né a gente tá falando aqui de faturamento Mas será que se eu tivesse trabalhando com dados da educação escolar então por exemplo aqui ao invés disso eu queria analisar é o Ideb então o Ideb ele Depende de quê né é uma coisa é a quantidade de alunos por Exemplo né então né ele a função da quantidade de alunos ele é função do índice de aprovação e esse aprovação ele é em função da nota em português ele é um função da nota em matemática Então olha só não
tem nada a ver com compra com venda com né tem a ver com o índice de desempenho da Educação Básica mas eu tenho um modelo de geração de ciente desempenho da educação básica então é importante a gente entender quando a gente vai trabalhar com base de dados a Gente em contextos entender de onde que as coisas vem para onde que as coisas vão entender como que os dados são produzidos e o que que esses dados podem significar tá então isso é muito relevante é muito importante né Isso aqui é uma coisa meio da minha cabeça
tá então isso é só para ilustrar mesmo não tem uma comprovação matemática mas eu quero dizer para vocês o seguinte aqui tá aqui na verdade não é NFA tá f aqui Mas é Obá e business Analytics tá então Business Analytics a o business Analytics ele Depende de quê né nós seremos tão efetivos na nosso no uso de dados para suportar o processo de tomada de decisão a partir de características de dados que nós tivermos Então quais são essas características a gente tem amplitude O que é amplitude né então por exemplo vocês estão trabalhando com imagina
lá para facilitar o entendimento de vocês Tô trabalhando com um arquivo Excel quantas colunas quantas variáveis eu tenho né Eu estou falando em profundidade Qual que é o detalhe eu tenho os dados por aluno ou eu tenho os dados por turma ou eu tenho os dados por escola então né a profundidade a no nível macro porque alunos eu junto em turma Turma seu junto em escola né então se eu tenho os dados são em nível de escola eu perco a profundidade porque eu não conseguiria nas árvores entende Turma e nem conseguiria analisar desempenho de alunos
né então profundidade diz respeito a isso e o histórico eu tenho os dados só de 2021 ou eu tenho dados também 2020/2019 2018 Então qual é a qual é o comprimento qual que é a é a extensão desse histórico que eu tenho aqui de dados outra coisa né esses dados eles são integral e o que que significa essa integração de dados né eu tenho a base de dados aqui eu tenho uma base da de usar E eu tenho a base da zoar eu tenho a dados à base de dados B né aqui eu tenho né
o clientes sei lá e aqui eu tenho pesquisas dados e pesquisas mas eu consigo relacionar cada um dos clientes dessa base aqui com cada uma das pesquisas aqui tem uma chave tem um código do cliente aqui e tem a chave o código do cliente aqui às vezes os nossos dados não estão integrados eu não consigo às vezes juntar reunir base de dados diferentes então às vezes é uma Angústia né isso com vocês alguns vocês já sabem outros ainda não isso é tratado em um banco de dados msdb deciplina que vocês têm né que essa ideia
de chave né eu para juntar informações para juntar a tabela diferente para juntar dados diferentes eu preciso ter elementos comuns em seus dados que a gente chama de chave no jargão de quantidade O que é um por exemplo né quando eu falo de pessoas há em todo lugar que eu tiver analisando eu tenho CPF a tenho CPF Então CPF é uma chave natural dos dados que eu tiver tratando e eu consigo juntar dados diferentes locais diferentes lugares tá outro elemento né que é relevante é a qualidade dos dados né então a gente vai falar muito
disso e vocês vão se deparar com isso aí no decorrer da disciplina tá principalmente é no que diz respeito ao trabalho vocês vão fazer e as bases das vocês vão ter né então é esses dados são confiáveis né eles têm é dados faltantes eles têm out Lá eles eles têm né Qual que é o nível de limpeza de pureza de qualidade desses dados eles são fidedignos eles estão desatualizados então todas essas são características dos lados e depois a gente tem né então o Skill é a minha habilidade para saber se trabalhar com isso tudo para
você Oi e eu tenho infraestrutura adequada para isso então quando nós estamos trabalhando com dados quando nós nos propusemos a fazer alguma análise Baseada em dados né aqui gente chama de Bis analíticos é importante essas questões todas tá mais aqui na disciplina o que eu tento né ajudar vocês principalmente não limitado a mas é desenvolver Skills para análise da de uma forma geral então é um pouco disso que a gente tá fazendo mais lembrando né É aqui é só agulha é só um pouquinho tá em vários de vocês vão ter que correr atrás disso né
eles vão continuar se desenvolvendo Eu tenho 50 anos e nunca Paro de aprender de estudar de pesquisar e quanto mais estudo eu sei que tem muito mais coisa ainda para aprender então isso também vai ser a vida de vocês com a mais absoluta certeza tá então a gente sai da faculdade é sabendo aprender né então a Oi tudo de fazer a faculdade não é que a gente vai saber sair da faculdade sabendo tudo mas a gente vai sair daí sabendo aprender Então essa é a principal é o principal ponto e aqui na Disciplina né nos
encontros que a gente tem eu tento da melhor forma possível ajudados aí ela desenvolver os Esquilos para vocês continuarem caminharem Navegar aí no processo analisado de vocês depois de entendimento dos negócios o próximo passo é obtenção entendimento preliminar dos dados né então os dados é obter os dados especificados previamente né ou receber de alguém ou obter por conta própria Então qual é o método utilizado para Capturar os dados né eu vou utilizar algum algum o de BC o que que esse negócio de odbc a gente tem os bancos de dados lá nas nossas empresas tá
então quem é responsável por eles é o pessoal de lá dos their da área de t.i. e a gente pode para as vezes tem um sistema que estão pendurados aqui na o banco de dados né que a gente acesse que a gente tem as telinhas e muitas vezes por esse sistema a gente consegue gerar os relatórios e por exemplo Exportar os dados para o Excel as vezes a gente consegue fazer isso então a gente extrai os dados e exporta para Excel às vezes não não tem um relatório aqui né nesse nessa nessa interface de sistema
Nossa não tem um relatório aí a gente pede às vezes lá para o pessoal de isso aí eles vão gerar para a gente isso o arquivo as bases às vezes em csv às vezes no próprio Excel tá Às vezes em ter XP depende do formato aí que a gente combinar com eles então a gente tem a Opção de a ser isso já disponível nas interfaces do sistema a gente ter isso é gerado por alguém que tem acesso a esses dados ou às vezes é bem normal empresas também tá o quê que o indivíduo lado tem
ele faz ele cria aqui uma janelinha para gente tá o quê que é seu DBC ele cria para gente um digamos assim um caminho o caminho o usuário e uma senha Ah tá isso tem né então para cada sgbd Eu tenho um tipo de DBC por exemplo se o meu sgbd for my SQL se for hora qo É depende então o que que acontece tá depois a hora que tiver no Excel vou mostrar para vocês estão com esses parâmetros aqui eu lado o meu Excel tá então eu usuário tô lá no Excel aí lá no
Excel tem opção Abrir dados Obter dados e tem opção o DBC então eu vou direto com Excel lá no banco de dados eu vou conectar lá no banco de dados e busco dados direto desse banco de dados via é Sistema deve ser para gente fazer isso a turma lá que é dona responsável pelo banco de dados tem que dar para gente esse acesso para gente acessar lá o nosso banco de dados tá isso pode estar disponível em algum lugar né a gente fazer o STP para gente baixar buscar esse arquivo mídia física cada vez mais
raro tá então antes era muito normal né isso não disquete DVD CD depois pen drive HD externo mais cada vez É raro e hoje a bola da vez é os dados Estarem em nuvens né então a gente acessa alguma nuvem né então com alguma permissão com alguém com a mim alguma situação e nós baixamos esses dados tá então são as principais formas de nós recebemos em nosso bailamos com um de nós recebemos os dados para nós trabalhar esses dados podem estar no formato relacional é um banco relacional que a gente chama de banco SQL pode
estar em não SQL por exemplo em longo de beber ou qualquer coisa do tipo tá podem Estar em Excel em TXT em csv XML em dias somos em MP4 isso pode estar né de qualquer formato esses dados podem estar de qualquer formar e os dados tá aqui a gente né nós vivemos em uma sociedade em um mundo digital tudo que nós fazemos vira dados em algum lugar mas a gente tem os dados não estruturados os dados semi os dados e os dados estruturados o que que são dados estruturados são os dados que tem uma estrutura
né então Normalmente a nossa planilha Excel né então ela tem lá o que ela tem as linhas ela tem as colunas os nossos dados tão bonitinho em linhas e colunas então nós temos dados estruturados né é mudado mais fácil de trabalhar né quando ele tem uma estrutura quando a gente conhece a estrutura então normalmente está em formato de tabela tá então beleza quando estamos estruturados mas isso aqui os dados estruturados né na sociedade atual no mundo atual isso provavelmente é Menos de 10 porcento dos dados digitais que são produzidos então nós temos um grande volume
de dados semiestruturados e nós temos um volume massivo quase noventa porcento de dados não estruturados então a gente tem dados não estruturados semiestruturadas e estruturados os dados não estruturados né você o ar uma foto no Instagram no Facebook né E fica um vídeo lá no Tik Tok qualquer coisa que vocês fizeram tá Então aquele vídeo né o texto a mensagem são Dados não estruturados né então os dados não tem uma estrutura pré-definida então é a grande maioria dos dados que são aqui são produzidos uma forma geral e a gente tem os dados semiestruturados o que
que são os dados semiestruturados são os dados que uma parte tem estrutura e a outra parte não tem estrutura né então exemplo de dados sendo estruturados é um e-mail Como assim o e-mail é semi-estruturado tá Então cadê Minha caneta eu perdi e três então no e-mail né ele tem lá o que ele tem o remetente ele tem o destinatário ele tem data ele tem hora e ele tem né ah o título bom então isso aqui tem uma estrutura tá vendo bom então o cabeçalho do e-mail ele é estruturado agora o corpo do e-mail eu posso
ter texto eu posso ter lá o arquivo de áudio eu posso ter vídeo eu posso ter imagem eu posso ir qualquer Coisa no corpo do e-mail então o cabeçalho tem uma estrutura é estruturado e o conteúdo o Né o corpo do e-mail não estruturado normalmente então esses dados são sendo estruturados Tá quanto é a gente não é quanto mais estruturado mais fácil de trabalhar tá então é o nosso desafio muitas vezes a gente vai servir dados semiestruturados ou não estruturados o nosso desafio é criar alguma estrutura a partir desses dados que a gente tem aqui
via de regra Tá tudo que a gente faz com texto com imagem reconhecimento de padrão reconhecimento de imagem de texto processamento de linguagem natural na verdade a gente tá pegando dados não estruturados e tentando é uma estrutura transformar esses dados não estruturados Então a primeira parte o primeiro desafio nosso é pegar os dados não estruturados ou sendo estruturados e tentar criar propor alguma estrutura para nós analisarmos os Dados estruturados tá então mas a grande volume de dados são os dados não estruturados que a gente tem então esse entende a obtenção entendimento ainda em volta olhar
mais atentamente os dados disponíveis o entendimento de desenvolve acessar os dados e explorar os usando tabelas e gráficos e isso permite inspecionar precisamente a qualidade dos dados então isso aqui também está na fase 1 do trabalho de vocês então né Essa parte de dispor a dia entender de Conhecer então no trabalho que vocês vão entregar a fase um ela a fase 1 do trabalho envolve o passo um dois e três o 3 né É e flexível o que hora que vocês tiverem na etapa na etapa 4 que vai ser efetivamente as outras três fases do
trabalho vocês poderão voltar e processar esses dados novamente tá mas basicamente a primeira etapa do trabalho que vocês tem que entregar diz respeito as etapas 1 2 e 3 desse processo aí que Nós trabalhamos então isso envolve também né Quais os tipos de valor que nós temos né os dados podem ter uma variedade de formatos tais como dados no médico dado categórico sequência de caracteres boliviano então nós temos que prestar atenção ao tipo de valor né que pode prevenir problemas é muito complexo trabalhar com a variável tipo data especificamente tá porque complexo trabalhar com a
variável do tipo data porque é a Rigor a data é armazenada Como um número então toda a data né Ela é armazenada internamente no softwares como o número bom então sei lá a data de hoje eu sei qual não sei qual é o teu número tá mas imagina que você juntos 77 829 320 imagina que foi que seja isso aqui tá e o valor numérico para data de hoje aí o que que nos vemos no Excel no software no nosso sistema operacional tudo que a gente vê a gente vê isso aqui formatado por exemplo né
padrão brasileiro então a Gente vê é 14 e a gente vê se aqui como 14 dos at2021 Ah mas e se for o padrão americano né então eu tenho 2021 e é 07 14 e se for é de ano de mês dia ano mês então esse for Windows no formato Windows a gente tem uma variedade enorme de representação de máscara para representar data mas a data é armazenada como número só que o que que acontece como a gente faz intercâmbio muito de dados entre Ferramentas entre softwares muitas vezes um sofre está configurado com uma máscara
e o osso está com outra aí nós perdemos né nesse meio aí de levar o software de uma plataforma para outra de levar à base de uma plataforma para outra de tratar esse diferente contexto dependendo do jeito que o formato isso no Excel às vezes eu perco essas datas e a gente tem que tomar muito cuidado quando nós estamos trabalhando com o e no formato datas tá bom E é ainda né E se a obtenção entendimento preliminar também contempla verificar quais atributos né quais colunas do banco de dados parecem ser mais úteis para a gente
analisar verificar quais atributos parecem relevantes verificar se há dados suficientes para tirar conclusões caso seja necessário combinar diferentes fontes de dados verificar se é possível né se tem chave e qual é o nível de granularidade para gente trata para Gente fazer essa junção esse cruzamento de base de dados e avaliar como os valores omissos serão tratados no valor ou misto ausente Nice então às vezes quando um dado numérico muita gente substitui em muitas situações os valores omisso por zero e a gente vai tratar disso vai começar disse bastante aí para frente tá então às vezes
a gente pega e substitui isso aqui por 0 e na grande maioria das vezes isso está errado tá a gente não deveria fazer isso Tá P Às vezes o valor ausente né o zero é um valor válido tá então zero é um número um valor válido eu tenho que ter certeza se o meu valor omisso se o meu valor ausente ele é zero ou não porque se ele não for zero se eu não tivesse certeza que ele for zero e eu substituir por zero eu estou modificando aquelas variável substancialmente e os resultados que eu possa
vir a obter podem ser totalmente Inválidos e reais não serem úteis para a análise a gente Pretende fazer tá Ah e ainda a gente tem que prestar atenção à qualidade dos dados né então como os valores omissos serão tratados né então é inclui valores em branco sou qualificados é eu posso substituir por zero eu tenho que eliminar a variável tenho que eliminar o registro é os erros de dados são normalmente eu fiz tipográficos a entrada de dados isso é muito é isso é menos normal muito menos normal hoje em dia o que houve um tempo
Né que todos os dados eram digitados por exemplo você passava com sua compra no caixa do supermercado lá tempos atrás né atendente digitava o código do produto que você tava comprando hoje é um leitor é tudo automático Então esse erro de imputar dados ele é muito menor tá mas a gente tem outros tipos de erro né erro de medição e cuidado você são inseridos corretamente mas base um esquema de medição correto em conces a licitação meta dados Inválidos Então a Gente tem que prestar atenção tem que dar uma olhada tem que entender se o se
os nossos dados têm um bom nível de qualidade ou não para nós fazermos as análises que a gente precisa se esse nível de qualidade não é bom a gente consegue consertar a gente consegue fazer alguma intervenção a gente consegue melhorar a qualidade dos dados que a gente está tratando e aí entramos na fase 3 né tapa três Então a gente tem né esse processo de Preparação dos dados então envolve né algumas atividades mesclar conjuntos ou registro de dados agregar registro derivar novos atributos classificar dados removeram o substituir valores em branco sou nisso na nossa aula
de da semana que vem na segunda-feira nós iremos fazer isso tudo aqui o utilizando o Excel e na quarta-feira ou spss e na outra semana ou Python então isso aqui nós vamos tratar bem né É nós vamos né e a explorar isso mais como que a gente né Da gente vai tem algum tem umas bases dados aqui ele já já tá até disponível no mudo o que eu passei para vocês e como que a gente né Para dar a ideia para vocês de como que a gente faz esse as operações utilizando essas ferramentas aqui que
nós queremos nós Ah tá então a gente vai explorar isso bem na semana que vem e É continuando então né a gente vai entender o seguinte é a gente pode utilizar todos os registros né a gente Pode utilizar todas as linhas da nossa planilha Excel ou a gente precisa de selecionar algumas linhas a gente vai utilizar todas as colunas ou a gente precisa de selecionar algumas determinadas colunas excluir outros né é a gente vai incluir ou excluir algum algum dado né então aí eu vou deixar a coluna ceia para trás porque ela não é o
urso para nós que eu quero fazer a qualidade de um conjunto de dados atributo específico e pede a validade Dos seus resultados Então olha eu preciso é fundamental na minha análise de dados eu ter a variável gênero eu quero informação do gênero do indevido mas eu tenho muitos dados faltantes ou pior de ter dados faltantes eu tenho muita classificação errada então tem pessoas do gênero masculino que estão codificadas como o e vice-versa Então olha a qualidade dos conjuntos de dados né Elas impactam definitivamente na validade dos Resultados que estou obtendo Então essa análise minha não
tem não tem utilidade ela não tem efeito né eu teria então que pensar modificar e fazer alguma coisa tá é nós resolvemos deixar alguma coluna alguma alguma situação para trás é possível a gente recuperar esse depois tá alguma restrição sobre o uso de Campos específicos como né dependendo da análise que a gente tiver fazendo é o cuidado que a gente tem ter principalmente na partir daí do desse Ano né mas principalmente com a lei geral de proteção aos dados né lgpd então a gente tem que tomar um cuidado enorme com os dados que nós temos
com os dados que nós recebemos antes disso a gente já tinha porque tem questões éticas né relacionadas aos dados nós estamos utilizando o zelo cuidado a ter e agora para além da época aqui para mim já era o suficiente mas agora para além da ética a gente tem a lei geral de proteção aos dados então Qualquer desvio qualquer descuido com o uso dos dados né Nós podemos ser penalizados né E tem consequências muito maléficas muito da nossas é do uso que nós fazemos dos dados uma forma geral Então é bom ficar atento com essas situações
também tá então a gente vai tratar limpar os dados né quando a gente tem dados do Nis O que é que nós vamos fazer com esses dados que nós podemos fazer nós podemos excluir a linha ou a variável não é o preencher os espaços em Branco acabei de falar disso né Nós temos erro de dados nós podemos usar alguma lógica para descobrir manualmente os erros e substituir o temos que excluir a variável é tem alguma inconsistência decodificação então Decidir sobre o único esquema né então é a gente pode substituir alguns valores metadados eu vou invadir
o que que são esses metadados né a gente tem aqui a planilha Excel falando isso aqui né a gente trata Isso mais lá em na disciplina inteligência de negócios mas já para você ter para vocês ter uma ideia então eu tenho aqui uma tabela de clientes então na tabela de clientes eu tenho código o nome o CPF a data de nascimento então o que que são os metadados pessoalmente a dados são os dados que descrevem os dados dados o que descrevem o professor Oi é você Vai disponibilizar esse slide sem posso sincronizar Sem Problema ou
é é todos você pode fazer todos toda vez que tiver assim toda aula que tiver você disponibilizar porque isso aí isso vai ajudar muita gente estudar quase cem porcento deles já estão disponíveis entendeu já tá lá esse aqui que eu não tenho certeza se estivesse não tiver eu coloco Sem problema nenhum é aí que colar aqui PDF eu posso disponibilizar em pó inclusive não tem problema nenhum conhecimento e eu dei uma olhada e eu só achei as Coisas em Excel as outras coisas que na verdade o que a gente vai usar ainda tá bloqueado entendeu
conteúdo os conteúdos de por exemplo análise fatorial de clãs ter eles estão bloqueados ainda mas eu é de praxe eu disponibilizar todos os lados tá bom tá bom esse acho que não tem não realmente não tá lá eu vou disponibilizar para vocês certo obrigado imagina então o que que são os meta a meta dados né então são os dados que descrevem os dados então 15 dados Descreveriam isso aqui então não teria né O metadado um dos metadados é o nome da tabela nome da tabela então o nome da tabela é clientes bom então eu teria
aqui colunas dessa tabela então eu teria código do cliente ela é do tipo numérico tamanho 10 posições e contém o código do cliente então meta dado é a descrição dos dados no modelo ideal no modelo Imaginário ideal todos os dados que nós obtivéssemos né É seria fantástico se Tivessem os metadados que nos entenderíamos nenhum de facilmente os dados que nós estamos trabalhando mas raramente os dados que a gente vai trabalhar que a gente recebe tem os metadados raramente os dados públicos aí que nós vamos obter na página do IBGE Normalmente eles têm eles têm um
dicionário de dados O que que significa cada variável qualquer conteúdo que que pode ter nesses dados mas grande parte dos dados que a gente trabalha a gente Precisa de adivinhar e o que que a coluna o que que é o valor da coluna o que que tem inserido naquela coluna tá Às vezes é isso aqui também nós vamos esse limpar dados construir novos dados tá a gente vai integrar também integrar dados eu vou explorar bastante com vocês nas ferramentas aí que a gente vai trabalhar tá aí essas questões são importantes para gente essa tela aqui
é uma tela do spss tá então essas saídas de dados aqui estão no spss Mas é primo em primeiro grau a saída tá cara disso aqui como Excel e também que você era conhecido por vocês mas não a ferramenta que é o de menos O que que a gente quer falar os nossos dados tá sempre nós de agora em diante para sempre na vida de vocês é vocês né estão se transformando em cientistas de dados em análise de dados em gestores de informação então no nosso o insumo é dado e a gente vai usar para
isso várias ferramentas às vezes os nossos O céu aí nós vamos levar isso para o pai então nós vamos trabalhar com spss nós vamos trabalhar com pentao daqui da igreja nós vamos trabalhar com banco de dados então via de regra né os nossos dados estão organizados em linhas e colunas tá então e quando tá lá no Excel principalmente né os nossos dados nós evitamos os cabeçalhos nas primeiras linhas e colunas em branco linhas em branco então porque porque nós agora vamos pensar que nós temos que trabalhar Com essa planilha com essa tabela em diferentes ferramentas
Então os nossos dados lá no Excel vai começar na coluna a linha 1 e outra coisa que eu já antecipo para vocês né e agora e para sempre não é para todo sempre amém é nós que trabalhamos com dados com análise da da bom então nós temos as nossas linhas as linhas da nossa tabela e nós temos as variáveis ou colunas então aqui em cima nós chamamos isso ou de colunas ou de Campos ou de atributos ou de variáveis os outros nomes tá o campo e atributo é uma linguagem muito de banco de dados para
vocês vão lá em sgbd a no sistema de gerenciamento de banco de dados vocês vão ouvir muito falar em Campos e atributos tá Campos da tabela ou atributos no Excel a gente fala muito em colunas né ou variáveis tá então vocês vão em estatística tá o que é mais comum a gente tomar isso né que é de variável E aí vai o alerta agora tá a gente Precisa vai trabalhar com python com r e às vezes com programação às vezes com um punhado de coisas evitem de colocar nomes muito grandes e evitem de colocar caracteres
especiais acentos e cedilha etc etc nome da variável Tente fazer o menor possível sem carácter especial e que tem algum sentido que carrega algum sentido então eu tenho que olha pode código do município nome município população em 2011 Área territorial então o nome os Nomes das variáveis né eles precisam ser simples e intuitivos evitar em caracteres especiais evitarem nomes longos e cês vão entender isso lá na frente porque porque a hora que a gente for começar a programar desenvolver levar isso para as ferramentas tô procurou as ferramentas visualização e que você tiver que escrever o
nome da variável e foram aquele nome cheio de caractere especial de espaço de aí vocês vão entender por que que eu falei hoje Para serem um mais é possível com os nomes das variáveis nas tabelas que vocês tiverem trabalhando tá então normalmente né não necessariamente Mas normalmente tá a nós temos Então as colunas o campo das Tribos ou variáveis na né aqui na vertical e na horizontal Aqui nós temos o que na horizontal nós temos nós chamamos isso ou de linha ou de registro Ou de tuplas ou de observações ou de casos ou unidades de
análise chama Especial atenção para a unidade de análise Alexa a sair Alex e o câmbio está falando do Alexandre Alexandre Alexandre Alexandre ainda eu vou guardando os nomes daqui a pouco tá Eu tinha perguntado dele porque a Larissa que era ele a parceira dele grupo de trabalho esse mês passado né ele tem uma base das muito legal muito bacana que é de clientes que compram produtos de uma indústria de produtos derivados de plástico Sei lá tá e quando A gente está falando de unidade de análise Então ela tinha uma tabela é enorme que ela tinha
todo o item que foi vendido em cada uma das notas fiscais então na Nota Fiscal um tinham três itens na dois tinha quatro itens na cinco tinha 2 e assim sucessivamente até um arquivo dela tinha todos os itens que foram vendidos tá então vocês estão escutando tô escutando agora agora não é porque eu tinha respondido aí E aí eu preciso precisamos contar pode Ter sido faz tecido depois que eu tinha respondido aqui não não você ficou falando Alex Alex você não sabia será eu se não era mas depois responde aí meu amor agora eu te
ouvir antes não tinha de ouvido não para engraçada na bacana eu chamo Microfone Oi todo dia Alexandre apanhar no comentário desse grupo é porque o meu microfone tem um botão de muro também a Isa desmonta aqui na aula mas o fone tá com botão de muda ativado ainda tem dizer esqueça de mandioca Tinha escutado nas bases de dados mas não consegue botar o microfone aí tá difícil Alexandre é bem intensa esse negócio tem um punhado de vez que eu tô aqui nas reuniões a gente tem que tomar um cuidado de mudar para as vezes fica
um som ambiente não é legal mas às vezes a gente começa a disparar na época por exemplo teens quando eu desmonto no TIM o meu fone desmonta também então por exemplo aqui no no Where by quando eles motor quando eu mudei ele aqui o E continua botado esgotado ele na tela tem que ficar duas vezes de mais nada sobre Bosque Mas é porque eu tô usando o seu exemplo da sua base idade entendeu não é agora que tá utilizando a ela não é assim o exemplo seu na verdade eu não estou utilizando não mas o
exemplo é bem legal e não estou utilizando ainda a gente vai utilizar lá que você vai utilizar bem legal é eu quiser utilizar a então quê que é minha unidade de análise olha como que é aquele que a Interpretação tá então a base de dados lá tem todos os itens que foram vendidos em todas as notas fiscais para todos os clientes então eu quero analisar item de venda a minha unidade de análise e tem de venda tá Às vezes eu quero amenizar isso às vezes não e aí eu posso começar a fazer agregação não eu
não quero Cada Um item de cada nota fiscal a minha unidade de análise vai ser produto Então se é produto eu vou ter que pegar Olha foi vendido garrafa pet E não nessa nota nessa outra nessa outra então eu vou ter que agregar um produto porque a minha unidade de análise é produto não eu não quero analisar produto a minha unidade de análise é cliente então eu vou ter que agrupar as notas fiscais por cliente então é fundamental a gente entender qual que é essa nossa unidade de análise Porque dependendo de como que os meus
dados estiverem e o que eu quiser fazer a gente vai ter que fazer alguma Transformação para colocar os dados não idade de análise que nós queremos analisar tá então é super interessante a gente obter os dados da forma mais atômica possível por isso a base do Alexandre é muito legal porque é eu cliente fui comprei três itens então tem lá três linhas na Nota Fiscal dos itens que eu comprei mas eu comprei na semana que vem né na próxima semana os mesmos três itens eles aparecem lá e na outra nota fiscal então a gente Precisa
entender Qual que é a nossa unidade de análise para gente colocar o nosso arquivo a nossa base né nessa unidade de análise que a gente vai trabalhar e aí para gente né fazer isso a gente tem que pensar eu quero o quê né Se for por cliente eu quero contar quantas compras ele fez qual que foi o valor médio das compras quantos itens ele comprou Quantas toneladas ele comprou então a gente precisa entender isso tratar disso a gente transformar os Dados da forma como a gente precisar Tá sim te perguntar essa unidade de análise a
mesma coisa de granularidade basicamente assim é dependendo né da do que for a minha unidade de análise eu tenho que diminuir ou aumentar a granularidade então tem relação tem relação da granularidade comunidade de análise entendeu é que a unidade de análise é uma decisão sua e você vai analisar eu quero analisar é comportamento dos clientes a isso seus Dados estão mais granulares do que o por cliente você agrupa eles por cliente entendeu Você diminui a granularidade de seus dados nesse caso tá beleza então o que que nós temos da então para vários vocês Novidades nenhuma
né Mas as nossas tabelas né normalmente Elas têm as chaves tá então eu tô falando aqui por exemplo eu tenho uma tabela aqui é uma tabela de municípios né então eu tenho o código do município eu tenho uma Unidade da Federação o nome do município a População Então observa em que eu tenho cada linha dessa minha tabela é um município então a minha unidade de análises aqui é o município cada linha é o município mas eu tenho aqui embaixo Olha só uma tabela de escolas então cá a linha da minha base é uma escola se
eu se a minha unidade de análise é município e eu quero levar escola para dentro do município eu não vou trazer cada uma das e Zeca cada uma das escolas né eu vou ter que pegar por exemplo é Bem alta floresta tem uma duas três quatro cinco seis escolas então poderia levar isso eu poderia fazer até diferente olha só eu vou colocar a quantidade de escolas estaduais a quantidade de escolas municipais aprovação média das escolas estaduais aprovação média das escolas municipais então eu teria lá no próprio município de Alta Floresta por exemplo Quantas escolas da
loteria aqui uma coluna né qtd As escolas municipais que te de escolas estaduais a nota aprovação aprovação é média escolas municipais então eu teria isso aqui e eu teria que transformar essa escola aqui para levar aquilo para que ele nivela que eu quero nós mais eu preciso de ter o que eu preciso de ter essa coisa que a gente chama daí chave que é esse elemento comum entre as tabelas para que nós possamos cruzar os lados para que nós possamos juntar informações de locais diferentes lugares Diferentes tá aí nós falamos dos tipos de dados basicamente
tá a gente tem o tipo numérico e texto já falei para vocês que data é um tipo especial aqui né Ela é armazenada como o número mas ela tem né uma série de formatos a gente precisa tomar muito cuidado com isso quando os dados são numéricos é em termos de estatística O que é a forma mais rica que a gente tem para tratar para explorar estatisticamente tá e com de texto né as Possibilidades diminuem substancialmente outro detalhe é que às vezes eu tenho uma variável armazenada como o número mas ela não tem propriedades médias propriedades
numéricas como assim né eu posso ter uma variável gênero que está armazenado em 0 e 1 então está armazenado como o número só que esse 0110 feminino um masculino está armazenado como 0 e 1 como o número mas não tem propriedades métricas numéricas como assim né eu não posso por exemplo Fazer a média disso né é embora sejam números né que eu poderia a 0 e não posso fazer a média mas não faz sentido fazer a média disso peça avariada ela não tem propriedades métricas ela não tem propriedades numéricas apesar de estar mais e nada
com o número tá e aqui a gente falou então de agregação de do atômico para o agregado né então aí os diferentes níveis de unidade de análise tem que tinha perguntado é Mariana Mariana Mariana E para quem passar a a Sara Obrigado Sara então aqui Sarah tenha relação com atomicidade que você tava falando que você tinha comentado tá vendo Então são os diferentes níveis de análise que eu tenho né o nível mais granular mais átomo possível eu posso analisar a cor alunos eu agrupar aluno eu análise por turma seu agrupar turma em análise por escola
seu agrupar escola por município e município por Unidade da Federação Então tá vendo agora o que que é legal Quando a gente está buscando os dados né O legal quando eu estou buscando os dados para trabalhar é que eu tenho eles na forma mais atômica possível porque se eu já tenho eles por Unidade da Federação agrupado eu não consigo abrir né eu não consigo abrir pelas unidades de análise inferiores mas se eu tenho na menor unidade de análise eu consigo ir agrupando para as unidades de análise superiores Então sempre que possível para nós Os exames
dados que vivemos de análise de dados é interessante a gente pensar nesse nível de granularidade tá aí acho que era essa ideia né E a gente vai era isso um pouquinho que eu queria dividir com vocês parar aqui compartilhamento Oi e aí aberto para perguntas para comentários era essa Primeira ideia de uma visão geral dos dados de análise de dados o processo de uso de dados para suportar o processo de tomada de decisão a gente precisava de bater esse papo Isso é novidade para alguém já sabiam disso trouxe elementos novos tem dúvidas tem perguntas Quais
qual a percepção de vocês o que vocês me dizem o senhor irmã dúvida com relação a essas etapas é a gente tem profissão de engenheiro de dados cientista na lista de dados cada uma delas vai ficar responsável por uma parte dessa seis etapas Boa pergunta o Otávio né Otávio na verdade Otávio essas seis etapas aí vídeo isso até compartilhar de novo que A gente volta lá tá só para ti E aí uma das várias das várias profissões sabe é o que que acontece a a parte de cientistas de dados ou cientista de dados basicamente tem
que fazer isso aí tudo entendeu então às vezes às vezes é ele terá alguém que vai fazer a extração de dados para ele esta parte aqui do cientista de dados às vezes ele terá alguém que fará isso por ele tá mas é nós que vamos trabalhar como cientista De dados né o cientista de dados em fazer isso tudo aí ó o certo é sobre o engenheiro de dados arquiteto de dados a gente vai ver bem a isso lá em na disciplina inteligência de negócios porque aí a vamos modelar um leitor House Então tem que fazer
isso vai fazer sem dinheiro de dados se pensa nisso então na outra parte lá que a gente tava lá na outra disciplina a gente vai cobrir bem as outras possibilidades de funções ou de Atividades que podem ser desenvolvidas Mas ou cientista de dados é ele navega por tudo isso aí entendeu certinho fez mais sentido para você pode sim Oi e o analista de dados aí Liliane Na verdade o que que acontece é muito Depende de nomenclatura porque depende do nível vai assim o analista de dados é a o cientista de dados por natureza ele é
um analista de dados né o analista de dados às vezes ele fica com atividades mas digamos assim mas usa-se menos a Estatística usa-se menos essa parte de do uso da desses dos conceitos de hoje de mais um cientista de dados ele por natureza ele é o analista de dados é que o assim nas diversos cargos e que nas profissões que estão por aí às vezes analista de dados ele usa por exemplo Excel Ele trabalha com Excel para produzir os relatórios análises eles o princípio é mais ou menos o mesmo é usar dados é né para
produzir alguma coisa para Suportar o processo de tomada de decisão é que o analista de dados às vezes não é o meio dele de trabalho as ferramentas pode ser o próprio Excel e o cientista de dados pressupõe muito usar de ferramentas e tecnologias de grandes bases de dados eu fui Claro a vendinha aí ele vai fazer todo o a extração também de dados toda a extração normalmente não sei se vocês já tiveram curiosidade de ver uma vaga de emprego Para cientista de dados normalmente pede-se né cientista de dados na Tem muita gente falando que é
cientista de dados né mas desenvolve parte das atividades o cientista de dados na sua Plenitude ele precisa de saber banco de dados Ele precisa saber linguagem programação Ele precisa saber estatística Ele precisa saber negócio então é famosinho sair como é que é mosquinha Branca né então a formação é muito por isso que paga bem né Zé por Isso que paga bem paga bem passeando quando é apaga tudo apaga apaga assim parece muito bem tá é o que eu tava pensando né conversar com o analista que é uma das áreas que eu mais gosto é essa
dia de quatro e que eu pretendo Seguir Seguir né futuramente é o analista a mente com maior capacidade os cientistas de dados Liliane depende muito de onde você vai por exemplo Ah eu acho que azul azul por exemplo Azul tem uma fábula tá que vocês tiverem porque Tem vários anúncios gestão da informação mais alunos então a Zupi É ela tem algumas vagas lá que ela já te e tem alguns alunos da já inclusive pois quando o projeto agora Super Interessante que eles já contrataram como cientistas de dados treining aí o que que eles contrataram como
cientistas de dados trem aí eles já vão dar uma carga de treinamento de capacitação de custo de desenvolvimento em todos esses aspectos entendeu então você não precisa Não precisa necessariamente passar pelo cargo de analista de dados mas se você tiver no meio já na lista de dados é um bom já é um bom começo entendeu Mas dependendo da empresa que você for você já pode entrar você vai entrar na na base da pirâmide obviamente né Mas você já entraria nesse o cientista de dados entendeu seu Zé me permitiu complementar por favor tem a técnicas que
vai servir porque esquisito Eliane tá perguntando aí de coisa Profissional todo tem uma uma amiga que fez acabou o estágio agora na Bayer de cientista de dados é cê pode Liliane só é igual igual semelhante área de desenvolvimento não é necessário que você é apresente um diploma para entrar no cargo específico que não seja também estágio trainee e vai do seu nível de conhecimento você pode estudar sozinha aí desenvolveu uma uma uma grade de estudo e que você pode montar paralela faculdade e entrar já não cargo razoável Para que ainda na base da pirâmide igual
você falou você não vai escapar muito disso mas se você vai ser remunerada bem melhor do que o estágio por exemplo verdade que o estágio dela na bar já era antes que me essenciais né tal entendeu um salário muito bom boa noite é de auto de auto formação de altas e movimentos tá em uma pessoa ele serve um propriedade o que que ele tá falando é isso aí é uma sugestão porque você pode complementar muito aí casa com a matéria Do Zé aí vai ficar eu reparei com É só perguntar assim inúmeras Lilian é o
que que acontece a gente comenta um pouquinho na segunda-feira tá é a gente procura trazer uma série de experiências já que a gente viveu de algumas coisas que a gente já Experience ou que pode ajudá-los encurtar caminho mas acho que é principal delas é esse que tu está falando aí hoje né a gente tem acesso a tanta capacitação até um desenvolvimento tanto treinamento então é legal vocês Ficarem de olho quando né nas vagas que são acertadas e pela internet brincar disso entendeu a tem uma vaga para trainee em ciência de dados cientistas de dados né
O que que essa vaga tá pedindo que tipo de a gente discutiu de informação de conhecimento e as coisas que fosse for vendo é de você e correndo atrás eu tive a grata e feliz para caramba com isso porque dois alunos da engenharia mecatrônica me procuraram os 15 dias Atrás né querendo fazer TCC comigo lá no curso de engenharia mecatrônica e querendo fazer TCC na área de dados de né E são dois meninos pelo que eu conheci pelo que eu vi pelo que eu tenho esse duas semanas conversando com eles é de extremamente interessados e
enfim e os dois Já consegui já estão com os estágios certos um na Siemens outro na Cargill Eu acho E aí os estágios deles vão ser na na área deles de engenharia mecatrônica mais UTC eles estão Aproveitando o estágio para fazer além do estágio para fazer o TCC e o a tradicional e nas empresas que estão trabalhando mas na área de dados então eles vão fazer o estágio na área deles mecatrônica e o TCC na área de dados E aí tem uma das meninas tá a Talita que ela tá ela meteu a cara então a
gente conversou alguns dias eu mais ou menos fala aí essa história um pouquinho para ela e ela já tá aí fazendo o curso já tá correndo atrás ó tá vendo e ela tá Fazendo um processo do Carrefour que aí nós está super legal completamente alinhado com esse gente tá falando então a sua possibilidade de auto-desenvolvimento é gigante é enorme e né E que o Luiz falou e eu estou completamente à disposição porque o nosso semestre acaba sendo um curto com níveis de conhecimento às vezes diferentes níveis de interesses diferentes mas se você quiser me explorar
no semestre para ir perguntando Coisas adicionais né então você pode estar à frente pode correr atrás pode ir à frente pode fazer além e a gente trocando idéias aqui durante a disciplina também entendeu E o mercado com é muito mais é assim tudo que a gente tem o mercado absorve Túlio eu queria fazer é tipo assim como eu tô no meio né bem no meio ainda tô decidindo ainda se eu pego mais para o lado da administração Marte essas coisas cálculo Programação ou questão de estatística que a nossa parte adequado na e vai até viagens
mágoa E aí essa parte sempre Me interessou muito muito mesmo então assim eu fico meio assim tipo ah eu gosto da matéria mas como é que será a profissão ator que bater o martelo aí Liliane atuando na área pelo menos como estágio igual vai ficar mente né essa amiga minha vagou vai lhe ajudar a bater esse martelo aí que aí você vai ter noção prática é o que eu quero é fazer isso Mesmo peguei para mim eu acho que para mim eu sempre pensava assim não será que tem mesmo estágio para sentir-se né que você
acha assim nossa a gente só quando você tem um monte de coisa mas eu vou tentar assim estágio para sentir bom né Isso se quiser depois me manda seu WhatsApp que às vezes ela até Te indica lá você vê com ela o que que precisa de conhecimento né e manda me lembra aí que eu te passo o contato dela é um problema é que a gente atualmente Eu só tô no conhecimento do do curso mesmo nosso curso mas aí a partir do momento que eu ver que aí começa daí né a gente tem que começar
a buscar e correndo atrás muito legal eu assim né A partir de agora que vocês que a gente tem um grupo no WhatsApp pessoal que tem que sair fica à vontade