[Música] [Música] Oi gente tudo bem sejam bem-vindos à semana da estatística aplicada se você tá chegando aqui agora eu sou a professora fernana Marciel Sou professora de Business Analytics aqui na Universidade Estadual da Califórnia e nessa semana de aulas eu tô te mostrando Quais são os conceitos que você precisa saber para finalmente entender estatística seja a sua necessidade no âmbito Profissional ou no meio acadêmico Afinal a gente precisa ter autonomia para trabalhar com dados e assim a gente se torna um profissional mais qualificado e desejado seja em qualquer área da nossa aplicação e na aula
de hoje eu vou te falar quais são os conceitos essenciais de estatística que você precisa saber para trabalhar com dados em qualquer área nessa aula eu vou falar os tópicos que formam a base do conhecimento de estatística essa aula é muito importante por já sabemos que entender de estatística para analisar dados é essencial mas como a estatística não é muito falada e até as pessoas têm dificuldade as pessoas não sabem por onde começar ah onde que eu assisto que livro que eu pego então nessa aula eu organizei Quais são os tópicos seguindo na ordem Ó
você vai começar estudando por esse depois por esse depois por esse Então essa é uma aula para você pegar papel e caneta dá o dedo no print para você realmente anotar você que quer estudar estatística e se aprofundar saber por onde começar e depois o que fazer né como prosseguir e mas eu quero perguntar antes disso se você assistiu a primeira aula essa aqui é a segunda aula da semana da estatística aplicada e uma coisa que é essencial no meu método de ensino é que você comece pela base e você não pule etapas então se
você ainda não assistiu eu peço para que você pause esse vídeo assista a primeira aula depois você volta aqui para dar continuidade nos seus estudos tá porque é aquilo você quer montar a base você não quer começar no tópico sei lá D sem ter começado pelo A então você volta lá depois você vai lá depois você volta aqui na primeira aula eu falei sobre as oportunidades de carreira os ótimos salários que temos no mundo dos dados ou até você como uma pessoa de dados numa área que ninguém mais sabe né a oportunidade que você tem
e também sobre o déficit de profissionais qualificados eu falei por disso né Por que que a gente não tem pessoas qualificadas a importância de se ter autonomia ao aplicar estatística quando você tá analisando dados e também que a analise de dados é uma oportunidade de crescer profissionalmente nem que você seja a pessoa que Analisa dados ali na sua área que não é de dados necessariamente e eu quero agradecer também aos comentários deixados na primeira aula e eu fico muito feliz em saber né como professora o quanto que vocês estão dedicados e gostando começando ali do
começo e eh realmente seguindo esse processo né aqui interessados Isso realmente me satisfaz ver o quanto as pessoas estão engajadas você que me mandou um comentário você que me mandou uma mensagem na rede social eh É isso aí gente é isso aí siga firme e aqui a gente vai dar continuidade nas aulas da semana e aí falando sobre base falando sobre ter conhecimento eu quero também falar uma coisa que é muito importante algum os alunos já me relataram terem um certo receio de seguir esse Meu método porque eles já tinham uma base em estatística então
assim ah eu tem que realmente começar do começo mas isso eu já sei mas apesar do meu curso ser sim para quem tá começando do zero né Afinal eu começo da base essa esse entendimento da base vai agregar muito mesmo aquelas pessoas que já viram esse material ou que já trabalham na área Veja por exemplo o que o Eduardo falou sou formado em matemática sou Bacharel Apesar de eu ter a formação toda voltada em exatas e já com com bons conceitos de estatística adquiridos durante esse tempo eu o curso da professora Fernanda agregou intensamente aos
meus conhecimentos e vários conceitos ainda que eu tinha algumas dúvidas né algumas alguns questionamentos foram esclarecidos com as explicações da professora Fernanda Que por sinal são ótimas são esclarecedoras para o o meu trabalho profissional melhoraram minhas análises eh Ainda mais eu tive mais base para fazer análises estatísticas específicas quando necessário então eu recomendo eh fortemente que façam o curso dela quem ainda estiver com dúvidas e agora eu também queria aproveitar e comentar sobre algumas perguntas para frequentes que eu recebo nas redes sociais duas delas são uma Ah eu já passei dos 30 não é tarde
para trocar diária e esses 30 troque para qualquer número eu já recebi Ah mas eu já tenho 42 anos mas eu já tenho 35 anos Ah mas eu já tenho uma formação nessa área que tem a ver com a segunda pergunta né Eu tenho um doutorado nessa área X vale a pena fazer uma transição de carreira eu já tenho 6 anos de experiência nessa área mas eu tô interessada em análise de dados será será que vale a pena e a minha resposta geralmente é mas gente você que tem essa idade você que completou um doutorado
com quantos anos vocês pretendem se aposentar é assim ah eu vou trocar de carreira mas eu já vou me aposentar daqui a um ano nesse caso né talvez não vha a pena mas saiba que a idade para aposentadoria no geral no Brasil é de 65 anos se você tem por exemplo 35 anos você tem mais 30 só de trabalho pela frente você tem mais tempo de trabalho pela frente do que anos que você já trabalhou independente da da sua idade também ou da da carreira que você fez pense Só se você quer fazer essa transição
se você tem interesse nessa área é uma coisa que você tem prazer uma coisa que você gosta traz uma satisfação pessoal por que não fazer essa carreira né eu mesmo e eu penso que se tem uma coisa que eu gosto que vai me dar uma certa autorrealização eu vou querer estudar aquilo eu vou querer lutar por aquilo principalmente se você for pensar em relação à aposentadoria né porque Eu mencionei aqui 65 anos mas tem muita gente que trabalha depois disso principalmente Professor você provavelmente conhece um professor bem velhinho que já deveria ter se aposentado há
muito tempo mas tá lá caindo os pedaços indo dar sua aulinha porque eu quero ser essa professora eu quero estar com 90 anos velhinha caa os pedaços de de bengalinha indo dar aula pros meus alunos porque realmente é uma coisa que me satisfaz então né imagina daqu até o 90 anos gente é muito tempo de trabalho então Pense nisso quando você pensa né de uma transição um estudo Extra ah vale a pena e e em qualquer coisa né ah vale a pena estudar inglês sempre vale gente estudo é aquilo né não tiram de você é
sempre um conhecimento muito válido Então tenha isso em mente enquanto você quiser aprender qualquer coisa outra pergunta frequente que eu recebo é algo no tipo ah mas eu não preciso saber estatística porque eu posso contratar alguém para me ajudar eu posso contratar alguém para minha empresa algumas pessoas falam isso em relação a trabalhos acadêmicos né a TCC por exemplo E a minha resposta é mas como é como você vai saber se o profissional é um bom profissional se você não tem a menor noção do assunto e isso vale muito para trabalho acadêmico as pessoas falam
assim ah não eu tenho que fazer aqui né defender Minha tese e tal e eu vou contratar alguém para fazer aqui a parte da estatística que eu não sei tá mas você vai terminar esse seu trabalho acadêmico E aí você nunca mais vai ver dados pela frente você vai passar o resto da vida até sua aposentadoria tendo que contratar alguém para fazer as análises estatísticas Porque você não sabe fazer porque não ter esse conhecimento né tenha essa esse conhecimento aplique para si Faça no seu trabalho tem autonomia a gente tem autonomia com o seu trabalho
não fica atendendo de outras pessoas é claro às vezes delegar né ter um uma uma ajuda uma parceria é ótimo mas principalmente análise de dados né a gente viu na aula um o quanto que é uma habilidade essencial que a gente realmente precisa saber Além disso ter esse conhecimento base você sabe se os dados são analisados corretamente mesmo que você ainda não saiba tudo você já tem uma noção né seja para o para a área acadêmica como eu tô citando aqui ou para a sua empresa você vai contratar alguém para analisar os dados da na
sua empresa mas você tem uma noção se esse é uma profissional se ele tá fazendo análise correta porque o que tem muito por aí são pessoas que não realmente não estudaram né eles têm um conhecimento mais superficial conseguem um trabalho são bons bons vendedores talvez bons de lábia mas não tem aquele conteúdo e aí você meio que contrata no escuro porque você não sabe você é interessante você pelo menos ter essa base para verificar o trabalho da pessoa e agora Sem Mais delongas vamos falar quais são os tópicos essenciais de estatística agora é a hora
de pegar o papel e a caneta e botar o dedo no print o primeiro tópico que você vai estudar é a estatística descritiva Ah mas eu já sei gente não volta lá vamos voltar a fita quem é quem é uma senhora de idade como eu que tem que rebobinar a fita vocês conam essa palavra rebobinar quem aí é da nova geração que nunca ou viu falar essa palavra vamos voltar à fita dar um passo para trás e vamos pegar o material de estatística descritiva Por que que a estatística descritiva é tão importante porque ela é
a base de qualquer análise você precisa fazer um teste de hipóteses você precisa começar da estatística descritiva você não vai pegar os seus dados e fazer o teste de hipótese você vai fazer estatística descritiva e aí o teste de hipótese ah não mas o que eu tenho que fazer é uma regressão você vai fazer uma estatística descritiva e aí você vai fazer uma regressão é a qualquer você pegou os dados é primeiro passo então é muito importante porque em qualquer área que você trabalha em qualquer qualquer que seja os dados que você pegue você vai
começar por isso mesmo que você faça outras análises depois também a estatística descritiva é a parte do entendimento dos dados né Por que que a gente faz primeiro porque o entendimento e também a parte de visualização Tem muita gente que trabalha com os dados focando nessa parte de visualização que é o quê estatística descritiva por exemplo os analistas de dados né você que trabalha com bi você que trabalha com dashboard eu peguei aqui um exemplo esse dashboard foi um uma imagem que eu peguei na internet todas essas imagens aqui elas são uma análise análises estatísticas
né eu tô falando sobre isso porque uma pergunta frequente eu esqueci de botar na parte do fac Mas uma pergunta frequente é assim mas eu preciso saber estatística para analisar dados gente mas análise de dados é uma estatística o que que é análise de dados fazer um gráfico tirar uma média tirar uma proporção tudo isso são tópicos já fez ah tirei uma média Você já fez fez uma estatística querendo ou não você já fez Fiz um gráfico o gráfico ele é uma representação gráfica de uma dos seus dados né uma forma de você descrever os
seus dados é não só uma estatística como é uma estatística descritiva Então aqui tem um gráfico de barras aqui tem esse gráfico também que é uma proporção né aqui também você tem uma proporção de eh masculino feminino tem eh essa várias análises essa aqui é uma análise ó se se dias esse aqui é uma média foi tirada uma média né e taxas de promoção por exemplo cada cada pedacinho desse foi uma análise estatística foi feito mesmo que você nem saiba o que está fazendo você está fazendo então se você tá fazendo sem nem saber que
tá fazendo não é importante você voltar e ter aquela base Então pense nisso em quando você tiver dados você começa nisso tendo essa esse entendimento tendo essa ideia que você realmente sai o que tá fazendo e fazer bem feito né Bem e o que da estatística descritiva você tem que saber se você já me acompanha já viu eu falando nas redes sociais eu sempre falo sobre namorar os dados O que é namorar os dados olhe para os dados Como rapaz olha para essa moça né então faça mais ou menos isso O que é namorar os
dados é você realmente ter um entendimento do que você tem ali nos seus dados antes de você começar uma análise Às vezes a estatística descritiva é tudo que você precisa Não eu só preciso de escrever meus dados ótimo excelente se você fizer bem feito excelente agora tem gente que fala assim não eu quero eu o meu objetivo tenho que fazer uma análise de regressão a pessoa pula essa estatística descritiva e não namora os dados E aí quando ela vai fazer análise tem alguns dados com informações erradas de repente uma variável que precisava ser analisada ser
transformada ser consertada E é isso que a gente faz a gente tem o entendimento a gente tem dados faltantes a gente tem dados extremos tem dados que de repente não fazem Muito sentido por exemplo você tira uma média e da idade você tem l a idade dos seus clientes aí você tirou uma média deu 150 ô 150 anos não é uma média razoável Concorda porque esse passo foi pulado de repente a variável ela não tava na métrica correta ou ela tava com valores e errados ou ela tava com valores extremos coisas que a gente tem
que analisar antes de realmente a gente tem que verificar antes de fazer as análises tá quais são essas análises você tem que entender o que são variáveis quantitativas qualitativas porque algumas análises você só pode fazer se as suas variáveis forem quantitativas algumas se forem qualitativas Então você tem que saber o que que é o quê as escalas de medidas as suas variáveis são eh discretas contínuas São ordinais elas são de razão elas são nominais Justamente por isso porque tem uma uma certa análise que você pode fazer eh uma uma um certo cálculo tirar uma média
né o mais simples tirar uma média tem uma outra certa análise que você não pode tirar uma média mas você não sabe que você não pode então você tem que entender o tipo da variável entender a distribuição de frequências O que que significa né Isso é essencial para gráfico se você faz um gráfico de barras Você já está fazendo uma distribuição de frequências então entenda direitinho dá um passo para trás para entender o que que isso faz representações gráficas né acabei de falar né você que faz gráficos você fazer o gráfico correto corretamente e utilizar
o método visual correto também falando em representações gráficas temos aí o histograma temos o boxplot que são formas de visualização para variáveis contínuas que você vai saber quando você entende o que são variáveis que representam né representam os seus dados e nessa analisar histograma boxplot aí tem também como a gente encontra o outliers os outliers são os dados extremos né que eu comentei se você achar uma média de 150 anos certamente você tem alguns dados extremos aí nos seus dados que foram errôneos Afinal 150 anos não é uma idade correta falando em e representação gráfica
se você faz um gráfico tipo esse e acha que tá tudo bem Já pare agora e não faça mais esse gráfico não tá tudo bem esse aqui é um gráfico com categorias tem muitas categorias tá muito Colorido você não entende direito o que que é o que é claro né Isso aqui é só um exemplo p pontual eu não tenho nenhum título sobre o que que se trata mas aqui são eh estados eh cidades na verdade do dos Estados Unidos e você não sabe nem por onde ler por onde começar Então esse é um exemplo
de gráfico que a gente não faz então eh tem você tem que realmente entender Qual é o tipo de gráfico ideal para o seu tipo de dados dependendo do tipo de variáveis que você tem aí volta no tópico um as variáveis Além disso dentro da estatística descritiva né você entendeu eh sabe fazer um gráfico entende a distribuição dos dados a sua frequência o tipo de variáveis e aí que vem a parte dos cálculos né você entender Qual é a tendência Central ali de cada variável sua né média mediana moda são as formas de medir a
tendência central a dispersão dos dados entender Por que você precisa saber a dispersão dos dados amplitude variância desvio padrão são alguns deles e também eh entender a covariancia principalmente a correlação é muito interessante você saber se as duas se duas vari estão correlacionadas com as outras elas caminham juntas então é um tópico que você precisa saber aí dentro da estatística descritiva agora vamos passar para probabilidade Por que que a gente tem que estudar probabilidade se você trabalha com ciências de dados Esse é a base dos modelos de classificação Então você Qualquer que seja o modelo
de classificação ele já calcula uma probabilidade se você trabalha com economia e trabalha com Finanças é muito usada né a probabilidade para estimativ você que trabalha com Sports Analytics ten os alunos que trabalham que gostam dessa área né de analisar dados dos esportes Então você quer fazer uma estimativa dos jogadores por exemplo qual é a probabilidade daquele jogador ter uma boa performance dada essas informações dele né ele tem essa altura esse peso ele corre essa distância ele faz esse número de gols então dado tudo isso você quer estimar uma probabilidade Então precisamos e saber você
que trabalha com seguro né seguro de vida seguro saúde plano de saúde ciências atuariais a gente quer estimar a probabilidade da pessoa precisar realmente de um seguro de vida né um plano de saúde o plano de saúde ele vai estimar ali para fazer o cálculo do plano de saúde e a pessoas das áreas da Saúde também né várias áreas da Saúde passamos recentemente aí pela pela fase da do do covid das máscaras e todas essas probabilidades que a gente via na nas né nas notícias elas não são inventadas não é assim Ah então probabilidade de
de contágio é de 70% porque 70% não isso tudo são foram cálculos feitos né análises realizadas para você conseguir realmente estimar essas probabilidades e para falar da importância da probabilidade eu quero trazer o caso linda quem é linda linda tem 31 anos solteira sincera muito esperta se formou em filosofia enquanto estudante se preocupava com discriminação e justiça social e Agora eu te pergunto o que que é mais provável número um a linda trabalha em um banco ou número dois linda trabalha em um banco e participa do movimento feminista E aí o que que você acha
Qual que é o mais provável Provavelmente você respondeu que a Linda trabalha no banco e participa do movimento feminista por causa dessa descrição aqui que eu dei e isso é o que a maioria das pessoas eh escolhem a verdade é que o que é mais provável estatisticamente falando é que ela trabalhe num banco afinal se a gente for pensar em eventos a gente trabalhar num banco tem que ser maior do que trabalhar num banco e participar do movimento feminista trouxe uma imagem aqui para eh deixar a visualização mais fácil é como se fosse trabalhar num
banco ser a e ser parte do movimento feminista ser b e de repente ela pode ser parte do movimento feminista né faz mais sentido dado a descrição dela mas é porque aqui a gente tem dois eventos juntos esses dois eventos juntos são a interseção então enquanto a seria o número um o dois seria essa interseção zinha aqui essa área rasurada e essa área rachada ela nunca pode ser do que maior do que um desses eventos eu tô te mostrando esse exemplo primeiro para mostrar como a probabilidade ela não é assim indutiva né as pessoas acham
que conseguem eh ah tá é probabilidade é isso isso isso faz sentido a probabilidade ela não faz muito sentido não gente a gente tem que realmente pensar pensar em fórmula e um outro motivo que eu trouxe esse caso é que ele não foi inventado aqui por mim ele foi proposto por esse rapaz que é o Daniel ceman ganhador do prêmio Nobel e ele fez vários casos tipo esse para passar para os seus próprios alunos ele era professor em Stanford que é uma universidade muito muito boa nos Estados Unidos e ele começou a perceber que as
pessoas acham que conseguem estimar probabilidade mais do que realmente elas conseguem né Elas têm esse viés então Ele preparou vários casos deu para os seus alunos viu que a maioria dos alunos marcavam a opção que não é certa como aqui no caso a maioria dos seus alunos marcaram a opção dois e aí ele escreveu artigos sobre isso e também baseado nos artigos escrever um livro que eu sempre recomendo que é o rápido e devagar se você tiver interesse nesse tipo de assunto fica a recomendação ou seja o ganhador do prêmio Nobel Ele propôs séries uma
bateria de exemplos onde a gente consegue perceber que a probabilidade as pessoas não conseguem estimar assim de cabeça a gente tem que realmente calcular né então eu estou aqui somente reforçando essa ideia e o que estudar de probabilidade Então você precisa saber a diferença entre uma probabilidade uma estatística entender o que é um espaço amostral a que eu falei né Você tem uma um evento Então entender isso eh sobre a união a intercessão a a intercessão é o caso linda né aquele trabalha no banco e movimento feminista são duas coisas é a interceção entender as
propriedades da probabilidade as regras da probabilidade probabilidade probabilidade condicional é muito importante e o teorema de beas e aqui eu trouxe essa imagem que é uma digamos uma colinha né de todas as fórmulas e quando eu ensino probabilidade gente eu não jogo Fórmula assim ah gente é isso aí eu realmente ensino cada conceito e explico né Por que essa fórmula da onde que veio para você ter aquele racional e não é só decorar fórmula Então já fica aí já tirou prente e agora vamos falar das distribuições por que é importante saber sobre distribuições a distribuição
dos seus dados né Você pode criar modelos que representam com precisão os seus dados e assim você consegue eh prever comportamentos futuros você pode otimizar os processos e melhorar a eficiência da sua empresa por exemplo você entender a distribuição dos tempos de espera você pode eh em um serviço ao cliente você pode otimizar isso né fazer com que o cliente não fique esperando muito você pensando numa fila por exemplo uma outra aplicação análise de riscos você entender sobre os retornos de investimentos e avaliação de risco de crédito você colocando isso num modelo numa distribuição você
consegue fazer uma estimativa né calcular a probabilidade porque dentro da distribuição a gente também calcula probabilidades de uma forma mais eficiente do que usar de repente uma distribuição que não condiz com os dados que você tem e os tipos de distribuições temos as distribuições discretas e contínuas e nessa imagem aqui são várias das distribuições que existem eu acho eu eu acredito que a parabase da estatística você não precisa estudar todas as probabilidades do mundo do universo porque às vezes tem uma que não tem nada a ver com a sua área ou com a aplicação que
você faça dos dados mas tem algumas que são aquelas realmente base que você precisa saber são elas entre as discretas uniforme bernu binomial e po ação Essas são as mais comuns e entre as contínuas temos a exponencial que é bem usada e principalmente a normal se eu fosse escolher uma só Seria normal mas a gente não vai escolher uma só não eu tô dando aqui o que que você tem que saber mas a normal ela é essencial na estatística você talvez já tenha estudado distribuição normal distribuição galciana principalmente indo adiante é agora que você estuda
porque quando você chegar na próxima matéria de estatística Você já tem o entendimento da normal distribui Essa é a distribuição essencial na estatística e agora vamos falar sobre a infer inferência estatística a inferência estatística é um tópico muito muito importante muito muito usado para por quê Porque você vai usar inferência se você utiliza amostras Ah eu coletei uma amostra eu perguntei uns pacientes eu fiz uma pesquisa na rua Ah não eu fiz uma pesquisa online fiz um questionário e mandei para umas pessoas coletei aqui uma amostra das bactérias coletei uma amostra de águas gente coletou
uma amostra coletou uma parte de tudo que você deveria eh o seu interesse de estudar Você já vai precisar usar uma técnica de inferência Afinal na inferência a gente usa a amostra para estimar aquele todo que você não tem acesso então você que trabalha com pesquisas né como eu falei estudos acadêmicos principalmente você que é das áreas de saúde farmácia Medicina né você não vai testar um remédio em todos os pacientes do mundo você pega uma amostra ali para testar o remédio Então você precisa de uma infer para né estimar O que seria do do
povo todo que você não coletou você só coletou uma amostra também temos nas áreas do mercado né pessoal aí do marketing Teste abão estamos falando muito sobre teste AB agora e se você nunca ouviu falar ou até já ouvi falar mas não tem muita certeza e o teste AB sempre existiu na verdade mas principalmente no online tudo é testado as empresas elas querem ver se alguma ação de marketing funciona o exemplo que eu trouxe como vocês podem ver nessa imagem é a loj dojo.com e ele tá fazendo uma promoção e ele quer ver qual das
versões da página dele vai receber mais cliques então ele faz uma página colocando uma blusa rosa na frente e aí ele faz uma outra versão colocando uma blusa verde e aí cada vez que uma pessoa entra no site ela vê uma versão diferente e ele quer ver qual que recebe mais cliques isso é feito gente com um e-mail que você recebe e eles querem ver se você clica ou não aquele título ali foi mudado o o assunto né o assunto do e-mail uma pessoa recebeu um outra pessoa recebe o outro Eles querem ver Quais que
tem mais cliques assim eles vão usar aquele E isso não é feito somente com páginas ou e-mails mas até para testar as cores o Google por exemplo para ele chegar nas cores que ele tem né o azul vermelho o amarelo Ele fez vários testes ele colocava as versões do Google e viam qual que as pessoas pessoas interagiam mais curtiam mais para ele chegar naquele determinado Tom e parece que somente para cor azul eles testaram mais de 27 opções de azul para chegar naquele Tom que foram os tons que as pessoas mais engajaram com o Google
então tem essa análise sim também não precisa ser nesse nesse nível do Google mas essa análise você quer saber se você que vende eh algum produto você quer saber qual o produto que geraria mais cliques no seu site você quer colocar esse produto na capa certo então você faz um teste a a para isso eu falei um pouquinho sobre como fazer o teste AB Mas aí você tem que analisar os dados né você tem que você fez uma amostra você não fez um teste AB com toda a sua população de interesse com todas as pessoas
do mundo só ali com alguns do seus clientes ou algumas pessoas que visitaram o seu site Então você tem que analisar aquilo para verificar se existe uma diferença e às vezes não tem diferença Às vezes o João ele tem uma desconfiança que essa blusa verde limão vai gerar mais clics porque Sei lá tá na moda e na verdade no fundo não teve uma diferença significativa já voui falar nesse termo é a inferência estatística e a inferência estatística O que que você precisa entender primeiro de tudo o que que é uma população que é uma amostra
né falando da forma da definição eh aqui né a gente tem a população todo mundo que você quer estudar e amostra é aquele pedacinho que você coleta o que é um parâmetro O que é uma estatística distribuição amostral o teorema do limite Central O que que é o valor esperado e o erro padrão que você vai precisar para estimar e calcular probabilidade da média amostral e da proporção amostral com isso você tem o entendimento da base da inferência só que na inferência você precisa saber alguns tópicos para usar a inferência Quais são esses tópicos O
primeiro é o intervalo de confiança tem duas formas de estimar uma população baseada na amra né ou seja fazer uma inferência A primeira é o intervalo de confiança Provavelmente você já ouviu falar o que que você precisa saber intervalo de confiança para a proporção para a média e os termos do intervalo de confiança o que que é um nível de confiança margem de erro e a amplitude do seu intervalo o a interpretar corretamente o intervalo de confiança é um dos Tópicos cuja interpretação é feita erroneamente infelizmente a gente vê muita interpretação errada então como como
interpretar corretamente aquele seu intervalo a comparação de dois intervalos se você consegue comparar como que compara se tem interseção se não tem interseção e também tamanho da amostra Afinal a fórmula do intervalo de confiança com a fórmula do intervalo de confiança você pode eh calcular o tamanho da amostra e o outro tópico da inferência o intervalo era uma o o segundo tópico da da inferência você também com certeza já vai falar que é são os testes de hipóteses então entendeu Qual é o objetivo O que que a gente faz quando faz um teste de hipóteses
quais são os tipos de testes entender as suas hipóteses definir Você sabe quando você pega os seus dados e vai fazer uma análise você sabe definir qual é a hipótese nula e qual é a hipótese alternativa mesmo que você já tenha ouvido falar se você nunca ouviu falar de test de hipóteses é isso que você precisa saber se você já ouviu falar você sabe definir corretamente porque esse aqui é o primeiro passo se definir o errado o resto da análise vai est toda errada e qual é o nível de significância significância alfa o que que
isso significa Quais são os erros tipo um e Tipo dois Afinal ao fazer uma inferência ao fazer um teste de hipóteses A gente já assume que vamos cometer alguma chance de erro na estatística não existe 0% de erro Ah mas eu quero 0% a gente eu também não não podemos querer tudo na vida Eu também quero ter 1 bilhão não existe a gente não tem isso na estatística a gente sempre assume uma percentual de erro mas qual é o erro pior no seu caso é o tipo um ou o tipo dois em alguns casos o
tipo um é pior em outros casos o tipo dois é o pior Como minimizar essa chance de erro né porque você pode tentar Minimizar não não vai conseguir zerar mas podemos fazer o melhor dentro dos nossos limites O que é o p valor Esse é um outro tópico que é o mais eh interpretado incorretamente da estatística uma interpretação do intervalo de confiança e outro é o p valor as pessoas não não entend o que que é o p valor não conseguem interpretar então estuda realmente tente entender o que é o p valor e como tomar
uma decisão no teste de hipóteses tá eu fiz o meu teste de hipóteses e e agora né com você Como você conclui isso e aqui eu falei a base do teste de hipóteses né Isso serve para todos eles afinal temos vários tipos de testes os mais comuns os essenciais para você saber de estatística são começando os testes t e o z você para que que você usa eles para entender a comparação entre médias e proporções você usa o teste t para comparar médias e uso o teste Z para comparar proporções você pode comparar o teste
t para uma amostra e no teste t para duas amostras a gente ainda tem um parênteses aqui que a gente tem amostras dependentes ou pareadas e amostras Independentes essa imagenzinha mostra aqui né você tem aqui uma amostra amostras e Independentes né não pareadas ou aqui amostras pareadas então entender tá eu quero comparar a média dessas minhas duas amostras elas são independentes elas são pareadas porque cada uma tem uma forma de e cálculo né então você tem que saber para não fazer o cálculo errado temos também o teste Z para uma amostra e o teste Z
para duas amostras que é quando a gente tá comparando proporções Além disso existem também os testes de hipóteses é chamado an nova é a nova é utilizada quando a gente quer comparar três médias ou mais a gente viu anteriormente quando eu quero comparar uma ou duas amostras e se você tiver mais de do que duas esse se você tiver três amostras e se você tiver cinco amostras você vai fazer uma nova as an novas podem ser divididas como a nova de uma via de duas vias se você fizer a nova e você concluir que não
tem uma diferença entre os seus eh as suas amostras as suas médias você finalizou mas se você concluir que há uma diferença você precisa fazer um outro teste para verificar em quais amostras Você tem uma certa diferença e aí que entram os testes pós rock é um não é sempre que você vai precisar mas às vezes você faz uma um teste e você conclui tá eu concluir aqui que as minhas amostras são diferentes Tá mas Quais delas a nova ela não fala isso ela tem esse pequeno defeito Zinho aí você precisa fazer um testezinho pós
que é o pó Rock também tem a nova com interação é bom verificar se as suas amostras Elas têm uma uma interação entre elas e tem um cálculo onde a gente faz isso onde a gente pode analisar isso afinal a interpretação ela muda se existir uma interação entre as suas variáveis e aqui só para enfeitar eu trouxe uma tabelinha que você se você já estudou a nova Você já viu é uma tabelinha de como a a nova é construída né a a as terminologias da da nova onde você precisa estudar quando estuda nova quando a
gente fala em testes de hipótese existem também aqueles testes que são não paramétricos são aqueles que não dependem de um parâmetro e eles são e menos robustos mas eles são mais expansivos né você pode utilizar Quando você tem algumas eh limitações nos seus dados e às vezes você não tem você usa os testes paramétricos mas às vezes você não consegue realizar aquele teste que você gostaria Então você usa os testes não paramétricos Quais são esses o teste que quadrado eu acho que é um dos mais famosos é e outros testes para comparação que seriam as
versões dos Testes t e a nova só que numa versão não paramétrica né se você tem poucos dados também você vai usar testes no paramétrico quase sempre não sempre mas quase sempre aí são eles né wilcon manne crusc walls e o teste do sinal por exemplo tem vários testes não paramétricos mas eu acredito que esses te dão ali a base e o entendimento de como você pode analisar os seus dados quando você não necessariamente tem eh os seus dados na forma correta que você tem que ter com todas as suposições pressupostos para fazer o teste
de hipóteses ideal e agora vamos entrar na modelagem estatística Por que que é importante aprender a modelagem você que trabalha ou você que precisa fazer uma previsão o modelo ele faz essa ele te dá uma forma de você conseguir prever alguma coisa prever as suas vendas por exemplo modelos de classificação eu quero classificar Eu trabalho num banco e vem clientes me pedirem préstimo e eu quero saber qual é a chance a probabilidade qual é a probabilidade da gente eh daquele cliente não pagar um empréstimo eu quero oferecer empréstimo pros clientes que vão prosperar e vão
pagar o empréstimo de volta e você vai classificar esses clientes eu dou um empréstimo eu não dou um empréstimo empréstimo baseado na probabilidade a gente falou sobre classificação lá na parte da probabilidade Então você consegue fazer esse tipo de estimativa machine learning ó o pessoal da ciênci de dados quer estudar machine learning E aí você vai começar a estudar Ah não tô aqui estudando gradient Boost suport Vector machines Mas e a base a base da você sabe o é a base da modelagem já vou falar não tem como estudar pulando a base hein Gente vocês
não vão entender nada e também a parte da modelagem você vai CONSEG entender a relação entre as variáveis de repente você não quer fazer uma previsão em si Mas você quer saber o quanto uma variável influencia na outra você faz um você usa um modelo para isso né e aqui eu trouxe uma imagem é muito interessante poderia ser colocado até na parte de visualização porque tem a ver com visualização também quer entender a relação entre as variáveis esse aqui é o Hans rustling ele é o autor de um dos meus livros favoritos que é o
factfulness e ele foi como se fosse assim quase um não pai mas ele foi um doss primeiros que começaram a trazer visualizações de uma forma mais interativa e mais interessante Então ele tem é um documentário vídeo no YouTube recomendo que vocês procurem também além da leitura do livro onde ele mostra como que os países e foram mudando aos long ao longo do tempo então o que que esse gráfico tá mostrando você tem aqui a estimativa de vida média e você tem aqui a renda média e cada bolinha dessa é um país as bolinhas TM tamanhos
de diferente porque cada tamanho cada círculo eh representa o tamanho do país então ele conseguiu ver que existe uma relação positiva entre a renda média da da população daquele país e a expectativa de vida e olhando aqui esse gráfico você consegue ver eh os você não sabe exatamente quais são os países Mas você consegue ver em qu quais continentes eles estão então aqui no na parte mais baixa né com menos renda e menos expectativa de vida a a gente tem países da África aqui na meiuca a gente tem eh Ásia e Oceania Inclusive a gente
tem esses dois círculos gigantes que são os países mais populosos do mundo China e Índia a gente não sabe exatamente qual é qual porque não tá escrito aqui né nessa imagem essa imagem é um pouco limitada o ideal é ver a aula dele toda e ele mostra ao longo dos anos como essas Eh esses países eles aumentaram a expectativa de vida e também aumentaram a renda então é muito interessante isso aqui é o quê é uma análise de regressão que é uma modelagem que é o que eu já vou falar no próximo slide onde ele
consegue ver uma associação entre essas duas variáveis Então vamos lá falar sobre os tópicos né que eu já dei o spoiler que que você precisa saber a regressão então a regressão ela faz basicamente isso né como eu mostrei no na imagenzinha você tem aqui uma variável você tem outra e você tem uma relação linear entre elas por que que eu falei essa essa palavra linear porque a base da modelagem é justamente a a regressão linear com ela você consegue fazer a previsão assim como entender a associação entre duas variáveis temos também a regressão logística que
é a base do modelo de classificação então assim Você está estudando machine learning e você não entende direito a regressão linear ou você não entende direito a regressão logística Afinal você usa modelos de classificação que tem uma melhor acurácia do que a regressão logística gente começou errado você tem que entender a base isso aqui é por onde tudo começou e aí você vai entender os outros modelos tá Então essas são a realmente a base da modelagem você também eh entender os pressupostos quando necessário se você tiver estimando a relação entre duas variáveis você faz isso
com a inferência lembra da inferência que a gente estudou como tudo é conectado Então você entende a inferência Quando você vem pra regressão você sabe que pode aplicar a inferência na nos modelos de regressão mas para isso você precisa entender alguns pressupostos né porque eu eu frizo essa parte dos pressupostos que são as suposições porque muita gente pula essa parte Ah tá eu fiz a minha estimativa aqui É mas você tá analisando isso isso Você verificou se isso isso acontece isso isso acontece porque você tem que verificar né então algumas pessoas pulam e eu acredito
muitas vezes porque realmente elas não têm conhecimento não é de maldade não eu realmente acredito no ser humano mas é um ser humano que não fez a sua base que ele não teve um estudo mas eu estou aqui te dando o caminho para você ser a pessoa que faz a análise corretamente Além disso você também entender como trabalhar com variáveis categóricas afinal quando você estuda uma regressão linear por exemplo né você entende que para regressão linear você precisa ter variáveis eh quantitativas contínuas eu cara é o primeiro tópico entender as variáveis se elas são quantitativas
se elas são contínuas se elas são qualitativas lembra então quando você tá aqui na regressão você tem as suas variáveis eh contínuas E aí você tem uma variável categórica e E aí não não pode analisar regressão a verdade é que pode mas você precisa entender como trabalhar com essas variáveis você precisa transformar essas variáveis para colocá-las na sua análise e assim levá-las em consideração e é uma eh uma forma de de análise muito comum a gente é muito comum a gente ter variáveis categórica nos nossos dados mas a gente não pode sair jogando da forma
que tá a gente tem que fazer a adequação para aquele nosso modelo então o que você precisa estudar na regressão a regressão linear simples e a regressão linear múltipla né a simples é a base e aí você vai paraa múltipla múltipla já é um pouquinho mais avançada você entender como fazer uma previsão Como que eu posso usar essa regão regressão para fazer uma previsão por exemplo eu quero fazer uma previsão de vendas da minha loja dada essas características aqui que eu coletei da da minha amostra essas variáveis da minha amostra não da minha loja coletei
essas análises da minha loja eu quero ter uma noção da previsão de vendas você pode fazer isso entender A análise dos resíduos o r quadado o r quadado ajustado são algumas terminologias da regressão a relação entre as variáveis você por exemplo que pode usar a inferência na regressão que eu falei sobre isso eh ver quais pressupostos você tem que verificar né se você tiver entendendo eh querer se você quiser entender a relação entre duas áveis você vai fazer uma inferência para isso então você tem que verificar umas suposições essa e quando eu falo de entender
a relação das variáveis eu tô falando assim quando você está analisando né uma vamos supor quero fazer entender o que impacta as vendas da minha loja e você coleta umas variáveis para ver o que é impacta e Tem coisa que impacta Tem coisa que não impacta por exemplo Ah eu tive nesse período aqui eu dei um cupom eu quero saber Cup de desconto o quanto isso impactou nas minhas vendas e de repente teve um impacto fenomenal e de repente não teve nenhum Impacto significante ter dado aquele cupom não adiantou em nada e você quer entender
isso afinal você quer saber se você continua dando cupom ou se você nem perde tempo com isso porque às vezes Você investiu em fazer o cupom em divulgar esse cupom e no final isso não impactou as suas vendas então é essa relação entre as variáveis que eu tô falando o que realmente vai impactar aquilo que você tá estimando baseado naquelas informações que você coletou e você precisa de uma inferência para isso e também e as variáveis categóricas né Que Eu mencionei como eh incluí-las no modelo e estudar também a regressão logística que eu acabei frisando
mais na regressão linear né Afinal ess é a base mas quando você chega na regressão logística tudo se aplica também né mas começa pela regressão linear porque ela é mais simples a regressão logística ela já é mais complicadinha então vocês gostaram desses tópicos Esses são os tópicos Ah mas é muita coisa gente Mas é muita coisa ninguém falou que seria fácil né a gente realmente precisa estudar mas esse aqui é o caminho é a base Independente da sua área todo mundo tem que saber esse tópico e de repente você na sua área também precisa saber
de estatística O tópico x que é muito usado na sua área aí esses já são complementos né já são ali o as cerejas do bolo ou os os enfeites os complementos específicos pra sua área quem é da área de saúde repente precisa eh estudar mais um certo tópico e o pessoal da área de marketing não precisa mais eles precisam de um outro certo tópico Mas você tem que começar por essa base sabendo disso você já tá aí à frente dos outros você já tem um diferencial Afinal como vocês viram não não é pouca coisa e
muita gente infelizmente não está é disposto a a estudar a começar né então agora você já tem o caminho aí já sabe o que fazer e falando falando desses tópicos Eu também quero ressaltar mais uma vez a questão de não pular etapas né eu falei logo no começo essa da minha metodologia eu não quero que você saia estudando regressão sem né Passar Pela estatística descritiva passar pela probabilidade e isso inclusive É engraçado porque o o Rodrigo que foi o meu aluno de do curso de estatística ele queria isso aconteceu com ele ele queria muito aprender
regressão e ele pensou ah mas eu já estudei estatística de descritiva eu não preciso isso e ele descobriu que seguir a sequência da forma que eu falei falei Rodrigo segue a sequência ia realmente ajudá-lo agora olha só o que ele me relatou eu sou formado em matemática pela USP e eu fiz o curso de estatística da professora Fernanda Maciel eu estava em busca de conhecimentos a respeito de regressão logística até que eu acabei encontrando o perfil do Instagram dela vi as lives dela me interessei e resolvi fazer o curso de estatística isso inicialmente eu fiquei
com um pouco de preconceito no sentido de que eu já tinha visto eh conceitos como estatística descritiva probabilidade Então tava com aquela coisa assim de aqui não dá para pular para regressão logística direto né mas esse curso ele me surpreendeu de duas formas uma cada módulo ele está relacionado com um assunto posterior e então a parte de estatística descritiva probabilidade inferência estatística ela está relacionada com o conceito da regressão logística então era importante eu rever esses conceitos a outra coisa que também me surpreendeu positivamente nesse curso foi o fato de que eu lembrei que eu
tinha dificuldade com teste de hipóteses na faculdade não aprendi isso direito mas com o curso da professora Fernanda eu pude entender como definir o H1 e o h0 então Por conta desses motivos eu só poderia recomendar o curso da professora Fernanda Marcial de estatística e assim como o Rodrigo no meu curso de estatística eu tenho mais de 1300 alunos que são das mais diversas áreas com diferentes níveis de conhecimento eu tenho alunos que eles chegam que nunca nem gostaram na estatística não sabe o que é para que serve como funciona e eu tenho alunos que
já tiveram uma certa familiaridade já estudaram e tal e ainda assim o meu curso é dá a base para todos e te dá autonomia para você trabalhar com dados sozinhos Afinal esse curso ele também né com muito orgulho ele foi reconhecido pelo MEC e ele ao completá-lo você tem um certificado do MEC e você eu sei que você consegue ter essa autonomia trabalhando com dados porque a gente tem aulas ao vivo eu tenho um acompanhamento de tirar dúvida e você pode tirar dúvidas diariamente na plataforma que eu respondo todos os meus alunos e a gente
tem dúvidas ao vivo também com encontros de auxílio para o projeto e eu garanto que você consegue finalizar o seu primeiro projeto em até oito semanas Então você vai colocar as mãos na massa vai pegar os seus dados vai estudar os módulos do do curso e completar o seu projeto aí bonitinho mas eu vou falar sobre o meu curso depois eu queria eh que você eh tivesse essa noção dos conceitos que você tem que saber de estatística e vamos na próxima aula colocar isso em prática eu vou mostrar como fazer uma análise de regressão usando
o Excel que é uma ferramenta que basicamente todo mundo tá em casa e a gente vai fazer essa análise né eu não queria trazer aqui um um um programa que você precisa programar Às vezes você não sabe como eu falei as pessoas né que me acompanham eu fico muito feliz elas são das mais diversas áreas tem gente que já é aí o mestre phd em programação e tem gente que nunca programou então uma ferramenta mais democrática é o Excel que todo mundo consegue usar Então é isso agora eu quero que você deixe o seu comentário
aqui se você gostou se você tá animado já quer começar a estudar já fez a sua listinha aí já sabe né os o os pontos tem que estudar começando do primeiro tá mas já sabe quais são os pontos que você tem que reforçar me fale aqui o que que você achou dessa aula se tá animado paraa próxima e eu te vejo lá tchauzinho [Música] [Música]