O olá bom dia boa tarde boa noite eu disse mais nada obrigado por estar me ouvindo aqui hoje vamos começar uma trajetória razoavelmente longa esse é o início é o primeiro passo nessa trajetória este é o começo de uma disciplina né que é pode ser tanto uma disciplina de graduação quanto de pós-graduação tá que é uma disciplina de estatística aplicada ou de análise de dados então o foco dessa disciplina não É tão grande na questão matemática em si mas sim na introdução dos conceitos básicos para possibilitar a elaboração e análise de dados de um projeto
de pesquisa é esse é um conjunto de vidros voltados para alunos que têm interesse no método científico não só alunos mas quaisquer pessoas que têm interesse entender como o método científico funciona que tem interesse em saber o com o que um cientista faz né é todo um cientista que trabalha com Dados quantitativos na em todas as áreas do conhecimento em geral então é uma é uma disciplina e uma série de cursos é que apresenta uma base epistemológica interdisciplinar para quaisquer áreas e que pode ser útil para você também caso mesmo que você não queira ser
cientista mas que queira consumir ciências você vai conseguir com base nesse curso ler artigos científicos e entender minimamente o que os autores ali estão fazendo e também pode ser me é na Verdade muito útil para o mercado de trabalho também né caso você tenha interesse em trabalhar em com análise de dados ou mesmo confecção de relatórios ou entender como funciona a vários tipos de produtos né do processo quantitativo de análise de dados essas aulas podem ser muito úteis muito testar então é esse curso é direcionado para as pessoas canto das áreas de exatas humanas biológicas
e o pessoal de exatas a gente vai ter um Vigor até um certo nível mas o objetivo é que seja uma introdução à epidemiologia do uso de dados quantitativos e de inferência estatística para testar hipóteses tá então a gente vai começar no nível bem básicos e vou supor que o marco zero a gente não sabe nada e você vai ver que rapidamente vamos conseguir construir uma série de conceito tá então espero que vocês aproveitem me acompanha pega na mão aí a gente vai trilhar um caminho Que eu espero que no final mude um pouco você
e você veja coisas bem interessantes né você consiga olhar o mundo da ciência e das da do método quantitativo de uma forma diferente tá não importa sua graduação eu tenho certeza que você vai poder usar o conteúdo disponibilizado aqui de forma aberta é de várias você vai utilizar ele com certeza vai ser o último e você vai é de grande valia espera tá então vamos começar né é você vai vendo que tem uma Luz aqui então ela ela vai ser nossa amiga a durante todas essas aulas tá então esse é um curso de análise de
dados análise de dados aplicados né a quaisquer a luz a análise de dados aplicados em geral você vai ver que minha letra não é um primor mas usar uma louça pode ajudar você também a saber fazer anotações você pode anotar isso do jeito que achar melhor recomendo fortemente você note durante a aula faça anotações também no Papel para você porque você vai sentir muita mais à vontade em utilizar as suas próprias anotações do que voltar no vídeo várias vezes tá então o vídeo pode ser vira o vídeo costuma servir apenas como um repositório do material
bruto em que com base no seu caderno você pode olhar o caminho das suas anotações e voltar mais ou menos no vídeo no momento que seja necessário caso você queira relembrar o rever algum conceito tá então essa é uma dica inicial não é Porque uma aula virtual né uma conversa virtual um monólogo na verdade que você não deve anotar tá caso você tenha rabito disso né de anotar fazer anotações vai ser muito útil para você e também para consolidação tá na descrição do vídeo é sempre vai ter materiais estas coisas úteis né para se você
já utilizaram também e eu vou também deixar um episódio do podcast que eu participo canal rodo sobre estratégias de aprendizagem que eu acho Que pode ser útil também como complemento a esse início né da importância desse curso para a formação geral tá então inicialmente né na nas unidades aplicado a gente vai trabalhar com o parque online não é com um esquema para que que serve isso né por que que serve análise de dados é qual que é a ideia estatística enfim é na verdade ela parte do do seguinte esquema você tem um fenômeno se você
tem que ser nome no no ambiente Algo que te chama atenção tá a assim é baseada muito uma curiosidade no interesse inicial por um fenômeno que acontece e você se pergunta será que isso aí vem uma pergunta né quando você observa alguma coisa curiosa na realidade você se pergunta será que isto correu o ocorreu por acaso se por acaso ou faz parte e faz parte de um padrão tu és uma uma questão bem interessante Assim é todas as pessoas que têm interesse no método científico em geral fica muito incomodados e como quando eles quando elas
veem algum patrão né seja na atividade profissional seja enfim e você vê se é que isso aconteceu por acaso ou faz parte do padrão né será que se eu observar isso mais vezes eu vou conseguir ver o mesmo evento que eu estou vendo de forma continuada né em geral as pessoas abrem mão disso elas acham uma coisa curiosa e pronto mas na Verdade tem muita riqueza atrás o estudo de como testar se existe associação entre coisas ou relação entre coisas tá é só banho aqui você ficou curioso né você viu isso então eu vou dar
até um exemplo imagine que você é um médico e dentro trabalha no hospital e dentro do hospital você viu uma associação interessante assim você viu que mesmo com tamanho da nossa pequeno você viu que tem toda vez que um certo paciente apresenta um certo sim toma logo depois Acontece outra coisa tá então e toda vez que um paciente apresenta tosse logo depois que ele apresenta tosse e começou a tosse parece que é associada com outro evento né para na sua observação individual nas observação pessoal será que só aconteceu por acaso fortuitamente aquela pessoa é que
tossiu ela emitiu um outro comportamento posterior ou na verdade isso faz parte de um padrão não é isso pode ser curioso isso pode se pode chamar atenção para Você coletar dados com mais afinco para tentar testar sua hipótese né para verificar se algo casual que se deve aquele indivíduo ou na verdade faz parte de um padrão tá o objetivo desse curso é instrumentalizar vocês a fazerem isso então desde formula e montar questão de pesquisa até conseguir coletar os dados como coletar e também como analisar os dados e escrever o relatório de pesquisa no final parece
algo muito muito complexo e é mesmo mas na verdade você Vai ver que ao longo dos das aulas você vai conseguir estruturar razoavelmente bem tá um plano de pesquisa com análise de com análise de o plano da análise com o cálculo de amostra e caso você tem acesso aos dados você vai conseguir analisá-los e também escrever um relatório a respeito tá então supondo que você tem esse fenômeno eu só só próxima fase né dado que você teve interesse sobre ele não eu quero estudar verificar responder essa Pergunta aqui né se isso acontece por acaso ou
não né você vai ter que conseguir de compôr esse fenômeno não conjunto de variáveis ah tá e vamos definir o que é isso daqui a pouco quando você conseguir coletar you esse conjunto de variáveis a próxima fase você identificar os tipos de variável que você tem uns tipo de variável né que você tem e dado que você tem isso os tipos de variáveis que depois a gente vai discutir quais são Você vai escolher ou determinar um teste estatístico de interesse é um plano estatístico não é de interesse caso eu preciso de mais um e todo
o teste estatístico ele responde uma pergunta de pesquisa específica olá tudo peste questão de uma pergunta que em geral é que aí a ideia que você monte né o seu teste estatístico escolha seu teste estatístico em função dos tipos de variável e das variáveis que você coletou essa pergunta vai responder Basicamente isso né vai tentar verificar se existe de fato associação o efeito ou relação entre aquele que você ta observando ou não é algo fortuito tá então esse algoritmo né esse parte line aqui é é um método é aplicação principal a seguinte forma bem sucinta
do método científico tá e a passagem aqui entre cada uma dessas setas né tem tem os seus desafios tem as suas dificuldades e a ideia é das primeiras aulas assim é a gente entender melhor como spike lá e Não funciona né a gente vai entender melhor como ele funciona para a partir daí verificar os desafios que acontecem em cada fase que vão ser os desafios que você vai perceber na sua pergunta de pesquisa né no processo de construção é de um teste de uma hipótese e a gente vai ter uma aula sobre teste de hipóteses
em si e a partir daí você vai conhecer os diferentes testes estatísticos tá então as primeiras aulas não tratado essas três partes desses Dessas três primeiras certas aqui né as primeiras aulas tá como que você é como que você pega um fenômeno e transpor em variáveis não vai ser o que a gente vai falar agora depois vamos definir variáveis as suas características depois das variáveis quais são os tipos né como que você faz análise descritiva de cada tipo de variável e a partir daí vai entrar ideia de teste de hipóteses e a gente vai trabalhar
com os diferentes testes estatísticos e aí vão ter muitas Áreas a aula sobre isso tá sobre os diferentes tipos de teste estatístico e como quais as perguntas que cada teste responde tá então antes de tudo o método científico é um método estruturado é um método organizado que todo mundo pode ter acesso é muito útil no sentido de entender fenômenos a ideia é que isso vira uma pedagogia de como você utiliza como que você e para aprender as pessoas que uma percepção de ciência como algo muito Distante mas a ideia desse curta trazer algo de certa
forma algo para mais perto de você tá você perceber que a ciência é algo que você pode utilizar para aprender coisas para entender como o mundo funciona como a realidade funciona e propor testes né para tentar entender possíveis regras gerais pelas quais as coisas funcionam tá mas vamos começar do começo então imagine esse fenômeno que você tem interesse o que acontece na vida né na no mundo na no trabalho enfim E você quer estudar ele né eu tenho interesse eu quero eu quero saber porque que isso acontece é uma pergunta que atrai minha curiosidade o
primeiro desafio de compor isso no conjunto de variáveis então a gente tem essa primeira certo aqui né essa certa é estudada por uma área que matematicamente é muito árida é muito difícil mas eu vou abrir mão né eu quero dar só uns tópicos gerais sobre isso que a chamada teoria da medida A teoria da medida né a teoria da medida ela trabalha me digita isso ela trabalha elas na verdade ela busca é uma área de conhecimento que busca responder uma simples pergunta que é o que é medir o que é medir isso não é é
uma pergunta que não é nem um pouco trivial tá em geral as pessoas confundem o que é medir com como medir né como medir alguma coisa e não é isso que a teoria da medida é testa tá estuda né na verdade eles tudo o que é medir qual ocorre Quais são as propriedades de um de uma medida tá você pode entender de uma forma inicial assim medida como sendo uma régua como que você cria né como que você cria réguas as réguas para realidade e para a realidade das coisas e para realidade natural né acho
que é uma definição melhor tá como é que você queria réguas para as coisas tá por exemplo vamos imaginar que eu tenho uma mesa tá isso aqui é uma mesa tô vendo Ela de cima tô aqui o tampo da mesa e eu quero me disse cumprimento aqui ó eu quero me disse tamanho da mesa tá e eu tenho dois objetos que eu posso usar para medir a mesa eu tenho uma trena né uma trena que aquele negócio circular que tem uma uma fita métrica na que você puxa aí você pode medir ou eu tenho um
pedaço de madeira um pouquinho de madeira mais ou menos esse tamanho tá ele é fixo ela não tem nenhuma marcação é só um pedacinho de madeira tá bom eu Posso utilizar qualquer um desses dois instrumentos né para medir o comprimento desta mesa por exemplo tá é tanta treinar conta madeira eu vou colocando um pouquinho de madeira na mesa e vou contando né quantos toquinhos de madeira eu tenho eu vou conseguir ter alguma métrica de se você usar trena também vou ter uma meta tá bom a teoria da medida ela que ela fala dessas réguas né
ela tem o que é medir leva em conta o que é medir toda Vez que você faz uma medida de algo isso leva em conta dois aspectos tá dois aspectos fundamentais quando você vai medir alguma coisa é a validade desta coisa a validade ea precisão ah tá é o que é validade não é validade da régua da medida que você tá criando é verdade a resposta a uma pergunta será que é o que eu estou medindo ou será que o que eu estou medindo e é de fato médio que eu gostaria o vídeo que eu
gostaria E essa ideia da validade de uma régua tá então por exemplo quando eu uso a trena ou quando eu uso um pouquinho de madeira frame de um lado de uma mesa essas duas medidas são válidas né é válido eu posso usar um pedaço de madeira para medir comprimento e eu posso usar uma trena para medir comprimento então nesse sentido as duas réguas que eu tenho são igualmente válidas mas será que elas têm a mesma precisão né a precisão é a uma pergunta que você se faz né em relação a Precisão que será que a
régua da entre aspas a régua que utilizo será que a régua que utilizo de fato ou será que a régua que utilizo de fato consegue e consegue discriminar a discriminar coisas que têm interesse as coisas que tenho interesse o interesse ah tá então esses dois pontos são super importantes é por exemplo se eu se eu tenho uma mesa uma mesa só né eu consigo Medir esse comprimento aqui usando uma trena consigo me descumprimento usando um pedacinho de madeira os dois vão ter as duas nos duas réguas né elas tem a mesma validade nas duas serve
para medir comprimentos só que elas não têm a mesma precisão tá se o meu objetivo é só me disse cumprimento aqui né a treino tem uma precisão maior ela vai na casa de milímetros e tal né então eu consigo medir um pouco mais de acurácia tá mas os eu tenho só uma mesa e eu disser que Ela tem sei lá 40 cm né ouvinte pedacinho de madeira né é mais ou menos a mesma coisa só que isso fica mais grave quando eu tenho por exemplo duas mesas e se eu pegar uma outra mesa aqui né
e eu quero medir o cumprimento dessas duas vezes essa ou essa tá às vezes a com a trena talvez como ela tem uma precisão maior ela me permite discriminar coisas melhor tá então se eu tiver uma régua é mais precisa eu consigo discriminar Coisas que são mais parecidas tá bom coisas que tem uma precisão baixa às vezes eu não consigo discriminar coisas então talvez não me sirva no momento de utilizar para um teste né agora eu vou testar a diferença entre coisas tá bom então a essa ideia né amanhã mas é uma ideia são coisas
que você tem que pensar no momento de pensar sua pesquisa no início da pesquisa gente no coletor nenhum dado ainda a gente tá começando a formulação das coisas em geral as Pessoas têm um compromisso com as palavras mas em geral as pessoas podem utilizar a palavras diferentes para a mesma coisa ou em uma mesma palavra para coisas diferentes tá bom então isso as palavras já estão réguas quando a gente fala por exemplo de comprimento distância velocidade coisas palpáveis físicas é mais fácil de ver a validade ea precisão né então quando eu meço distância comprimento hospital
é mais fácil né Falar de validade e precisão mas quando eu falo de coisas abstratas né coisas que não são tangíveis diretamente você vai ver que não é trivial vamos a um exemplo se eu tiver por exemplo um exemplo em que eu tenho dois grupos a e b tá eu quero dois grupos de pessoas até as pessoas no grupo a e as pessoas do grupo b e o meu objetivo é verificar qual dos grupos qual dos grupos e é mais satisfeito não satisfeito com É um produto por exemplo tá eu tenho um produto qualquer um
pode imaginar qual ser uma com um alimento qualquer coisa eu tenho um produto um serviço eu quero saber qual dos dois grupos é mais satisfeita com esse produto tá eu tenho dois grupos diferentes para vocês o grupo com rendas diferentes grupos de pessoas que utilizam o produto antes ou pessoas que estão usando a primeira vez você pode definir os grupos como você quiser mas meu ponto é como é que eu Discrimino como é que eu queria uma régua para discriminar o grupo esses grupos para saber se existe diferença na primeira coisa é verificar qual é
a régua né a régua qual dos grupos a mais satisfeito então a palavra satisfação eu quero criar na verdade quando eu tenho essa ideia de satisfação eu quero criar uma régua para isso e não seria uma régua é uma régua para medir satisfação né é e quando eu penso nessa régua eu tenho que pensar nas duas Nos dois pontos importantes da teoria da medida né suponha o primeiro tem que isso porque eu sei o que é satisfação então a primeira coisa quando eu falo de coisas físicas comprimento distâncias é fácil tá mas quando eu falo
de coisas mais abstratas e mais complicada então ela fala satisfação eu tenho que primeiro ter uma definição do que é oi será que você sabe o que é satisfação tá eu eu duvido tá bom satisfação é uma coisa muito vaga tem muitos conceitos as Pessoas usam a mesma palavra para coisas diferentes então é muito complicado tá primeira coisa da definição depois que você tem uma definição né dada a definição e é que aí essa definição vai paralisar sua régua né qual a qual a validade a validade e precisão precisão da régua e não é que
você vai utilizar oi e aí a coisa complica né qual a validade ea precisão da régua tá deixa até colocar para cá qual é a validade e Precisão dessa régua que você vai utilizar ah é então por exemplo se você perguntar para pessoa o quão satisfeito você tá com o com satisfeito você tá com um produto oi tá com validade a precisão ea validade da régua na régua tá é isso é uma pergunta importante então por exemplo se eu for criar uma régua eu quero saber qual dos grupos é mais satisfeito né aí eu vou
criar uma régua Essa régua para mim não vai ser uma fita métrica ou um pedacinho de madeira mais uma pergunta perguntas são réguas para coisas então vou perguntar por exemplo o quão satisfeito com o satisfeito você está e com produto com o produto x e com satisfeito você tá com produtos x e eu te dou uma escala de 0 a 10 tá para você marcar sem do zero nada satisfeito por exemplo e da isso muito satisfeito e aí você tem que marcar em algum lugar E aí eu mexo esse tamanho no computador esporte fazendo slider
para pessoa arrastar e tal é qual que é o problema dessa só que eu também tô usando uma régua tô criando uma régua e aí eu posso pegar um grupo de pessoas do grupo a medir o valor aqui né pegar um valor sei lá que deu 4.7 centímetros sem uma regra de 10 cm aí eu coloco aqui o o valor dessa pessoa 4.7 e aí vão medindo um grupo de pessoas aqui um grupo de pessoas aqui e aí eu posso comprar esses Grupos né qual é o problema disso é será que as pessoas que você
tá perguntando tem a mesma definição de satisfação que você tem será que a definição de satisfação que você tá escolheu é claro é o suficiente de novo quando você fala de variáveis físicas né é algo mais fácil quando você fala de variáveis não tão tangíveis é bem complicado tá e e olha que eu só tô falando dessa passagem aqui ó do fenômeno que você tá vendo por exemplo você tá vendo Eu sou do grupo a e você tá vindo de um jeito qualitativo com poucas pessoas uma forma bem aneddoti fica eu estou vendo que as
pessoas do grupo aparecem mais satisfeitas na minha realidade assim será que ela só mesmo né daí você faz um estudo você ficar motivado para fazer um estudo o primeiro desafio é perceptualmente assim você vê que a pessoa a pessoa por exemplo do grupo aca mais satisfeita você tá vendo isso uma coisa você ver outra coisa você que Conseguir criar uma régua para captar aquilo que você tá vendo né de forma real ali né na complexidade do mundo será que você vai conseguir tirar desse fenômeno complexo que está inserido num contexto será que você consegue captar
uma régua para discriminar coisas né é esse é o grande desafio esse é o primeiro grande desafio se você não conseguir fazer essa passagem olha aqui para cá do fenômeno pros variáveis todo o resto fica inútil não importa você Usar o melhor teste sendo que a régua que você utilizou para medir ou ela não é válida ou ela não é precisa ou a d o conceito não é boa tá então guarde isso gente então às vezes você pode achar diferença significativa entre grupos baseado numa régua aqui na verdade não é boa mas é que aqui
na verdade não discrimina e pode acontecer o contrário e você não encontrar diferença entre os grupos mas na verdade ele existe só que a régua que você Coletou a régua que você optou construiu não tem a precisão suficiente para discriminar grupos tá então isso é uma coisa assim amor como é que eu consigo fazer isso né é meditação você vai ter que de fato testar fazer teste piloto para ver se as réguas que você tem são de fato úteis e aí vale muito subir no ombro de gigantes está verificar o que outras pessoas no seu
campo de pesquisa já fizeram ler artigos na área ler artigos que testaram coisas parecidas e Verificar as réguas deles para verificar se essas réguas testes perguntas de fato podem ser úteis para você tá é a primeira grande receita para você utilizar no questionário de pesquisa não faça ele tente verificar outras pessoas que já trabalharam e validar um questionário mais para frente do curso gente vai ter uma aula sobre aulas na verdade sobre análise fatorial que seria essa construção como que você constrói essas réguas né mas vagas assim né seus Raios mais entre aspas subjetivas né
que ainda não é que elas não são subjetivas tá elas são baseadas em variáveis funcionários muito claras assim mais para frente também vou definir o que a variável funcional você vai aparecer em outras altos tá mas essa primeira vez primeiro a ideia aqui da validade da precisão são coisas que geralmente as pessoas começam a pergunta de pesquisa muito fácil né aí eu vou estudar o efeito da cena de um remédio na Depressão então por exemplo tem um outro exemplo eu quero estudar o efeito é de um remédio um remédio y sobre depressão tá quando você
olha essa pergunta e você perguntou você perguntou para alguém tá fazendo mestrado doutorado né que está estudando ai eu quero ver o efeito desse remédio sobre a depressão se diminui a depressão das pessoas quando você olha essa pergunta em geral têm duas variáveis aqui dentro o remédio Né então tem pessoas que tomam remédio e eles têm que ser comparados com pessoas que não tomam remédio por exemplo você tempo né não tomo e tem que ter uma outra variável que a depressão a depressão ela é uma variável interna assim ela ela não é visível directamente né
e cada pessoa tem um grau você se você ver você vê clinicamente pessoas com depressão e pessoas em depressão você consegue ser clinicamente no fenômeno você existe o fenômeno da Depressão na natureza questão é como você consegue fazer uma régua para medir esse fenômeno aí muita gente falar mas tenha questionário que mede isso e aí eu respondo isso uma pergunta porque que só existe por que que não existe só um questionário do mesmo jeito que existe um tipo de treinar só para medir as coisas né tudo que você me disse pode vir com uma trena
né só muda a marca mas a trena é a mesma e por que que não tem que perder pressão Que eu não tenho que acionar o sol tem vários né porque talvez a esses questionários não peguem a depressão totalmente pega um pedaço né então a primeira pergunta aqui é que régua entre aspas que régua e para medir e para medir depressão não estou usando oi e aí você tem que saber as propriedades do questionário se o questionário de fato tem perguntas dentro dele que são relacionadas com Fenômeno que você tá usando com fernanda que você
tá verificando tá então por exemplo você pode ter tem dois questionários né possíveis assim tem que chama deck tem outro tem vários mas tem outro tema remilton tá eu posso aplicar os dois questionários na mesma pessoa e eles podem dar resultados diferentes porque eles são réguas diferentes que medem aspectos da depressão diferentes é como se a depressão fosse uma entidade aqui né aqui uma depressão e cada teste Na cada questionário né cada teste é não não mede a depressão como todo é como só depressão fosse a mesa né mas eu não consigo medir a mesa
todo o comprimento da mesa como se o teste beck por exemplo pega um pedaço né mede uma certa variabilidade aqui e o teste remilton por exemplo pode vir de uma outra variabilidade é né e aí eu tenho que verificar dentre as questões desse teste quase questões são mais relacionados com o meu fenômeno Por que que as pessoas que tomam esse remédio toma esse remédio quais são os sintomas relacionados com esse remédio né esse remédio ele atua em quais áreas dentro cérebro por exemplo em quais vias essas vias são relacionados com quais comportamentos e esses comportamentos
são relacionados com quais perguntas dos testes se eu verificar com certos questionário não tem as perguntas que seriam as perguntas relacionadas a sintomas que seriam modificadas pela Ação do remédio a minha régua ruim ela não é válida ela não tem validade porque não estou assistindo a os sintomas que relacionados com as questões do questionário o efeito do remédio então me a régua não é válido não importa como preciso ela seja tá às vezes nenhum dos dois questionários podem resolver talvez eu tenho que criar ou padronizar ou validar um outro questionário uma outra régua tá dependendo
do meu fenômeno então essa é E fala assim antes de coletar o primeiro paciente bem antes quando você tá escrevendo projeto ainda da pesquisa tá é só uma questão super importante se porque se você não avaliar para cada variável que você tá completando qual é a validade qual é a precisão você não vai conseguir fazer a transposição do fenômeno para as variáveis né e aí você vai perder tudo o resto não adianta não tem estatístico que resolva uma análise de dados quando as réguas utilizadas não São boas tá isso vai gasta um fosfato o bom
sabe você vai ter que meditar bastante para pensar sobre isso tá isso é uma questão realmente fundamental e muito antes muito anterior a coleta do primeiro paciente tá é por isso que é importante quando você manda projetos por exemplo para órgãos de fomento para conseguir bolsa esse tipo de coisa é quanto os revisores são espertos em bons em geral eles pegam muito e por que que você escolheu essa variável para medir Isso né que a questão da validade e da e você vai medir quais são os critérios de cuidado que você vai ter para garantir
a boa coleta dos dados para não ter perda e também para garantir a precisão da medida né para não ter muita variabilidade para depois não comprometeria a comparação de grupos ou de efeitos o que você quer fazer tá então isso é fundamental você não pode não tome isso de forma leniente porque se fala essa primeira parte para frente Daquele cola tudo tá se você trabalha numa empresa por exemplo tá dizendo um projeto essa parte é fundamental tá senão você vai jogar dinheiro tempo e vontade fora tá e provavelmente se você for muito utilitário uma promoção
também tá bom então feita a sua primeira descrição já comprei uma dessa primeira parte né isso aqui tá ok no momento de pensar na nossa pesquisa agora a gente vai para outra parte então suponha vamos supor que você tá olhando uma certa Pergunta de pesquisa verificou lá quais as réguas que você vai utilizar para medir o que você quer medir e aí não chega na parte das variáveis a lista de variáveis né aqui nas variáveis eu tenho que eu tenho começar com um ponto que a senhor eu tô usando o termo variável mas eu estou
definindo o que é né então primeiro eu tenho que definir o que o que são variáveis né então entra aqui uma outra parte né o que é uma variável tá vou dar uma Definição depois a gente vai trabalhar na no falseamento dessa definição e verificar os limites dela então que ela variável nós variável é todo dado diretamente observado eu todo dado diretamente é diretamente observável a observava que pode ser quantificado pode ser quantificado essa seria uma definição inicial básica do que é uma variável tá tem aspectos importantes o primeiro aspecto essa esse ter mudado O
dado é uma coisa diferente de informação bom então vamos trabalhar um pouco não definições aqui tá dado a diferente de informação um dado ele é um só uma mera quantificação olá eu sou uma quantificação de álcool e a informação ela é a quantificação mais um sentido esse sentido pode ser uma unidade de medida então por exemplo se eu chegar para você falar eu fiz uma pergunta para uma pessoa e ela me Respondeu 20 tá 2120 é o dado é a quantificação ela me respondeu eu perguntei eu fiz uma pergunta não respondeu 20 aí na sua
cabeça 20 e o que né eu pergunto aí eu completo né eu eu perguntei para uma pessoa a idade dela não me respondeu 20 anos tá quando você só tenho 20 esse vídeo já é o dado é só na quantificação tá a partir do momento que eu mostro o contexto né são 20 anos isso se refere a uma idade aí você tem uma informação tá então na verdade um Subconjunto do outro dados você coleta o tempo todo né é só que boa parte dos dados que você verifica coleta eles não fazem muito sentido para você
eles não são informações o momento que ele tem um contexto eles viram uma informação tá é então na verdade a gente cria um subconjunto né então a gente tem os dados e dentro deles tem as informações uma subconjunto do outro tá então posso dizer que todas as informações são dados mas nem todos Os dados são informação tá e não é porque tem uma unidade de medida que é uma uma informação então por exemplo eu posso colocar falar que eu medi uma coisa e deu 20 isso será que você lembra que essa unidade de medida tá
se você lembrar que isso é um homo ah tá é talvez isso vire um dado para você então eu sei que é 20 homens mas o que que homem mede mesmo mas se você não sabe o que isso mede apesar de saber o nome ainda não é uma informação para Você só um dado tá é o meu uma medida de resistência né a partir do e aí o que que é resistência aí tem que voltar lá ensino médio tá para relembrar isso igual a heresia aquela história toda tá então não é porque você sabe o
nome da unidade que é uma informação isso tem que ser inteligível para você tem que fazer sentido você não faz sentido continuar sendo um dado tá em análise estatística você trabalha tanto com dados contém informações né a questão é Que quando você faz análise o teste estatístico você pode fazer o teste estatístico com base em dados mas para interpretar eles você vai precisar transformar eles informação alguma hora tá então isso é muito importante tá bom por isso que você tem estatística analista de dados que analisam dados mas não informações que ele não consegue interpretar né
e aí demanda quando ele não consegue interpretar existe uma grande chance de dar Bom então o que você faz uma análise mim não entendi muito bem o que que você está analisando será que você escolheu o plano de dado certo plano de análise certo só pergunta que a gente vai ver mais para frente tá outra coisa importante é isso do diretamente observado observava veu né variáveis são coisas que você vê diretamente que eu consigo ver então exemplos de variáveis peso de uma pessoa altura dela né o número do sapato que a pessoa calça Número do
sapato por exemplo renda da pessoa então é opção coisas auditáveis então eu imagino eu pego uma balança eu subo em cima da balança veja o meu peso aí eu desço da balança aí eu subo de novo veio na outra pessoa vem você por exemplo e olha o resultado eu subo de novo na balança e você olha o resultado tá a ideia que eu eu subir eu subir na balança tá um resultado quando você observa da mesma coisa o sejam dado externo e auditável é diretamente Observável todas essas variáveis e elas podem teremos da medida né
mas variação na medida mas para todo mundo é o mesmo erro a rigor tá e quando eu meço variáveis que não são diretamente observáveis por exemplo seu mestre pode pegar satisfação né satisfação ou inteligência a inteligência a inteligência satisfação não são medidas diretamente nelas não são medidas diretamente observáveis elas são Medidas por meio de um teste né é como se esses isso tivesse entre aspas interno dentro de você e eu não consigo ver diretamente ao mestre por meio de de alguma coisa tá de um teste de um questionário algo do tipo isso não é variável
já quebrou sua definição básica né eles são informações são dados mas não é não é diretamente observável ué se não é uma variável o que isso é chamado de fator tá em que cometeria quando você vale a inteligência é um fator de Inteligência qi por exemplo o que ir é um fator de inteligência não é uma régua que você usa o teste de qi é uma régua que você utiliza para medir inteligência não é a inteligência por isso que você usar o seu qi o seu resultado do teste de qi para dizer se você é
inteligente ou não é um jeito errado de usar o teste tá o teste de qi ele serve para fazer inferências populacionais sobre a distribuição de um certo traço na população ele não serve para se Classificar então é comum a área da biometria nos o de teste de qi tá então qual é a definição de fator né fator ele é um agrupamento o agrupamento de variáveis o agrupamento de variáveis com objetivo o objetivo de descrever é um atributo o atributo latente e a gente vai ver muito essa ideia de medidas latentes nas aulas de análise fatorial
um pouco mais para frente tá Então guarda essa definição de variável latente o atributo latente tá então o fato é um agrupamento de variáveis então quando quando eu aplico por exemplo porque que testes é medidas de satisfação quando eu quando eu faço a igual eu fiz anteriormente aquela pergunta o que não satisfeito você tá com o produto e coloca uma medida na de 0 a 10 por quê que isso é uma medida ruim né então imagina que eu tenho lá duas pessoas né eu tento as pessoas e eu Perguntei para elas o com satisfeito você
tá com um produto é né com satisfeitos está com produto uma delas responde 7 de 0 a 10 né aqui de 0 a 10 uma delas respondeu sete eu também respondeu 7 numericamente quando o seu número elas são igualmente satisfeitas porque 7 = 7 certo já estão igualmente satisfeitos mas será que isso é verdade será que duas pessoas que respondem o mesmo valor numa escala elas estão igualmente satisfeitas um difícil Né porque porque satisfação é um evento interno satisfação evento que a dentro da cabeça de cada um a rigor e será que essa pessoa que
ela tem um com essa pessoa ela tem um conceito de satisfação que é parecido com essa será né e essa é a dificuldade na verdade assim do ponto de vista matemático óbvio que 7 = 7 tá mas o ponto de vista perceptual talvez não seja porque o zero de cada um deles é diferente a percepção de vida de cada um deles é diferente por isso que essa Régua você perguntar ao com satisfeito você tá com uma coisa é muito ruim essa satisfaz o motor e satisfação por ser um fator qual é a definição de fator
é o fator é um agrupamento de variáveis certo então na verdade essa variável aqui satisfação né avaliaram a satisfação é um agrupamento de perguntas de outras perguntas internas né que essas perguntas são variáveis elas são medidas diretas e aí combinação dessas perguntas Me gera uma variável latente que é merge delas que é satisfação tá vamos dar um exemplo e até apagar aqui em cima vamos dar um exemplo disso e imagina por exemplo eu tenho dois produtos diferentes tá eu tenho um carro e eu tenho um certo uma certa marca de sabão em pó tá bom
então eu tenho aqui um carro x né e um sabão em pó um sabão em pó y tá meu objetivo verificar fazer uma régua de satisfação para cada um tá eu quero saber o quão Satisfeito você tá com carro e com sabão tá esse é meu objetivo final é se eu perguntar só o com satisfeito aqui satisfação né eu quero descobrir isso satisfação com carro e satisfação com o sabão em pó tá se eu fazer uma pergunta o concepções que você tá com carro né dirige o carro aí com satisfeito você tá de 0 a
10 você dá 7 uma nota 7 e eu aqui por exemplo e aí depois eu te dou um saco lá de sabão em pó dessa ele é uma semana usa para lavar roupa e depois eu Te pergunto consegue isso aí que você tá como sabão em pó e você também me responde 7 tá com base nessa pergunta o quão satisfeito você tarde 0 a 10 sendo que você respondeu 7 nos dois casos eu posso dizer que você está igualmente satisfeito com o carro e com sabão em pó é numericamente sim tá certo = 7 mas
será que isso faz sentido será que essa pergunta é uma boa régua será que ela é válida e precisa o suficiente volta na tv da medida então o que é errado o que É tá errado não é a mensuração é a régua é a métrica você perguntar ao com satisfeito que você tá com uma coisa não é comparável com outras coisas que elas têm propriedades naturais diferentes tá como que você resolva esse problema você tem que verificar no carro o que é satisfação então o grande problema que a pessoa tá usando a mesma palavra para
duas coisas diferentes então você estar satisfeito com o uso de um carro e você estar satisfeito com o uso de sabão em Pó são entidades latentes naturais diferentes o que é evocado dentro da sua cabeça é diferente para cada caso então o que que você tem que fazer de compor essa satisfação em variáveis observadas quando eu tô dirigindo o carro o que que me faz ficar satisfeita com o carro sei lá a quantidade de combustível que o carro gasta com economy colher né rendimento e sim eu coloco uma variável né combustível que eu consigo consigo
medir Né quantos litros ele gasta por quilômetro o preço do carro né às vezes eu posso passar para que o preço achei o carro caro achei o carro barato a com seguro ele é a itens de segurança quanto que a pessoa acha importante certos itens de segurança o design do carro enfim todas essas coisas são variáveis são observados diretamente e aí eu posso mensurar cada uma delas está completamente diferente para sua mãe pode não mexe essas coisas meu sabão em Pó posso medir o cheiro né com um cheiro é bom para mim eu posso pedir
quando faz de espuma né eu posso medir o quanto rende o produto conta o produto rende não é de cada vez que eu uso enfim o quanto quanto deixa branco na roupa quanto lava e e cada uma dessas coisas são variáveis são diretamente observadas tá a ideia juntar isso aqui para gerar esses cor tanto aqui conta aqui oi e aí você vai ver aqui essa satisfação que é um nome ruim na verdade Ela é decomposta tem fenômenos em variáveis diferentes para cada caso tá isso é um fator porque satisfação é uma palavra utilizada por várias
descrever várias coisas e eu só vou conseguir saber o que que é satisfação descreve quando eu decomponho nas variáveis ano como é que a gente faz isso como é que eu crianças réguas aula de análise fatorial a gente vai ver extensivamente isso tá então aqui eu só tô apresentando e é importante você saber agora a Diferença entre variáveis fator já vencemos a primeira parte que é verificando-se o fenômeno como ele acontece na realidade será que eu consigo captar as variáveis não e aí aí eu entro a ideia da teoria da medida validade e precisão se
eu consigo captar os dados de fato como eles são né aí eu tenho que saber dessas partes de nessa segunda fase o que que é variável que eu tô medindo que quer fator né o que que é variável que eu consigo me diretamente Eu correto e o que que é fator o que é fato é muito de variáveis daí eu tenho que pensar quais são as variáveis que vão coletar para compor esse fator tá então quando eu falo inteligência que tipo de teste de inteligência vou medir o que é inteligência inteligência para que para fazer
conta para escrever um texto para resolver um problema para montar objetos tá existem diferentes tipos né de métricas testes dependendo do atributo Que você quer medir da inteligência inteligente não é uma coisa um conjunto de coisas e aí você tem que estudar bem o seu fenômeno tá então a gente não coletou a mão a gente eu não boto a mão em nenhum paciente você não colocou nem um questionário e você já tem muita coisa para pensar tá bom então a o método científico é baseado numa construção epistemológica que demanda elaboração por isso que ele é
lento lento nesse sentido na verdade o mundo é Muito rápido porque as pessoas fazem as coisas atropeladas mas ele tem a velocidade que ele tem que ter né então você ganha uma certa segurança no momento de fazer as coisas né quando você faz de forma pensada de forma estruturada então por isso que é também uma pedagogia é um método pedagógico de você pensar sobre a realidade ea gente vai virar um pouquinho mais para frente que na verdade o objetivo da ciência não é Trazer certezas mas reduzir a incerteza está a gente vai vir uma aula
mais para frente mais epistemológica sobre o teste de hipóteses tá então espero que você tenha um compreendido até aqui né é uma coisa que raramente você vê assim é na verdade todo o curso de graduação falando para quem é da graduação está subindo aqui isso aqui é indispensável para qualquer cruz cursos de graduação qualquer um tá não importa se exatas humanas e biológicas isso é uma Diferença totalmente não faz sentido tá é uma diferença altamente artificial voltada para o trabalho e que nível a formação do espírito científico tá no processo emancipatório você começar a pensar
assim né então como é que eu meço uma certa coisa às vezes uma pergunta de pesquisa que vale o mestrado doutorado aí você descobriu o melhor jeito de medir uma coisa tá eu percebi que as pessoas todo mundo a não ser que termo mas cada um média de Um jeito diferente qual é o melhor jeito de medir qual o jeito que tem mais validade e precisão só isso de uma pergunta de pesquisa excelente para ser respondida tá por exemplo como que você mede satisfação com alguma coisa né a construção dessas regras é uma coisa extremamente
útil que se você fizer bem feito vai te ajudar e vai beneficiar muita gente tá então gente já cumpriu esse essa parte ok e essa parte também da variável ou fator mas você pensar Sobre isso tá essa primeira aula é mais laborativa depois a gente vai para o tipo de variável né então ou fator né agora entra também a ideia do fator tá ou variável ou fator agora a gente entra aqui né o tipo de variável tem vários tipos tá você pode dividir em dois tipos principais e depois de quebrando tá bom antes de explicar
a serventia de cada uma delas né eu vou apresentar os nomes inicialmente a gente vai refletir um pouco sobre eles e depois eu vou Apresentar bonitinho em algumas utilidades de cada um tá então a gente pode dividir os tipos de variável em variáveis qualitativas talita qualitativas né e as quantitativas o quantitativo é só uma diferença bem geral inicial ainda depois a gente vai ver que tem algumas peculiaridades tá as variáveis qualitativas tem que descreve qualidades vão na verdade categorias e não é categorias de um fenômeno por Isso tinha qualidades não é qualitativa no sentido essa
diferença entre quatro qualitativa e quantitativa é meio ela é bem artificial tá então toda vez que você curte fica uma coisa você também tá vendo qualidade e toda vez se qualifica alguma coisa assim também tá quantificando tá a frequência das qualidades tá mas é por um critério didático inicialmente separa assim então as variáveis categóricas né variáveis qualitativas é uma definição geral seria Uma variável ou fator é composta olhava o autor composta por categorías as categorias onde cada uma a cada uma expressa é um atributo o atributo do fenômeno que os tá observada o tom uma
variável o fator composta por categorias onde cada uma delas expressa uma tributo do fenômeno é como se fosse em quadradinhos se você está no Quadradinho você não pode estar nos outros tá então por exemplo um exemplo aqui é o time de futebol que você torce o time de futebol se você torce para o time ar você não torce para os outros times estão está dentro de um quadradinho aí eu não torço para um time só no eu torço para o corinthians e para o flamengo tá então você tá no quadradinho de pessoas que torcem para
dois times sendo esses corinthians e flamengo você nunca vai não ficar num Quadradinho tá então eu não gosto de futebol não torço para nenhum time você tá no quadradinho de pessoas que não torce para nenhum ti tá sempre você vai tá em algum lugar não tem jeito tá bom então isso é importante das variáveis categóricas tá a as variáveis quantitativas você pode pensar como se fosse uma régua né uma vergonha né uma escala são as variáveis escalares um outro nome também escalares tá dentro de uma escala a definição de variável Quantitativa é uma variável ou
fator 1 é apresentada em em em em uma escala a escala onde o apresentador uma escala com na verdade com e com a rigor a rigor infinitos infinitos entre aspas né infinitos níveis é de mensuração mensuração tá é um exemplo de variável quantitativa né Seria apresenta altura a cultura uma quantidade né sua o nível de glicemia que você tem no sangue é uma quantidade tá ah sei lá o valor do salário e com quantidade de reais do salário também uma variável quantitativa tá então até dentro de uma escala é mais águinha tá bom essa daqui
missões bem gerais e especiais ea gente vai pode agora para com base nessas definições que quebrar isso em outras categorias tá Então quando eu olho por exemplo as variáveis do grupo um que são as qualitativas né e qualitativos tem tipos de qualitativa não é que são os quadradinhos tá você pode ter um tipo de variável qualitativa chamada de nominal nominal você tem um outro tipo chamada de original e em outro tipo de variável qualitativa também que é chamada de binária oi norato dentro do nominal mas ela tem características diferentes É só é um bom então
a variável nominal ela é composta por nomes não é cada categoria é um nome sem ordem específica então por exemplo um exemplo de variável nominal pode ser sexo oi tá masculino e feminino tá bom não tem não tem uma ordem não tem quem tem primeiro são nomes simplesmente uma 300 tu é pode ser por exemplo cor preferida é a cor preferida tem as cores né tem caixinhas tá e não tem ordem quem vem Primeiro a cor é o nome qual qual delas você prefere é a caixinha que você está não olhava ordinal a os as
categorias as categorias têm ordem é né ordem de tamanho de volume de quantidade bom então por exemplo um exemplo de variável ordinal aqui pode ser por exemplo estado nutricional o estado nutricional né que seria lá o eutrófico o sobrepeso e obesos tá só categorias né eu pego o peso dividido Pela altura ao quadrado total é isso vai dar o seu mc&mc uma variável continua é uma quantidade para dar um número qualquer número tá e aí eu quebro essa variável continuar empates e aí eu voltei uma variável categórica como três categorias eu troco sobrepeso eu desço
e elas têm uma ordem o eutrófico é menor que o sobrepeso é menor que o bicho tá muito útil também tá agora é original e tem a variável binária é que são só duas categorias o sexo pode ser uma variável Binária mas tem um tipo de variável binária a rigor a binária tem duas categorias ah tá então sei lá o que que você gosta o que você gosta de filmes de suspense o filmes de ação tá eu só te apresente duas categorias é uma variável binária tá a variável binária tem esse tipo né que a
variável binária ela pode ser nominal e não tem dois nomes né mas tem outro tipo de variável binária é chamado Variável dame e a dani era sempre uma variável 01 a presença ou ausência de alguma coisa tá então na verdade a variável dame ela não tem duas categorias ela só tem uma categoria então a variável dame que é uma coisa importante dela a gente vai usar isso mais para frente a variável dani só tem uma categoria em uma categoria onde vejo a presença ou ausência dela e com ausência É desta categoria candela dessa categoria por
exemplo eu pego uma pessoa é presa categoria hipertenso não tem uma pessoa hipertensa ou ela é e pertence assim ou ela não é hipertensa não tá então tem uma única categoria e ela pode aparecer ou não aparecer tá então eu pergunto você tem dor de cabeça né só isso é uma categoria dor de cabeça sim ou não né isso é uma variável de me ela tem uma única categoria que pode aparecer ou não aparecer uma variável Binária porque assim não presença e ausência pertence e não pertence mas na verdade só tem uma categoria tá sexo
por exemplo não é não é a binária tem duas categorias mas não é dorme tá ela seria dame se eu tivesse assim homem né pertence ao grupo e não pertence o nome e não homem tá não homem mais inclusive inclui mais coisas tá bom incluir qualquer outra coisa tá então e isso é uma diferença que a gente vai ver mais para frente sobretudo nas aulas De regressão mais legal ponto aqui tá então essas são as variáveis qualitativas os tipos tá e aí da mesma forma a gente tem também as quantitativas né os tipos de variável
quantitativa a saber então a gente tem aqui as corrente nativos né ao saber a gente vai ter as variáveis contínuas e lembra que a variável quantitativa na régua né e você pode ficar dentro dessa faixa nessa régua a régua nas variáveis contínuas ela infinita contém todos os Níveis possíveis tá e você tem uma outra que é chamado variável discreta e onde você tem a régua mas essa régua na verdade ela tem marcas é na realidade assim quando você vai coletar deixa eu te dar um exemplo imagine uma árvore o cenário aqui você vai ver que
o desenho alda tem uma árvore imagina que essa árvore tem 10 m de altura hoje tá hoje ela tem 10 m de altura e essa árvore para crescer nós chegamos 10 Metros ela cresceu não tamanho bem pequenininho foi chegou até os 10 metros tá algum dia na vida dessa árvore ela teve três metros sim né pra chegar no 10 ela passou pelo três tá algum dia nessa árvore ela teve pe metros e o que que é pi 3,14 15 por aí vai né é esse na verdade o pi é um número irracional ele não tem
um fim né ou seja no na natureza opist essa quantidade infinitesimal ela existe a árvore passou por pe no momento infinitesimal do tempo Para chegar na altura que ela tem hoje o problema é que eu não consigo fazer uma régua para detectar pe tá então o pi na quantidade pela existe na natureza tanto é que a régua árvore passou por esse a quantidade só que eu não consigo medir tá então a grande questão longe aqui a grande questão assim a gente vai ver que você pode fazer concessões então tudo na realidade quando a gente mede
a gente perde um pouco a gente tem uma perda de informação né quando você mede coisa Assim sempre perde um pouquinho na realidade não nada que a gente média continuo de verdade infinitesimalmente tudo é discreto tudo tem um grau de incerteza olá tudo então todas as variáveis que a gente coleta são discretas mas no nível de elaboração matemática sob certas condições você pode considerar variáveis discretas como contínuas converge tá para uma questão de continuidade tá é mais às vezes não às vezes eu tenho que Trabalhar variável como discreta mesmo tá então um exemplo de variáveis
discretas são escala ficat só aquelas escalas que vocês vão questionário né que você coloca uma barra de 1 a 5 por exemplo tenho dois três e quatro e a pessoa marca né isso é um exemplo de olhava bicicleta pessoa não pode marcar no meio não é lá no marca dois e três e meio ou ela marcou três ou ela marcou quatro tá então tem por isso que é chamado discreto porque é uma é uma Variável quantitativa mas ela tem diz de forma discreta certas quantidades fixas tá quando o número de categorias aumenta muito né eu
coloco um vírgula um vírgula dois tipo quanto a grade aumenta aí e tantos graus que não compensa considerar como discreta eu posso considerar como continuar tá então isso é só uma coisa inicial pra você pensar na hora de fazer análises estatísticas dependendo do caso pode considerar do mesmo tipo continua ou discreta mas você Vai ver que nas próximas aulas eu vou usar de um jeito bem livre a ideia de continuar vou generalizar tudo para continuar categórico tá mas em alguns casos por isso que eu tô deixando esse rigor maior agora é inicialmente no curso vou
ficar falando de variável contínua e categórica não é para ficar mais fácil mas em alguns testes para algumas condições a gente vai entrar nessa especificidade pelo que eu tô apresentando agora tá mas inicialmente Você pode dividir assoalhadas em continuar cê categóricas tá por um critério didático para você ir acostumando tá bom esses são os tipos de variável né e agora a gente entra numa discussão bem interessante a gente viu foi crescendo né você viu que agora com base nessa conversa já a gente está estruturando o melhor jeito de pensar as coisas hoje vamos falar sobre
medidas descritivas né então como que você Descreve as variáveis agora então eu já sei eu já entendi o fenômeno que eu quero estudar já entendi que esse fenômeno é com composto de variáveis e aí as variáveis tem lá validade e precisão né aí eu tenho que ficar estudando pensar sobre isso aí soltando que eu escolhi as as medidas mais válidas e precisas que eu conseguir encontrar conseguir encontrar né aí eu tenho que pensar que quer variável e fator nessa comecei a pensar nisso é Agora que eu já tenho já sei as minhas réguas já sei
as variáveis já sei o que é variáveis fator e já sei o que é variável e fator continuou que a variável fator categórico né agora eu qual é a próxima fase não é para sair daqui do tipo de variável para o teste estatístico tem mais um a gente já resolveu uma parte daqui né então é ok em parte mas aí falta uma coisa né então já que eu decidi agora tentar as variáveis essas são contínuas O histórico nominais ordinais enfim tem lá fiz toda a minha classificação né agora tem que entender um pouco das medidas
descritivas as medidas descritivas né e o que são medidas descritivas para cada tipo de variável pelas variáveis categóricas escondidos né que é mais ou menos e elas são comparáveis né isso é a base do conhecimento de análise descritiva que você tem que ter para escolher o seu teste então o texto estático varia Conforme a teste estático varia dependendo do tipo de variável que você correta tá e por que que o teste estatístico varia dependendo do tipo de variável porque cada tipo de variável tem medidas descritivas diferentes que são as medidas que o teste vai usar
tá então aliás antes disso eu vou deixar uma dica é uma dica de uma dica para você pensar quando você for coletar dados né é a dica é assim um conselho quase tá a dica Na dúvida se você tem dúvida em como coletar uma certa variável na dúvida colete tudo o que puder o que puder de forma contínua a se informa com tina o ou quantitativa é porque né então é pega por exemplo o imc né que é o peso dividido pela altura ao quadrado né aqui o imc é uma quantidade ele não vai lavar
cortina no valor pode dar 27/26 ponto 9 enfim tá Dou e mc continue eu posso categorizar em eutróficos sobrepesos eu vejo tá só que eu contrário eu não consigo fazer então se eu coletar um conjunto de pessoas os dados do conjunto de pessoas e classificar elas em eutróficos sobrepesos e obeso depois eu não consigo voltar para o valor individual a menos que começa de novo tá seu coletar a variável ele seu peso e altura mesmo eu consigo fazer a conta guardar a quantidade e se eu quiser eu consigo Categorizar tá então a grande uma dica
inicial útil na quando você tá desenhando estudo é assim tudo que você puder coletar continua colete porque você pode categorizar mas o contrário você não consegue tem certas coisas que são naturalmente categóricas aí tudo bem não precisa coletar continuar tá mais o quê e continuando facilita bastante tá então encerrada essa parte né vamos as medidas descritivas e vou começar a descrer Falando né das medidas descritivas outra paga essa parte toda já vou falar das medidas descritivas para variáveis contínuas primeiro tá é para as quantitativas e ele explicar todas as medidas descritivas para variáveis contínuas depois
de atibaia para as categorias tá então vamos falar sobre medidas descritivas as medidas descritivas o iniciais o motor o nome né mais formal a chama do medidas resumo As medidas resumo vamos começar a primeira com as medidas descritivas para variáveis contínuas e o constitutivos ah tá beleza a primeira assim o que a gente vai ver de medidas agora né a primeira grande medida descritiva é a média em média vai comprar minha gente vai ver a variância é com base na variação interajo desvio padrão é a gente vai ver o erro padrão Oi e o coeficiente
de variação não tivesse assim com medidas são os principais tá bom e ea mediana verdade que vive a mediana mediana vontade com um pouquinho depois tá a mediana é a única medida de resumo que existe tanto procurava continuou quando categórica tá vale produção do qualy conta corrente você pode usar a mediana em certas situações tá a mediana vale nos dois essas outras não as outras são específicas de variáveis contínuas tá Então o que que é uma medida resumo por exemplo imagina que eu fui numa turma né de alunos e coletei a altura de todos eles
eu tinha lá 40 anos alunos eu medi a altura de todos eles bonitinho tá eu fiz uma lista dessas alturas aí eu fui conversar com uma pessoa a pessoa perguntou você mediu a altura das pessoas da sala foi medir quanto o que que deu né aí eu começo a ler a lista então é o primeiro tem uns 70 segundo tempo e 68 o segundo tempo De 80 quando eu chegar na quinta pessoa ela esqueceu a primeira não é é ou seja apesar de ter coletado os dados isso não me dá nenhuma informação eu tenho os
dados mas não tenho informação além da definição anterior né como que eu consigo transformar isso de forma inteligível se eu tenho que abrir abrir mão de um pouco da precisão em nome da didática as medidas vão ajudar nisso então se eu chegar para que me perguntar falar eu medi a média das pessoas aqui e A média da altura das pessoas é um e setenta né então não é como é um e setenta eu acho que você pode ter uma ideia se a média das pessoas é mais ou menos a pessoa as pessoas são em torno
de uns 70 em média né será que elas são altas são baixas e aí você consegue qualificar alguma coisa tirar alguma conclusão tá então as medidas resumo são fundamentais muita gente tenta fica fazendo um monte de análise estatística elaborado então sendo que na verdade Elas não entendem essa base essa base é fundamental para você ter solidez é se você entender bem e dessas dessas medidas descritivas você vai conseguir chegar muito mais longe tá porque toda essa medida é esse esse essa base nessa estrutura que eu tô que eu vou começar a falar agora a partir
das medidas descritivas mas já comecei a partir do começo da aula todas estrutura de pensamento científico ela não fica diferente ela é uma base epistemológica Que você vai colocando elementos em cima tá você vai colocar um cada vez mais elementos em cima e vai virando um prédio o problema é que tem muita gente que aprende teste estatístico de cara aprender a operar o programa e não conhece essa base e daí a estrutura né os alicerces ficou muito frágeis então às vezes a pessoa faz uma análise muito elaborada mas você pergunta uma coisa de base a
pessoa não sabe explicar ou ela não sabe interpretar os resultados dela Adequadamente tá então é peço peço bastante atenção nessa parte inicial porque algo que vai ter um play-off muito bom logo mais nas próximas aos tá então é feito esse disclaimer the kleiner inicial e vamos começar tá então variáveis contínuas vamos pegar um exemplo de olhava continuar variável peso é peso uma variável continua eu vou pegar só três elementos para ficar fácil de fazer a conta então imagina que eu tenho três Objetos ou três pessoas três organismos medi-la o peso de cada um o peso
está em quilos né de 32 e um tá mediu o peso das pessoas é tudo bem então eu tenho peso a primeira medida descritiva que eu quero fazer a média né então quê que é a média aritmética né mas diante médica não tá mais é do que a soma das observações dividido pelo número delas número de observações estão em geral as pessoas conhecem né vou pegar 3 + 2 + 1 as observações / número delas que 33 mais 25 mais 16 por 3 a 2 quilos a conta todo mundo sabe fazer mas o que quer
dizer isso é o que quer dizer a média né a média tenho sentido né de ser um é mais próprio da média valor esperado o valor esperado tá esse nome bem importante assim valor esperado ou esperança né isso aqui é uma estimativa do valor esperado na verdade que é uma estimativa para essa mostra tá para essa mostra a média de uma coisa não é sempre dois quilos obviamente a média de uma Coisa uma variável aleatória mas nem essa mostra com três elementos uma estimativa do valor esperado é 2kg nome mais popular seria um palpite os
palpites tá é então por exemplo o seu eu eu digo para você que eu tenho três elementos né eu digo para você que eu tenho uma amostra de elementos tá e eu não digo eu não te mostro os elementos e eu não digo qual é o valor de cada um mas eu digo que a média deles é 2kg tá então eu tenho um elemento de uma caixa Eu não te falo nem a quantidade nem o o peso de cada um mas eu te digo que a média do peso é 2kg tá aí eu digo para
você olha o senhor tirei um desses elementos mas não tô te mostrando e aí eu pesei ele e eu pergunto para você qual é o seu palpite sobre o peso desse objeto né se você não tem nenhuma informação além da média é o melhor palpite que você tem para o valor esperado você vai chutar porque dois quilos pode ser que você r mais é um Palpite é melhor que chutar qualquer coisa tá então a média como variável de também chamado de medidas de centralidade né é uma me liga e descentralidade não ela te dá uma
ideia de um palpite inicial aonde os dados podem estar em média tá ele é um palpite é é algo muito útil então aqui então imagina a situação eu tenho um saco de objetos tá você não tá vendo os objetos você não sabe quantos são e eu e Eu falo tem um saco de objeto sorteio um e quero que você deu um palpite sobre quanto é o peso dele não se lembra que nos programas de rádio que tinha no passado que eles tinham um saco que eles colocavam você tinha que ligar para o rádio para falar
qualquer o peso do saco e quem chegasse quem chegasse mais perto do peso real ganhava um prêmio né a pessoa o locutor do rádio ele nunca falava assim ah aqui um peso do tem um saco aqui e o saco eu quero que seja Útil piso ele sempre dava no intervalo ele dava um palpite né tá entre 2 e 3 kg e as pessoas que estavam ali no meio né óbvio porque senão tu quiser qualquer quilo porta porta 20 tonelada é isso não sabe tá então a média é algo muito útil para te dar um palpite
nesse áudio como um cheiro mais ou menos um de onde os dados estão tá é algo muito útil porque reduziu em certeza então a média é uma medida de centralidade e ela reduzem certeza E pode ser que ela não reduza muito mas pelo menos ela reduz um pouquinho tá ela tira de algo completamente aleatória e traz por uma estimativa um pouco mais real tá bom mas tudo bem então assim tem várias aplicações dá para ver né que a média eu disse para sempre se eu disser que a média do salário do brasileiro é r$1000 né
tudo bem que você pode fazer uma crítica mas isso é muito pouco tem outras questões mas pelo menos você saiu de um número qualquer para mim o reais Já reduziu sua incerteza um pouco tá lembrando qual é o objetivo do método científico reduzirem certeza então eu saber a média das coisas já reduzem certeza pode ser que não reduza tanto quanto eu gostaria mas já reduz tá é sabe o que eu vi dos dados que eu já tenho a média a média de fato é muito pouco então por exemplo imagine na sua cabeça eu tenho um
conjunto de 30 pessoas tá cuja média dessas pessoas é um e setenta O imagina na sua cabeça tá tem 30 pessoas que o média umas 70 que que vai imaginar você tem que é a média tem umas pessoas um pouquinho mais altas nas pessoas um pouquinho mais baixas né porque a média sempre tá no meio então é normalmente as intuitivamente as pessoas imagina uma distribuição normal uma distribuição mais ou menos pela não simétrica tem lá uns 70 não vai ter as pessoas um pouquinho mais altas umas um pouquinho mais baixo sai dali no meio só
Que tem outros outras situações em que eu tenho eu posso ter por exemplo imagina que na verdade uma coisa a imaginação na sua cabeça para coisa que acontece imagine que na verdade eu tenho um conjunto de anões e um conjunto de jogadores de basquete tá a média pode dar no meio também já também pode dar um e setenta tá quando eu tenho distribuições que não são é simétrica também modais tem várias carácter várias outros tipos de distribuição pode dar a Mesma média ou seja a média reduzir incertezas são lado positivo mas o lado negativo é
que eu não tenho informação eu não tenho palpite hoje é sobre não quero palpite sobre a distribuição dos dados e a distribuição da variável né eu não sei muito bem como ela é né não sei se é normal se é normal se é simétrico não sei então a média muito pouco ela ela reduzir certeza é melhor que nada mas ela ainda é muito pouco então baseada na Média surgiram outras medidas descritivas não que não são focados na centralidade são focadas na dispersão então a média uma medida de centralidade tá então já sei onde tá o
meio entre aspas tá já sei mais ou menos onde estão meio um cheiro do palpite né mas eu tenho que saber o quanto eu tô errando também né eu tenho que saber quanto eu tô olhando e daí surge a gente já viu a média sujeito a variância como que surja a variante então a pensa comigo eu tenho Eu tenho a variável aqui e eu tenho a mente né eu sei que a média é dois quilos tá tenho aqui eu vou criar uma coisa chamado desvio e não advil patrão só desvio o desvio ele é o
valor individual - somente tá o valor igual ou menos a média só isso então eu pego os meus valores individuais 321 - a média que é dois quilos tá bom distrai a média de todo mundo bom então 3 - 2012 - 2011 - 2 - 1 isso Aqui é o desafio o bom é tudo bem então o que que você quer dizer né eu tenho aqui uma certa média sempre por ela se a média alguns valores não tá assim e outros valores não tá abaixo né quando eu subi traio cada valor da média eu tomei
o que calculando uma distância e esse desvio ela é uma medida de distância ah tá ele é uma distância então a distância entre a média e cada valor que Eu tô olhando é uma distância na quantidade tá é uma distância é o que que serve isso né então disse que ia uma distância pensa comigo gente se eu tirar a média do desvio tá média do desvio que que a média do desvio a média do desvio é o quanto os dados se distanciam da média em média então a o desvio né se eu tirar média do
desvio é uma quantidade do quantos dados se distanciam da média em média é uma medida de dispersão né então na verdade seu calcular eu Calculei desvio que a distância entre cada elemento e a a média né que é isso aqui seu calcular que a média do desvio a média do desvio né que que eu vou ter aqui 10 e menos uns só calcular média do desvio eu vou saber o quanto os dados se distanciam da média em média faz sentido é uma medida de dispersão só tem um problema antes que assim como que você calcula
média a gente haviam anteriormente que é isso aqui né calcular média a soma das observações Que o número delas fazer observações agora são os desvios se eu somar um menos um porta eram vai cancelar os desvios mas eu não quero cancelar né eu quero tratar os desvios lembrando que os desvios são distantes bom né distância mesmo se você pensando distância não tem que ter essa negativa né o que tem o negativo não vem em relação ao tamanho vem relação sentido então o que se eu tenho a média aqui o que está acima da média positivo
que Está abaixo da média e negativo mas eu não quero codificar o sinal eu quero quantificar o tamanho em módulo né eu quero continuar esse tamanho módulo tá então tira o módulo né então a gente falar tira o módulo é tão existe uma coisa que chama a variância variância modal algo assim variância modular né mas não é muito bom tá uma outra estratégia eu vou mostrar porque isso do módulo uma outra estratégia que você pode fazer para e omitir o efeito do Sinal ele vai o desvio ao quadrado lembra que todo número ao quadrado da
positivo né ele fez dele mesmo né menos comida mais né daí fica positivo então por eu calcular antes de calcular a média dos desvios de verdade eu tenho calcular a média dos desvios ao e aí e a média dos desvios ao quadrado e o objetivo do quadrado é tirar é o efeito do sinal o resultado final negativo positivo tá Então eu vou pegar cada um deles a média do desvio quadrado vou pegar cada um desses caras e levar o quadrado toda 10 e 11 né só que eu desvio ao quadrado e aqui então aqui vai
ficar mais um e aqui também mais ruim tá aí eu tiro a média tá bom chegamos finalmente no nosso grande amigo na nossa grande amiga variância né então se eu pegar um mais zero mais um né se eu pegar e dividir por três que eu tenho três elementos da dois terços né dois terços da zero 66 Quilos ah tá bom então qual seria a fórmula da variância e a variância ela é a somatória dos desvios somatória dos desvios ao quadrado dividido pelo número de observações tá bom você tem a ideia de variância populacional e variância
amostral que aí ele menos um tá bom eu vou entrar nessa discussão um pouquinho um pouquinho depois mas entendi geralmente forma geral como que funciona A variância tá quando você tem dados amostrais com a mostro só não não coleta a população toda é a somatória dos desvios a somatória dos desvios ao quadrado dividido pelo número de observações - 1 tá quando você tem amostras populacionais na verdade a colheita na população toda todos os elementos do espaço amostral é a somatória dos desvios ao quadrado sobre n tá é a explicação estatística né que não faz Muito
sentido para quem não é da área é que a quando você sai da população e vai para amostras o estimador da variância ele passa a ser visado e você dá esse menos um para compensar tá então mas na prática isso não não faz tanta diferença porque assim se você tiver 100 pessoas aqui você dividir por 100 e aqui por 99 então na prática a diferença fica bem pequena tá mas matematicamente importante considerar que a variância a variância é um estimador várias usado Na mitologia usado e para análise de amostras e bom dia monstros então quando
você sair da população e vai para a mostra aí você tem esse viesse tá então caso você esteja resolvendo um exercício alguma coisa assim e no exercício diz que é um dado populacional aí você pode usar essa fórmula de baixo caso diga que é só na amostra né ou não diga nada não se não disser nada você considera uma uma amostra aí você usa isto o ele menos um Tá bom mas o importante não é importante para além dessa que essa estatística aqui essa é a fórmula padrão essa forma base assim a lógica da variância
e não quero desviar muito disso que a lógica da variância ela é a média dos desvios ao quadrado tá então uma uma forma matemática de descrever a valência ela é a média dos desvios ao quadrado a média dos desvios ao quadrado tá isso a variância mas um outro forma mais popular mais simples de escrever aqui Variância é o quanto e por quanto os dados quantos dados se distanciam se distanciam da média e em média e quantos dados se distanciam da média em média isso é variância tá bom então a variância quantos gatos se distanciam da
média em média vamos vamos fazer um exemplo aqui para você visualizar e se eu tiver algo assim ó imagina que eu tenho dois grupos a e b os dois Grupos e a mesma média oi aqui é média 10 aqui é meio 10 aí vou pegar variância a variação desse grupo é cinco e desse grupo é dois tá e eu digo para você que a distribuição desse cara aqui é assim a pergunta é como o que seria distribuição do grupo a ser distribuição no grupo b assim como que seria a distribuição do grupo a então os
dois têm a mesma média tá então a média uma estimativa pontual no ponto dos dois têm a mesma média 10 só que o a Variância de ficaram os dados que estão em média dois pontos para mais ou para menos de 10 isso a medida de variabilidade quantos palha em torno da média você aqui dizia dois pontos quanto que seria aqui né como a variância maior quer dizer que os dados se espalham mais seus dados se espalham mais o que acontece o dado fica mais espalhado e ele abaixa né então a distribuição desse caso seria algo
assim ó o que é mais aumentado né as bordas Ficam mais gordinhas maiores as pessoas são mais espalhadas tá só uma representação quanto maior a variância maior a variabilidade em torno da média menos a média representa a verdade né menos a média é o valor esperado mais fidedigno essa ideia quanto maior a variância menos esperada é o valor da média quanto menor a variância mais concentrada em torno da média mais a média mostra aquilo que faz sentido tá tudo bem então espero que tenha ficado Claro essa questão né que agora eu tenho dois estimadores um
de ponto central e um de variabilidade tá eu resolvi um uma série de problemas mas eu queria um outro que eu não resolvi direito que é o seguinte que agora a gente vai a gente já falou da média variância é a variante ela resolveu é a média dos desvios ao quadrado mas tem problema como por quê porque ela é o quadrado então quando eu tenho por exemplo a média a média na minha pergunta no meu exemplo aqui em Quilos a ânsia e a variância ela tá em quilos ao quadrado por que que ela tem que
usar quadrado porque eu levei todo mundo ao quadrado aqui né eu levei todo mundo ao quadrado então a média ficou em que usar o quadrado as duas não tem a mesma unidade então que eu vou comprar média em quilos com a variante ao quadrado eu tenho fica complicado né para isso surgiu uma outra no outro estimador né Que tem a mesma definição da variância tão mesma definição é exatamente a mesma definição além da aparência é né lembrando qual é a definição da variância o quanto os dados se distanciam da média em média isso quer dizer
a mesma coisa tá é só que na mesma unidade da média que é quem o desvio padrão então agora chegamos aqui né não desvio padrão o desvio padrão serve para mesma coisa da variância tá mesma coisa Desvio padrão é só que eu desvio padrão ele ele tem a mesma utilidade da variância tá só que ele é na mesma unidade então se avaria total quadrado né como que eu faço para voltar na mesma unidade da média para tirar a raiz quadrada então quê que é o desvio-padrão nada mais é do que a raiz quadrada da variância
tá então você pegar esse 0/66 aqui né se a variância 0/66 há 66 e eu tirar a raiz quadrada de 0/66 eu voltei ao desvio-padrão tá então o Que que o que que desvio padrão média quantos dados de estacionamento em média só que eles medem ele também tem a mesma unidade da média então é por isso que todo relatório artigo que você lê ele sempre vai estar os dados apresentados em média e desvio-padrão não vai tá média e variância por que mede a audiência eu tenho unidades de medidas diferentes agora média desvio-padrão não tá os
dois estão em quilos e aí você vai conseguir comparar coisas e isso traz Uma sacada genial porque agora que eu tenho uma medida de centralidade né mas uma medida de variabilidade isso é uma arma fenomenal com base em mais uma descoberta né que matemática que a gente vai ver um conceito matemático super útil a gente vai conseguir criar uma coisa sensacional para possibilitar a comparação de grupos que a chamada a confiança tá no intervalo de confiança os primeiros não é mais simples eles nascem a partir da relação entre uma Medida de centralidade uma medida de
variabilidade então a média é um palpite a média não é uma certeza então se eu chupo a média eu reduzo mim certeza só que eu não sei o quanto eu tô errando por isso que eu tenho que associar a média a uma medida de variabilidade a partir do momento que eu tenho uma média e uma medida do quanto os dados se distanciam da média em média eu posso criar um intervalo de palpite então quando eu junto média e desvio-padrão Isso pode me gerar ao invés de um ponto de palpite que a média não é o
quanto que eu chutaria o peso em média 2 kg vou chutar 2kg eu erro muito né porque a coisa que eu tô medindo tem que ter exatamente 2 quilos pro acertar mas eu transformar esse dois quilos no intervalo né então você é reduz a precisão mas aumenta a taxa de acerto isso pode ser muito importante para fazer descrições ou previsões de fenômenos então quando você junto Oi e o desvio padrão você pode criar um invés de um ponto de palpite que seria a média eu posso criar um intervalo é né para o meu palpite para
o meu palpite que aí vai vai entrar na ideia de intervalos de confiança tá que é um tópico sensacional muito útil muito importante tá bom e vamos entrar não vamos nos furtar dele tá é antes disso aí eu tenho que explicar o que que é o o erro padrão e eu já vou explicar por que para você chegar na no intervalo de Confiança uma coisa aqui entra é o erro padrão então já vou explicar mas eu vou fazer um parente aqui para explicar o crescente de variação tá coeficiente de variação ele é bem útil ele
tem utilidade bem legal e assim o coeficiente de variação ele é uma coisa útil para comparar variabilidades tá entre grupos ou medidas ou qualquer coisa que você tenha então coeficiente de variação e não consciente de variação a principal Utilidade dele ele também uma medida descritiva né mas ele é útil e para medir e comparar e variabilidades a história virgindade tá como que você mede coeficiente de variação ele apresentado em porcentagem geral você vai pegar o desvio padrão o tipo de pelo médio já foi pegar o valor que então por exemplo calculei a média né a
média aqui na minha moto no meu exemplo 2 quilos e O desvio padrão é a raiz de zero 66 né que a variância 0/66 a raiz quadrada disso se eu pegar a raiz de zero 66 dividir por dois e vou ter uma medida de erro padrão tá de de coeficiente de variação de multiplique o resultado por 100 que ele vai me dar um valor em porcentagem então por exemplo se eu tiver dois conjuntos de dados a e b e cada conjunto tem lá uma média na média de ar e o desvio padrão de ar ó
e aqui tem a média de bebê e o desvio Padrão de bebê então por exemplo não exemplo que eu fiz anteriormente aqui para você comprar as distribuições né que uma é mais pontudo e outra mais aberta né eu coloquei a mesma média então o grupo aí o grupo bertin em média 10 só que eu não tinha o desvio padrão de 2 e outro de 5 né quando quando as médias são iguais aí você pode comprar os desvios padrão ou as variâncias tá agora quando as médias são diferentes então imagina por exemplo que esse a Média
de 10 a média dbr8 tá e o desvio padrão aqui da dois e o desvio padrão aqui da quatro tá eu quero saber qual deles varia mais qual qual dos grupos têm maior variabilidade olhando os desvios padrão diferentes as médias diferentes não dá para saber visualmente mas eu posso calcular o coeficiente de variação né coeficiente de variação aqui em casa vai ser o aumento de ar dessa daqui a dois né então dá dois sobre 10 na desvio padrão Dividido pela média e aqui do desvio-padrão dividido pelo aumento da quatro sobre quatro sobre oito então aqui
dá um quinto né é um quinto da 02 da vinte por cento se multiplicar por 100 né um quinto da vinte por cento então aqui da 20 por centro e aqui da quatro oitavos dá um metade meio que dá 50 por centro bom então eu consigo ver que esse grupo né cinquenta por cento varia mais do que se tá consigo ver que o grupo b variar Mais do que lá eu posso até comprar em vezes eu posso dividir 50 por 20 né então grupo levaria mais de duas vezes duas vezes mais do que duas vezes
pouco a mais do que lá tá então que eu senti de variação é uma medida descritiva que pode ser muito útil e é uma relação entre a média desvio-padrão tá então eu coloco isso aqui como um dado a mais porque pode ser muito útil tá eu vou avançar a nossa discussão até esgotar as medidas descritivas trabalhava continua Então já falei do crescente de variação falta só o erro padrão a mediana vou deixar por último porque a mediana também ajuda a gente entender as variáveis categóricas tá e aí vai ser o ponto para as variáveis categóricas
tá bom então vou continuar avançando então agora vamos entrar a gente vai chegar até o intervalo de confiança tá e aí agora a gente vai chegar na lógica do erro padrão tá muito bem então a gente alta percorremos um caminho super legal Super interessante e é e vamos agora continuar com essa discussão né eu creio que eu consegui construindo com vocês devagar né a ideia das variáveis contínuas das variáveis categóricas e tudo mais da da importância do é a importância de você que sempre tem medidas de centralidade e medidas de dispersão para comparar os dados
né e agora vocês venham que você já tem algumas medidas descritivas então a Média ea variância desvio padrão coeficiente de variação né que pode ser muito útil então coeficiente de variação tem uma importância muito grande porque se você descobrir que um grupo varia mais do que o outro você avalia fidedignidade da média né se o grupo tem um coeficiente de variação muito pequeno quer dizer que os dados são muito perto da média sem outro grupo tem um coeficiente de variação muito grande quer dizer que os dados são muito Distantes da média a média é a
mais o intervalo o torno da média mundial maior parte dos dados se concentra é maior tá então guarde isso com você tá é algo bem importante então agora a gente vai seguir um pouco mais para entrar no conceito de intervalo de confiança tá é e a gente vai entrar no conceito de intervalo de confiança aqui bom então primeiro vou mostrar a conta tá vou mostrar a ideia do intervalo de confiança depois a gente vai avançar um Pouco mais tá gente vai eu vou dar a definições mais acurados mas sobre o que importa primeiro a conta
tá no intervalo de confiança vamos começar a primeira pelas variáveis contínuas tava explicar tudo trabalhava continua então vamo falar do intervalo de confiança para variáveis isso continuamos e aqui e vamos falar em geral do intervalo de confiança como é que ele funciona é um intervalo em torno da média no caso né Tô mais uma definição geral é um intervalo o entorno é de um parâmetro o parâmetro na verdade você pode calcular intervalo de confiança para qualquer coisa de voto de confiança para média para mediana para moda para desvio padrão para qualquer coisa para que ele
sente variação para qualquer coisa a fórmula mudou um pouco mas os intervalos de confiança que a gente vai botar aqui Que eu vou mostrar aqui que são os mais úteis e intervalo de confiança para média né porque a média é um toque de central eu quero saber o quanto de erro tem torno e para proporções tá intervalo de confiança para média intervalo de confiança para proporções tá bom então no caso aqui mas pode ser qualquer parâmetro está intervalo de em torno de um parâmetro como por exemplo a média quem é a onde eu tenho E
aí é uma certa medida é de reprodutibilidade a reprodutibilidade um dos possíveis os valores quando eu tenho uma certa medida de reprodutibilidade dos possíveis valores encontrados o encontrados das e nas estimativas e nós estimativas deste parâmetro bom então em trabalhos que eu penso Intervalo em torno de um parâmetro onde eu tenho uma certa medida de reprodutibilidade dos possíveis valores encontrados das estimativas deste parâmetro é e com certo nível de confiança e com certo nível é de confiança a definição inicial ela parece muito árida não ela parece muito vaga eu concordo mas eu vou dar alguns
exemplos para reduzir isso tá a ideia dos intervalos de confiança surgiu a Partir de uma propriedade de estatística que é uma lei é quase que a lei da gravidade da estatística é uma coisa que é muito prevalente acontece na natureza é uma lei natural só pra você acontece tá do mesmo jeito que a gravidade acontece você tem uma explicação que descreve a lei da gravidade muita lá acontece a estatística tem muito pouca doença e uma delas é essa tá que é o teorema é graças a ela a gente tem os intervalos De confiança coisa e
encaixa que o teorema central do limite e no limite é uma coisa que vem do começo do século 20 né e é basicamente o que possibilitou a área de inferência estatística área de teste de hipótese tá então o começo do século 20 foi bem interessante nesse sentido porque você teve avanços na matemática a matemática já tava bem avançado mas eu já te vi o anúncio da estatística que possibilitaram um avanço da tecnologia Né menos a educação porque a gente não fez estatística no ensino fundamental e médio direito na verdade não ver praticamente em probabilidade probabilidade
é uma parte da estatística mas não é aplicação então temos diretamente mas o teorema central do limite o que possibilita você amarrar toda a área de inferência estatística e tal então é um problema super importante que eu vou explicar primeiro por um esquema depois eu vou mostrar um site Que tá para vocês visualizarem melhor mas primeiro vou começar com um exemplo como que funciona o teorema central do limite tá lembrando que isso vale tanto para falar para continuar quanto para para categórico mas eu vou é para continuar que dá certo tá a mesma coisa se
aplicar qualquer tipo de variável tá inclusive as categóricas então teorema central do limite ele é assim imagina que tem uma população tá vamos dar um exemplo imagina que a População de são paulo tá no brasil e essa população de são paulo eu quero medir a altura das pessoas e eu quero medir a altura das pessoas de são paulo tá é a primeira pergunta que eu faço para vocês é a altura das pessoas de são paulo existe parece uma pergunta meio de maluco mas ela faz sentido tá altura das pessoas de são paulo existe né e
é bom dado que a população dado que são paulo tem pessoas cada pessoa tem Uma altura e é possível medir a altura de uma pessoa né usando um método lá matreiro uma régua então não faz sentido pensar que isso se for possível medir a altura de todas as pessoas de são paulo o valor médio das alturas se eu tiver todos os valores é fácil de calcular só somar o número de pessoas dividir pela população de são paulo então faz sentido achar que o que a média da altura existe tá agora imagine que você conseguiu ganhar
você é um bilionário você Conseguiu ganhar meu dinheiro e você tem como ir na casa de cada pessoa se a pessoa não tiver em casa você vai no trabalho você vai onde for você tem como conseguir coletar todas as pessoas de são paulo num certo momento sem erro você vai conectar todas as 20 milhões de pessoas em são paulo 17 milhões de pessoas em são paulo e qual é a altura de todo mundo tá coloca no excel com 17 milhões de uma coluna só 17 milhões de linha jeans e calcula a média É realmente dá
um e setenta tá a média de tudo dá exatamente 70 é isso que você descobriu a média das alturas das pessoas de são paulo aí eu venho com uma pergunta para você esse dado é útil e qual é a utilidade será que valeu a pena esse esforço colossal para coletar a média da altura de são paulo de todas as pessoas tá é somente não é muito útil porque porque quando você for dormir depois de ter trabalhado tanto e eu acordar no dia seguinte vai ter morrido Gente vai ter nascido gente né ou seja essa média
já não vai ser mais a média de são paulo porque ela muda todo o tempo isso é uma coisa fundamental de ser entendida pelo cientista tá os valores médios eles são compreendidos na verdade melhor quando você entende ele como uma oscilação então se você observar e ao longo do tempo né e aqui é a média da altura do são paulo a média de altura de são paulo nunca é a mesma ela varia Porque nasci gente morre gente vai variando tem gente que preguiça cresce um pouco na então a média de altura de são paulo como
você pega na longo dos dias né ao longo dos dias ela sempre tá variando e aí ela tá sempre meio variando sim então só que o que você quer saber e o que você quer é meio que uma tendência geral dos dados você quer descobrir essa média das médias né que seria uma média das médios E para conseguir isso você tem que coletar o mesmo dado muitas vezes tá aí fica impraticável fiquei possível você já não compensa se eu conseguir coletar uma vez tá você conseguir coletar uma vez essa média um durante o momento né
e calcular o intervalo de confiança em torno dessa média baseado na na variância porque se eu tiver a média de todo mundo eu consigo calcular a média e aí eu pego cada valor menos a média não vai me dar o desvio calcular média dos Desvios né se você conseguir calcular tudo isso aqui né você vai conseguir fazer um intervalo acima e abaixo da média onde você vai ter um intervalo um de praticamente todos os valores de média que apareceram e que vão aparecer estão contidos né porque a média da altura da população ela é oscila
mas a mochila dentro de um intervalo que você quer descobrir essa intervalo né se você é muito mais importante do que isso é muito mais importante saber ao invés da Média da população de são paulo não sei é muito ruim 70 é você descobrir que o intervalo de confiança em torno de uma média umas 70 varia entre 16191 por exemplo você descobri que tem lá noventa e cinco porcento das pessoas de são paulo são dentro desse intervalo né isso te ajuda muito né mas isso não aí surgiu outro problema mas isso acaba com o meu
problema principal porque pelo quer dizer que pelo menos uma vez eu tenho que coletar todas as pessoas de são Paulo uma vez para conseguir ter acesso a esse intervalo de confiança eu tenho de toda a população uma vez não é isso que os cientistas fazio eu senti descoberto uma amostra coleta poucas pessoas muito bem muito bem perguntado por isso que entra o teorema central do limite para para nos ajudar é uma forma de tentar mitigar e a busca por essa média inicial porque se eu tivesse a média inicial eu consigo calcular o intervalo tá então
é só um Motivador todo nesse exemplo como um motivador e eu quero que vocês comecem a pensar que na verdade todos os dados populacionais e econômicos biológicos enfim são os relações estão oscilando o tempo inteiro porque a população varia a população do fenômeno de interesse vale o tempo todo tá então o que que é o teorema central do limite eu tenho lá todas as pessoas que são paulo imagina uma população grande tá todas as pessoas de são paulo eu quero descobrir a altura Eu não sei quanto a altura média não sei não vou coletar todo
mundo muita gente tá é aí eu venho nessa população e eu sorteio eu tenho que fazer um sorteios é aleatório o sorteio aleatório que é um processo de soro de sorteio onde todos os indivíduos de são paulo têm a mesma chance de serem selecionados tá aí eu venho tiro aqui e eu sorteio imagina que o senhor tirei um conjunto de 20 pessoas tá peguei 20 pessoas sorteio em tenho que as 20 Pessoas aí eu medi a altura delas a altura das 20 pessoas entraram ter 20 valores e aí eu peguei cada um desses valores somei
todos eles e dividir pela por 20 que a soma de pessoas ou seja fiquei com a média é a média da amostra tá então sorteio 20 pessoas calculei as alturas de todas elas somem dividir por 20 tirei a média e guardei o valor da média não guardei o valor individual de cada pessoa agora tem a média tá aí eu pego essas 20 Pessoas devolvo da população e sorteio de novo outra mostra então eu volto né eu volto aqui em volta da população devolvo as pessoas você como a população tem milhões de pessoas é improvável sortear
mesma pessoa de novo sorteio aqui aí eu vou ter né um outro grupo de 20 pessoas nessa altura realizou exatamente o mesmo processo botei uma média 2 ah tá eu tenho 62 guardei as pessoas devolvo de novo devo as pessoas de novo Aí vem o sorteio mais uma amostra de 20 pessoas tá nessa altura nessas 20 alturas somos dividir por 20 e peço pega uma terceira média ah tá entendeu processo tá sorteio 20 pessoas nessa altura guardo a média de volta as pessoas e vou repetir o processo vou fazendo diferente sorteio imagina que eu repetir
este processo tá de média um dois três imagina que eu me disse processo por 30 vezes e por 30 vezes toma média 30 né começou Um dois três foi indo indo indo até a média 30 tá das 20 pessoas aqui então o que que eu coletei eu tenho 1 m total então de amostra total de 600 pessoas em grupos de em grupos de 20 e em trinta grupos de 20 tá então sorteio lá 600 pessoas em trinta grupos de 20 pessoas tá bom o que que me restou né foi sorteado as pessoas eu guardei só
a média então o que que eu vou ter eu vou ter 30 médias eu vou ter 30 valores então tem aqui a média um média dois até A média 30 né eu vou ter aqui os valores de média de cada uma das amostragens que eu fiz de cada uma das amostragens e o que que eu vou fazer eu vou colocar essas médias em ordem crescente e vou fazer a distribuição delas tá então cada uma dessas cada uma dessas barras aqui o que são valores dos experimentos que encontrei aqui a altura aqui os valores de altura
e cada uma dessas barras um experimento é o acúmulo né dos experimentos o que que eu tenho uma Central do limite disso o teorema central do limite diz o seguinte que quando eu faço essas amostragens pego na população sorteio 20 pessoas calcula a média guardou ela devolvo amostra sorteio mais 20 pego a média devolvo ela quando eu repito esse processo pelo menos 30 vezes pelo menos 30 vezes e eu pego os valores de média e ordeno né vejo os valores iguais vão se acumulando e o ordeno eles sempre sempre sempre sempre não importa como é
a distribuição Da população não importa sempre os dados vão dar uma distribuição normal e aqui ficou feio porque o desenvol mas sempre sempre sempre os dados vão dar uma distribuição normal tá e quando eu for pegar a média das médias lembra que se cada uma dessas é uma média média um média 2 cada uma dessas é uma média quando eu vou pegar a média das médias né a média geral é a média das médios né essa média das médias vai ser a média da população E vai ser esse valor aqui ó eu falei que eu
quero eu descobri a média da população chamada de mim é isso que eu quero descobrir tá então eu isso é um teorema matemático provado já assim sem mais de 100 anos que mostra isso então se eu fizer várias amostragens né e calcula a média de cada amostra separa os médios faço a distribuição das médias a distribuição sempre vai dar normal sem exceção não importa como a distribuição da população a distribuição das médias Das amostragens que eu fiz sempre vai dar normal e a média das medidas ea média da população então eu tenho uma tecnologia agora
para detectar qual é a médico para descobrir quanto é uma média de uma população sem pegar todas as pessoas né pegando amostras tá mais barata mais rápido e eu consigo descobrir em qualquer período oi melhorou nem vai te pegar toda a população uma vez melhorou agora consegui descobrir isso né mas tem Problema que assim quando você vai fazer uma pesquisa você não sai da mesma pesquisa 30 vezes certo tá é é em geral quando eu faço no mestrado doutorado só faço uma vez então por esse método pelo teorema central do limite eu teria que repetir
o meu mestrado 30 vezes meu doutorado 30 vezes para achar essa média das médias que será verdadeiramente muito caro é muito tempo eu não vou desistir né é vamos fazer um exercício gente eu coloquei 20 pessoas em cada Sorteio certo imagina que ao invés de 20 pessoas em cada sorteio eu vou completar 10 pessoas tá eu repito o mesmo processo só que aí o coletto 10 pessoas em cada sorteio que eu fiz eu vou coletando as pessoas aqui dez pessoas aqui das pessoas aqui vai indo até das pessoas aqui ah tá então ao invés de
600 pessoas vou pegar 300 pessoas né em grupinhos de 10 30 grupos de 10 tá quê que acontece né a partir de 20 pessoas né é a partir de 20 Pessoas repetindo a amostra 30 vezes o processo de amostragem 30 vezes eu já consigo uma distribuição normal com uma boa segurança tá uma distribuição normal das médias das amostras tá você coletar 10 pessoas talvez com 30 repetições 30 amostras eu ainda não consigo ficar normal ainda não consegue ficar simétrica ele aparece buraco tá talvez mas eu repetir a amostragem 30 vezes talvez não não de mas
eu repeti tipo 40 vezes aí vai ficar tá então se eu Diminuir o número de pessoas em cada amostragem o que vai é vai vai chegar na distribuição normal mas talvez eu preciso de mais medidas e talvez eu preciso demais coletas tá mais amostragens se eu diminuir então eu vejo que coletando 20 pessoas de cada vez eu coletando dez pessoas de cada vez eu chego também na distribuição normal das médias das amostras tá é só talvez só demore mais tempo eu preciso demais colegas se eu diminuir agora de 20 Pessoas e diminuir para dar esse
diminuindo a 5 pessoas cada amostragem da população e coloca cinco pessoas ó tá você foi coletando 5 pessoas talvez com 30 amostragens né aí eu vou ter 150 pessoas são né com cinco pessoas em cada amostra talvez com 30 repetições né 30 amostragens eu não chego em uma distribuição normal talvez precise mais 40 50 amostragens não é para chegar na distribuição normal mas eventualmente eu vou conseguir tá esse eu diminuir isso Para uma pessoa bom então imagina né pô aí é aqui onde eu quero chegar o estatístico quando ele olha para você né quando ele
olha para a unidade de análise que é o individo né para ele para o estatístico o indivíduo que a chamada unidade análise é uma amostra de tamanho um tá então quer dizer que se eu pegar uma pessoa fizer uma amostragem sortear uma pessoa né é se eu sortear 30 pessoas será que eu vou ter o suficiente para ter uma Distribuição normal esse é um número mágico que as pessoas ouvem por aí né não sei se você já ouviu é um número mágico a quantas pessoas o colégio para começar uma pesquisa umas 30 surgiu dessa lógica
mas tá errado tá porque na verdade começaria a fazer sentido né se essa mostra não fosse de uma pessoa fosse uma amostra de 20 pessoas pelo menos para dar certo com 30 repetições então a pessoa tá com cara a pessoa que tá te falando isso tá confundindo o em Geral da amostra com o número de repetições que você precisa ter para alcançar o tema central do limite que essa normalidade aqui tá fosse uma confusão na verdade o 3130 não vem do do tamanho da sua mostra vendo o número de repetições de amostragem que você tem
que fazer mínimo para alcançar o teorema central do limite dentro de cada amostra tem que ter um maior que um tá seu foi coletar uma pessoa em cada amostra da Entre aspas no final e vou ter 30 pessoas a 30 pessoas podem não ser geralmente não é suficiente para ter distribuição normal tá e essa média das médias aqui porque aí a cada cada média que eu vou ter na verdade eu dava de uma pessoa a média das médias não vai repetir a população tá porque eu só tenho 30 pessoas então a ideia eu vou comentar
mais que isso meu colega mais que 30 pessoas mas quanto quantas pessoas eu preciso aí que é o outro tá a Gente vai ter duas aulas de cálculo de amostra a gente vai ter uma aula de cálculo de amostra mais elaborada e daqui a pouco com base no intervalo de confiança dá para fazer uma fórmula de cálculo de amós quem está que a gente vai utilizar tá então essa fórmula de cálculo de amostra baseado no intervalo de confiança é mais simples mas ela já te ajuda a a resolver algumas coisas mas depois a gente vai
ter uma aula mais para o final do curso Que é exatamente de cálculo de amostra mesmo que é usado nos estudos hoje que aí e incorpore a outra outros conhecimentos também mas a gente vai construindo até lá tá mas espero que tenha ficado claro essa ideia geral do teorema central do limite que ela é muito importante eu quero mostrar como vocês também agora um site não é para deixar isso mais visual ainda tá eu vou deixar na descrição o site para vocês verem E ele chama sim tire tá vamos abrir aqui vendo teoria tá assim
ter a gente pode chover variância deixa entrar aqui nos capítulos e foi variância tem eu tenho muita coisa para você observar o teorema do limite central aqui tá teorema central do limite do limite central a mesma coisa então o que quer dizer isso é isso aqui essa isso aqui ó é a distribuição dos dados na população tá então imagina que aqui a população de são paulo eu posso com base nesse Alfabeto eu posso mudar a distribuição dos dados de são paulo mas na verdade nem preciso saber isso tá eu vou pegar uma forma suportar distribuição
da altura em são paulo é assim tá tem uma média tem pessoas mais altas mais baixas que isso mas eu não sei quanto é a média tá bom aí aqui ó eu tenho tamanho da amostra mas a mostra que vou coletar em cada amostragem daqui ó eu vou tirar amostras tá bom o imagina que eu vou pegar uma mostra de 15 pessoas cada vez eu vou sortear 15 e eu vou fazer um sorteio tá então o que que ele vai fazer ele vai sortear 15 pessoas dessa população hipotética tá junto a ela de calcular média
e vai me dar uma barrinha aqui tá então peguei 15 apliquei aqui ó me deu uma média tá vou apertar de novo ó pegou a 15 pessoas juntou me deltramed tá o teorema central do limite como eu só fiz duas amostragens não é pouco então vou fazer uma três fazer quatro cinco seis sete Oito nove dez vou começar apertar até chegar perto de 30 ó cada cada vez que você tá completando um processo amostral você tá vendo que tá acontecendo pelo terreno central do limite ó a média das médias tá começando aparecer no meio ó
tá vendo quanto mais pessoas for coletando a quanto mais amostragens eu fui fazendo né você vai vendo que se os dados estão começando a ficar mais simétrico só quanto mais a mostrar a gente eu vou coletando só que é uma Amostra de 15 pessoas tá eu vou fazer até um processo mais rápido vou fazer 50 sorteios de cada vez tá cada vez que apertar o botão ele vai sortear 50 vezes então vai pegar cada cada amostragem ele vai sortear 15 pessoas jogar tá aí vou fazer 50 por mais rápido ó ele vai sorteando e você
vai vendo que ele vai começando ó a juntar os dados ó a distribuição vai começar a ficar cada vez mais simétrica tá e se você pegar a média das médias Onde que tá mais ou menos a média aqui ó tá mais ou menos no meio da média da população tá esse é o teorema central do limite o teorema central do limite disso então vou até começar de novo ó sorteamos 50 ele vai fazer lá ó tá vendo ó vai ficando cada vez mais bonitinho esse é o teorema central do limite isso acontece tá isso acontece
eu vou sorteando de forma aleatória se o meu processo aleatório verdadeiro não importa com a minha cara da faculdade da Distribuição da população a se eu colocar até uma população bem disforme alguém imagina que os dados na população tem essa distribuição e nem preciso conhecer mas se eu for fazer aqui as e mostra ó e vai sempre da normal tá vendo então não importa a cara da distribuição dos dados coletados sempre vão dar vão ter os dados médios né a média das médias vai sempre vim de uma distribuição normal e se você olhar a média
das Médias eu vejo há mais ou menos aqui ó que é a média dessa distribuição paga também deslocada tá bom o teorema central do limite algo muito robusto ele acontece vou deixar esse vídeo na descrição e é muito legal tá para você visualizar tá é só que aí quando você faz sua pergunta de pesquisa voltando aqui quando você faz a quando você coleta com ele igual a um né vou até vou até voltar de novo fazer um outro exemplo lá então imagina lá o dado da População tal imagina que eu vou colocar um é igual
ano tá é igual a 1 e como você vai colocar uma pessoa é a sua pesquisa na sua pesquisa eu tô fazendo 50 colegas então eu n 50 pelo que ele tá 50 pessoas que eu vou colocar 30 há 30 pessoas então é como se o seletor de aço e 30 pessoas nós vai pegar uma pessoa vai juntando 30 pessoas não dá normal tá vendo não dá normal porque fiquei um número de pessoas em cada amostra é muito pequeno porque minha Moto tem ele igual um se eu for coletando mais pessoas agora vou completar você
coletar 50 pessoas de cada vez e agora a habilidade muito grande ó a variabilidade muito grande mas conforme eu vou coletando pessoas também vai ter normal vai ficar normal tá então o que que o que que pelo terminal central do limite cada pessoa coletada seria uma amostra de igual ano como que eu faço para reduzir a variabilidade né deixar Isso aqui menos normal aumentar o tamanho da amostra dentro da amostragem né então só fazendo de novo se eu voltar para um tamanho de amostra ó dentro de cada moça tenho 15 pessoas então meu um em
um individo na verdade é uma média de 15 indivíduos tá e vou colocar 50 vezes aí você vai ver que a variabilidade menor também da hora habilidade não é menor eu chego na normalidade mais rápido bem mais rápido tá você vê que cada vez que eu faço o sorteio vai dando Diferente porque só que é um processo aleatório mas sempre vai convergindo para normal se você mora mais demora menos ó já tá bem normal tá quando eu pego igual a 1 e essa mostra que eu tô coletando tenho igual uma pessoa então a variabilidade muito
grande porque eu tô colocando uma pessoa de cada vez né é óbvio que é esperado que a variabilidade fique muito grande vai convergir para normal mas eu vou precisar de mais gente né mas Pessoas mais amostras eu vou passar na verdade mais amostras dinheiro igual a 1 para convergir para normal quanto tempo vai levar aí a gente vai entrar depende dessa distribuição depende do seu fenômeno e aí para isso que vai servir é bem importante ao aula de cálculo de amostra ela é bem paradigmática mas você vai ver ok mesmo coletando com ele igual a
um vai convergindo para normal que aumenta a variância né o que a mente a variabilidade em torno dessa média que Você tá encontrando então quando coleta com o domínio unidade de análise tem ele igual um né eu consigo chegar no teorema central do limite ela consigo ficar na média só que a variabilidade em torno da média é maior eu erro mais tá então seu repetindo e o estudo várias vezes é diferente do que coletava das pessoas tá é bem e ele ajuda bastante vamos voltar nele daqui a pouco tá então teorema central do limite algo
que me permite isso então Quando você tá fazendo a sua pesquisa né imagina que você coletou lá 50 pessoas no seu estudo a sua amostra né na verdade é uma dessas barras então lembra quando eu faço amostragem com 15 pessoas em cada grupo é como se fosse uma pesquisa um estudo né seu estudo é uma dessas barras só é uma dessas mas o que eu quero descobrir essa média dos médios aqui ó tá como é que eu sei que a minha média do meu estudo que eu encontrei já que não repetir ele 30 40 vezes
como é Que eu sei que a minha média é é a mesma média verdadeira você não vai saber tá mas para isso que você precisa do conceito de intervalo de confiança dentro do meu estudo só que o meu estudo lá é isso aqui meu estudo já tá dentro do meu estudo eu encontrei a minha média tá e eu dentro do mês todo eu tenho os meus dados e dentro dos dados eu tenho a média e tem a variância então eu posso calcular o intervalo em Torno dessa média aqui né onde com certo nível de confiança
a verdadeira média da população que seria esse milho aqui essa média populacional vai estar contido eu não sei quanto é a média da população mas eu sei que tá entre esse valor e esse valor sendo que a base é a média que eu encontrei essa é a ideia base do intervalo de confiança tá aí dá ideia básica do intervalo de confiança é essa você não repete o mesmo estudo várias vezes você em geral faz um estudo uma Vez só quando você faz um estudo uma vez só o seu estudo é uma dessas barras e não
é a barra da verdadeiramente você não sabe tu pode ser até que seja mas você não sabe seu estudo é uma dessas barros tá a ideia é que o quão distante essa minha barra tá da verdadeira média você vai pegar essa barra e colocar um intervalo de confiança nela tá pra deixar isso mais claro ainda vou vamos usar o nosso site de novo aqui ele tem também a parte de intervalos de Confiança aqui ó tá intervalos de confiança muito legal esse site ele mostra muitas coisas interessantes e aí ó a gente vai ver né então
a o intervalo de confiança depende da distribuição dos seus dados tá vamos considerar além dos normais tá normal então imagina que eu tenho uma população só que é o dado na sua população tem distribuição normal tem uma certa média então isso aqui a população de são paulo a população de são paulo tem uma certa média meio que Eu não sei qual é não sei mas eu quero descobrir tá só que é só vou fazer um estudo eu só dessa é um conjunto de pessoas a imagina que eu vou sortear online de cinco pessoas tá meu
meu estudo e tem eu vou pegar eu vou pegar cinco pessoas tão meu estudo só tem 5 pessoas online muito pequeno tá você viu pela pelo gráfico anterior que quando eu pego poucas pessoas avarias é grande a variabilidade aumenta quando eu pego Muitas pessoas a variabilidade diminui tá como eu vou pegar um em muito pequeno o intervalo de confiança ficar grande mas se eu colocar uma confiança de por exemplo aqui aqui a 90 por cento e noventa e nove porcento colocar 95 que é o mais usual tá só colocar noventa e cinco porcento de confiança
isso quer dizer que de cada 100 repetições que eu fizer do meu estudo em média em 95 dessas repetições vai estar contido o verdadeiro valor da média tá então ele Aqui no começo da amostragem tá cada barra que sair daqui do gráfico cada barrinha que sai do gráfico é um estudo você só faz um cada uma dessas barras eu só um estudo de uma vez é o seu mestrado o seu doutorado é uma dessas barras só uma bom então veja que ele vai pegar cinco pessoas eles junto as pessoas e geram intervalo de confiança em
torno da média baseado na média eo desvio-padrão tá depois a gente vai chegar na fórmula Disso mas aí você vê ela que a grande maioria dos pontos ó dado que eles vão dessa mostra a grande maioria dos pontos tem um intervalo de confiança que está contendo a verdadeira média você não sabe quanto ela é o seu estudo por exemplo pode ter sido só essa barra então você acha que imita entre esse valor e esse valor se você repetir esse estudo provavelmente ele vai dar uma média diferente mas o intervalo de confiança vai estar dentro da
verdadeira Média tá você vai ver que pode acontece eventualmente né ó às vezes dá um intervalo muito grande às vezes ao intervalo muito pequeno mas que não contém a média tá mas como é que eu sei se o meu estudo é esse rosinha ou esse verdinho você não sabe pode ser que você faça um estudo que seja muito bom muito correcto mas por um azar não contém o verdadeiro valor da média por isso que é importante na pesquisa reprodutibilidade e você não vai ver esse gráfico inteiro Você vai fazer você a sua contribuição como cientista
é só um estudo é só uma dessas barras mas vai ter uma pessoa que vai pegar a essas barras de vários estudos juntar para tentar ter uma estimativa dessa verdadeira média quem faz isso as pessoas interessadas por exemplo e fazer mecanagem tá o quê que é a metanálise a metanálise é você pegar vários trabalhos que estudam o mesmo tema com a mesma variável dependente a gente vai ver depois que é isso e Agrupam esses estudos que tem o mesmo desenho de estudo o mesmo tipo de variável e fazem a junção deles que seria a junção
dessas barras aqui né em torno dessa média tá o principal gráfico da metanálise é mais ou menos um gráfico parecido com esse que a gente está vendo tá ó veja aqui os intervalos de confiança tão grande tem muita incerteza em torno da média porque o tamanho da amostra pequeno se eu pegar um também da mostra a cada a nossa vai ter 30 pessoas Ó aí você vai ver ó que ele sorteia 30 pessoas de cada o intervalo de confiança já fica bem menor já fica bem eu erro muito menos quanto mais pessoas do colégio no
meu estudo menos é o erro menor fica o intervalo eu necessito de menos estudos quanto maior o tamanho de amostra eu necessito de menos estudos para tentar detectar essa verdadeira média eventualmente pode acontecer de dar uma estudo ó que caia fora faz parte porque A confiança não quer 100 porcento tá mas quanto maior o tamanho de amostra menor o meu erro né menor meu erro em torno da média e maior confiança eu tenho aqui numa meta-análise repetindo eu estudo várias vezes eu vá conseguir ter uma boa estimativa do que é o verdadeiro valor da média
tá muito legal né essa essa ideia do intervalo de confiança tá isso vale para qualquer distribuição você pegar uma distribuição qui-quadrado a descrição que quadrada é bem É caído assim né ela não é homogênea tá ela não é simétrica mas aí você vê o que mesmo assim dá para detectar pelo teorema central do limite sempre que você sortear a média das médias vai ser normal tá então pelo teorema central do limite não importa a distribuição dos dados na população talvez demore um pouco mais talvez eu preciso demais amostras mas eu vou conseguir detectar se eu
repetir o meu estudo número um significativamente significativo de Vezes e vou conseguir ter uma boa estimativa da verdadeiramente tá então espero que com isso você tenha conseguido perceber que eu não preciso coletar todos os dados da população todo tempo para ter boas estimativas das verdadeiras médias do que tá acontecendo às vezes com uma mostra menor né mas bem coletada bem controlada eu consigo ter uma precisão muito boa sobre a verdadeira média né dos dados tá então muita gente fala pô mas pesquisa Eleitoral você só coleta lá duas mil pessoas com essas duas mil pessoas e
vai conseguir prever a intenção de voto de 20 milhões sim sim consigo tá e a gente vai ver pela fórmula do intervalo de confiança tá bom eu vou deixar esse site na descrição brinque com ele é muito legal tá então voltando aqui né voltando aqui já mostrei a ideia do intervalo de confiança para variável continua na variável categórica é a mesma coisa Acontece o mesmo princípio tá e a e agora é o que a gente vai o que a gente vai fazer agora eu só vou apresentar a conta tá eu vou só apresentar a conta
do intervalo de confiança e a gente pára por aqui hoje tá na nossa primeira aula a gente vai eu vou apresentar a conta e a gente paga por hoje e aí eu abri mentira volta no próximo vídeo né tá porque não quero deixar tão longo assim né já tá com umas duas horas é bastante Então vamos ver a fórmula do intervalo de confiança os paramédicos a confiança para médias tá eu vou apresentar aqui depois a gente faz um exemplo o intervalo de confiança para média como que é a fórmula é a média né mais ou
menos você viu pelo desenho na que é um pontinho que a média intervalo para cima e para baixo mais ou menos um valor que chama z a gente vai ver o que é vezes o desvio padrão sobre a raiz do N ta pena é o tamanho de amostra então vamos dar nome aos bois aqui então eu tenho a média você já sabe como calcular a somatória das observações dividido pelo número dela né só que você já saca é o dp é o desvio padrão que a raiz quadrada da variância que é a média a média
dos desvios ao quadrado e na verdade é a soma dos desvios e ao quadrado dividido por n o n - 1 tá isso aqui tudo dentro da raiz tá bom porque aí aqui dentro tem a variante aí Dentro da variância raiz da variância e o desvio padrão e o n é o tamanho da amostra o tamanho da amostra que você tem tá agora finalmente eu consigo explicar o último conceito que o erro padrão aquele conceito que eu fiquei devendo o que que é o erro padrão né erro padrão nada mais é do que o desvio-padrão
dividido pela raiz do ele é parece ficar aqui né e é isso mesmo padrão é isso é o desvio-padrão dividido pelo pelo tamanho da amostra tá vale a Pena uma coisa que as pessoas confundem muito é a diferença entre erro padrão e desvio padrão eles são diferentes e são fundamentalmente diferentes tá é e o desvio padrão ele não tende a zero então por exemplo vamos imaginar vamos dar uma olhada nessa forma lá é o desvio-padrão dividido pela raiz do n né ajudou tamanho da mostra porque né é a primeira consequência dessa fórmula se erro padrão
ele é igual ao desvio-padrão dividido pela raiz do n tá sempre uma Consequência disso né sempre o erro padrão vai ser menor ou igual ao desvio padrão e o erro padrão nunca vai ser maior do que eu desvio padrão por quê porque o erro padrão tá dividindo né o desvio padrão ele não ele sempre vai ser maior que o erro padrão é certo quando o ele é um seu tamanho de amostra foi um aqui só tiver uma pessoa o erro padrão é igual desvio padrão mas ele não faz sentido tá a partir do momento que
eu tenho ele é Maior que 1 o erro padrão sempre ficando pequeno e o desvio padrão é pode ficar o mesmo tá então o o erro padrão de faria que varia conforme o tamanho da amostra é o tamanho e da amostra on bom então se você tiver uma mostra ah não que tem lá uma um desvio padrão dentro dessa massa em uma média x tem um desvio padrão de 10 unidades e eu também já mostra 100 pessoas tá quanto que é o erro padrão né o erro Padrão vai ser 10 dividido pela raiz de cem
certo que vai dar um né 10 a raiz de 10 da de 110 pudesse não imunidade então você vê que dizia o padrão aline se mantém constante mas o erro padrão diminuir dependendo do tamanho de amostra tá então se eu tivesse uma amostra de 100 pessoas mesmo dizer o padrão padrão 10 uma nota de 100 pessoas o erro padrão mesmo se tivesse uma moça de dez pessoas dali menor também tá daria maior que umas daí a menor também Tá e por que não é porque o porquê que o erro padrão é assim né aí vale
vale a pena definição não é uma definição de erro padrão e é por isso que é erro não desvio né desvio quando você fala de desvios você está se desviando da média né então quando você fala de desvio né é o desvio da média é um desvio da média amostral o alívio da média amostral e para que não é você não sabe se a verdadeira médias e aquele mim né lembra É só que ele verdadeiro minha média da população né é um desvio da média mostrar você só você só tá com se desviando da média
você não necessariamente está errando dá para errar você tem que conhecer a média da população então quê que é o erro padrão o erro padrão é a distância esse é meu patrão uma medida da distância da amostra da média da amostra na verdade também te da amostra e para E a média e da população bom então o só que é super importante o erro padrão e aí antes de exacerbar mais essa definição eu quero mostrar mais um detalhe da fórmula que é porque porque que o erro padrão é o desvio padrão tudo bem mas dividir
pela raiz do n por quê que é a raiz quadrada tá é por causa de uma propriedade que eu tenho aqui ó imagina que eu tenho aqui o tamanho da amostra né aqui a amostra A mini da amostra e aqui é uma medida chamada poder do da amostra o poder da amostra tá vamos definir o que que esse poder né o que que é poder da amostra é a capacidade e da amostra fim de detectar detectar diferenças e com o relevante amostra é para detectar diferenças tá vou dar um exemplo imagina que eu tenho uma
mostra com duas pessoas é igual a dois só dois duas pessoas sendo que uma dessas Pessoas é fumante e a outra não fumante tá e eu quero testar eu quero saber se essas os dois grupos né o grupo de fumantes com ele igual a 1 e o grupo de não-fumantes com igual a um eu quero saber se eles têm uma função pulmonar diferente e a gente já sabe né por várias evidências que pessoas fumantes têm menos capacidade pulmonar do que pessoas não-fumantes né pelo próprio efeito do cigarro mas esse essa amostra com n2 é tão
pequena que pode ser que Por acaso a pessoa fumante tem uma capacidade respiratória melhor do que a não fumante por acaso porque meu ele é muito pequeno a pesquisa o n o tamanho da nossa tem poder baixo como ele tem um poder baixo eu não consigo detectar uma diferença que eu esperar a população de forma usual tá então amostras muito pequenas podem dar um ruído na na interpretação dos resultados conforme o aumentando o tamanho das amostras a as diferenças vão aparecendo Caso elas existam existem e representando diferenças populacionais que de fato acontece tá então é
meio que intuitivo imaginar que o a relação entre o tamanho da mostre o poder conforme mostra vai aumentando o poder vai aumentando né é normal começar a imaginar isso né então o tamanho da amostra vai aumentando o poder da amostra vai aumentando também mas será que isso aqui é uma reta que vai embora para o infinito mas será que essa reta Cresce indefinidamente né se você pensar um pouquinho você começa aqui não não existe um poder infinito porque senão então meu tamanho de amostra no máximo ele vai ter o tamanho da população né então as
amostras são infinitas elas têm tamanho da máximo que o da população então e se você for aumentando também da mostra vai chegar uma hora que vai saturar né o poder ele é expresso em porcentagem chega uma hora que você já Tem 99 100 porcento de poder tenho limite então a relação né a curva da relação entre o tamanho de amostra e o poder da pesquisa ela é uma reta assim ela vai crescendo a taxas decrescentes né a ideia que você tem que conseguir e aí eu já estou adiantando um detalhe do cálculo de amostra é
você encontrar esse ponto de inflexão aqui ó esse ponto de inflexão ele é um ponto em que conserta o tamanho de amostra você já tem um certo poder máximo né se você aumentar o Tamanho de amostra né por um em maior você não tinha não vai ganhar mais muito poder já não compensa muito tá já vai ficar muito caro para um ganho de poder pequeno né então a ideia do cálculo de amostra acha isso e é isso aqui que a gente vai ver na onde cálculo de amostra e qual que seria o ideal ele não
pode ser nem muito grande nem muito pequeno né para você encontrar o ideal para sua pesquisa então não confio em pessoas que Digam quanto maior melhor não é verdade tava se você tem que desenhar essa pesquisa encontrar o ideal para aqueles tudo tá e que como que é como que é o a função de uma curva que cresce a taxas decrescentes né é a função f de x = raiz de x né raiz quadrada é uma função que vai crescendo a taxas decrescentes tensão número qualquer pensa assim quanto que é a raiz quadrada 10 pensa
é 36 quanto é a raiz quadrada 6 então toda vez que eu coloco o x e tira a raiz Quadrada do número vai ficar no menor né e ou seja ele vai crescendo cada vez mais devagar tá então é por isso que essa parte de baixo aqui é a raiz de n por conta dessa relação entre a amostra o tamanho da mostra o poder da pesquisa tá essa parte de baixo a parte de cima diz respeito a amostra esse amostra que você tem tá então a gente chega numa conclusão aqui que é bem interessante do
cálculo de amostra do local como já mencionado do Intervalo de confiança tá aí chega a uma conclusão bem útil que é o seguinte é que aí a gente para para fechar hoje a gente chega na diferença entre precisão e acurácia a precisão versus a croácia a acurácia tá é você deve ter visto em alguns livros então né que a você tem lá um alvo você tem um alvo ea mosca aqui essa música ela é um me ela é verdadeira média é a média da população que eu não sei quanto é tá eu não sei quanto
essa Verdadeira média então imagina que você a ideia do arqueiro cego tá você é um arqueiro o cientista né o cientista ele é um arqueiro cego o arqueiro secos então a ideia que ele vai ele pega a amostra dele né os dados que ele tem ele joga esses dados aqui né é para tentar achar esse me né então ele joga os dados para tentar acertar esse milho para ter uma ideia da onde ele é mas ele não tá vendo se ele acerta a mosca não tá então imagina que eu tenho Dois conjuntos de dados esse
é o conjunto lá de dados tá estão aqui uma certa espalhamento e eu tenho um outro conjunto de dados que é o conjunto b que deu aqui ó ó olá pessoal conjunto b tá o quê que é o conjunto ao conjunto a acurácia é quando acerta no alvo uma amostra acurada é uma mostra aqui tá muito perto do que eu quero ver de verdade que a verdadeiramente uma mostra precisa é uma mostra que tem baixa variabilidade tem Pouca variabilidade e aí tem pouca variabilidade tá amostra curada é nossa acerta no alvo o que que é
a mostra ah é né a mostrar ela tem acurácia né ela tá ali em média acertando o verdadeiro valor mas ela tem uma baixa a precisão a planta baixa precisão tá o grupo b né amostra b ela tem uma precisão alta é né ela toma precisão alta mas o mar curasse abaixo É uma couraça baixo que ela está distante da verdadeiramente tá a pergunta que eu tenho pra vocês é qual dessas duas médias é melhor para você uma média que você sabe que tá meio que circundando o verdadeiro valor mas ela era muito uma amostra
que era bem pouquinho os dados são bem concentrados mas você sabe que está distante da verdadeira média né repente tá depende porque se eu souber assim eu sei que essa mostra é a pouco essa mostra que Ela é a pouco isso mas se eu souber o tamanho do viesse né o quanto que ela se distancia do verdadeiro valor aí é só compensar né só pegar todos esses números somar um viés e aí eu caio certinho essa massa ficar muito melhor mas aí eu preciso saber o valor do viesse essa mostrar aqui eu sei que ela
tá mais ou menos acertando mas ela tem uma incerteza grande intervalo de confiança para ficar grande então tem prós e contras de cada um tá mas o Importante daqui é o seguinte tudo bem eu entendi precisão e acurácia mais em a fórmula me dá uma medida quantitativa de precisão e acurácia sim tá o quê que é uma medida de precisão a medida de precisão diz respeito a sua amostra e eu quero saber o com precisa é a minha mostra o quanto os dados variam em torno da média da minha mostra não da verdadeira média que
dado que me dá isso o desvio padrão o desvio padrão na medida da precisão da Minha mostra trabalhar precisão é amostral e o que que é acurácia acurácia tem a ver com alvo né tem que me dar a distância entre a média da amostra para verdadeira média a o erro padrão então eles são fundamentalmente diferentes tá o desvio padrão na medida de precisão o erro padrão medida de acurácia eu com perto você tá da verdadeiro valor da média tá então numa é praticamente impossível né isso aqui vai até anotar é Impossível entre aspas impossível assim
realisticamente né claro que você pode simular uma mostra aí você faz o que você quiser mas é impossível se encontrar a encontrar encontrar desvio-padrão igual a zero né em uma amostra em uma amostra real e o que quer dizer o padrão zero numa amostra real né é desvio padrão zero na prática assim é o desvio-padrão zero quer dizer que não ah não não existe não Há variação em torno da média o contorno em média qual que é a definição de qual a definição de desvio padrão que a mesma da variância o quanto os dados se
distanciam da média e média se o quanto os dados se distanciam da média em média é zero quer dizer que todos na prática não quer dizer que todos os dados todos os dados bom né são iguais a média bom então por exemplo se eu tiver um Conjunto de 30 pessoas eu coletei 30 pessoas altura delas com altura média em junho 80 o desvio padrão 0 que quer dizer todas elas têm 80 todas as pessoas têm exatamente a mesma altura os dados não se distanciam da média é possível se encontrado mas é muito raro praticamente impossível
de encontrar uma amostra real de coleta dados de uma pessoa de um conjunto de pessoas elas sempre vão ter Um desvio em torno da média né alguma coisa pode ser que seja um desvio pequena mas nunca vai dar zero o erro padrão pode dar zero né erro padrão pode de zero e o erro padrão que quanto maior o tamanho da amostra ele vai dando prazer vai indo para o zero por quê que é o erro padrão né eu vou dronar desvio padrão dividindo dividido pelo n né que acontece quando n fica muito grande com ele
muito grande E o erro padrão tende a zero e o que quer dizer um erro padrão zero né erro padrão qualquer definição é a distância da média da amostra para medir a população que acontece quando o erro padrão e 0 e quer dizer que a sua média da amostra é igual à média da população você descobriu o verdadeiro valor da média tá então é você descobrir o alvo tá bom então o erro padrão conforme vai aumentando o tamanho da nossa ele vai Ficar pequenininho porque ele vai convergindo para o verdadeiro valor da média tá então
ele vai conversando a média ou a o desvio padrão e desvio padrão e ele tem um valor da sua média eu tenho valor da sua mostra então você pode por exemplo se você coletar todas as pessoas de são paulo toda a população de são paulo vai existir uma média e vai existir um desvio padrão então se eu pegar todo mundo que são paulo e calcular média real a média de uns 70 Vai não quer dizer que todo mundo tem um e setenta não quer dizer que diz o padrão e 0 vai ter um desvio vai
ter pessoas mais altas e mais baixas que os 70 mas quando vai ser o erro padrão do zero porque eu tenho toda a população naquele momento naquele momento o erro padrão zero tudo bem gente tá então espero que tenha ficado claro isso é muito importante muito importante mês e essa é uma parte da aula que vale a pena ver mais de uma vez tá bom para Entender a diferença real entre desvio padrão erro padrão então normalmente o desvio padrão você vai utilizar em dados amostrais quando você não sabe se a sua média é a verdadeira
média da população desvio padrão erro padrão medem coisas diferentes o desvio padrão média uma coisa da sua mostra uma característica de precisão da sua mostro com precisa é a sua mostra o erro padrão é a distância entre a sua mostre a população às vezes você nem tem como saber isso às vezes Você nem quer saber isso você quer saber os dados da sua mostra tá muita gente usa erro padrão porque ele dá menor e aí o gráfico foi mais bonitinho está errado tá porque o erro padrão é uma medida da distância da sua média primeiro
e a população não tem nada a ver com não tem nada a ver muitas vezes com data que você está analisando viu o povo da célula e povo do rato tá cuidado às vezes o objetivo de alguém que trabalha no laboratório né povo das células do Rato não é generalizar população de células de ratos que é o que o erro padrão avalia e às vezes não se usa erro padrão para disfarçar o fato de que na verdade a sua mostra tem muita variabilidade que era endógena precisam da sua nota baixa tá então cuidado tá bom
quem vai fazer metanálise aí vale a pena só errou padrão o quem tá fazendo estudos populacionais aí vale a pena usar erro padrão tá porque a sua amostragem Permite que você faça uma extrapolação para a população mesmo tá bom então agora finalmente eu nunca gente já chegou nisso falta a última coisa que hoje que explicar o z né o que quer dizer e o z ele seria o número o número de desvios padrão e desvios-padrão é é é o número de desvios padrão e relacionado é relacionado com o grau é de confiança A confiança desejado
e o número de desvios padrão relacionado com grau de confiança desejado você sempre vai estabelecer o intervalo de confiança com certo grau de erro tá é isso aqui vem de uma propriedade da do teorema central do limite tá esses e aqui ele vende uma propriedade do teorema central do limite que eu vou explorar mais na aula seguinte tá se a propriedade que a só para deixar um nome que a regra do 67 95/99 tá é que diz o Seguinte só para apresentar quando você tem aqui uma uma distribuição normal né só que vale para distribuição
normal tá principalmente vale para outro algumas outras mas a gente vê depois se tem uma certa média se você pegar a média mais um desvio padrão ea média menos um desvio padrão e eu vou ter aqui dentro 67 por cento das observações um toque se eu pegar a média mais dois desvios-padrão aqui ó a média mas dois Vizinhos padrão oi e a média menos dois dias e os patrão e eu vou ter aqui dentro e aqui dentro e noventa e cinco porcento dos meus dados e se eu pegar três desvios-padrão para mais ou para menos
eu vou ter 99 por centro daí vem o nome da regra tá é bem e é três desvios padrão ó e aqui a média menos três vizinhos padrão tá eu vou ter aqui dentro de Todas intervalo né aqui 99 porcento dos meus das minhas observações então aqui se eu pegar por exemplo o mais usual que a gente usa muito 95% então se eu pegar e a média mais dois vídeos padrão por um lado e mais menos 2 vezes patrão e pegar esse intervalo aqui ó e esse intervalo de dados aqui com a minha média no
meio né eu tenho um intervalo de confiança tá só que a média mais ou menos dois né média mais ou menos dois desvios-padrão esse esse Jeito só vale para dados populacionais quando eu tenho dados da população toda tipo no censo e populacionais o ou senso quando eu tenho senso de todas as pessoas da população aí eu pego a média somos dois desvios-padrão para sempre para baixo eu vou ter noventa e cinco porcento das pessoas se a distribuição dos dados forem for normal é mas na minha mostra normalmente eu não faço isso então eu tenho que
ponderar Isso aqui pelo pelo pelo grau de erro da minha mostra e agora a gente chega na definição matemática do intervalo de confiança final aqui que a definição matemática a noite mais uma entre aspas né mas matemática e do intervalo de confiança então só para fechar essa parte uma regra que você tem bem para facilitar as contas tá se você adotar um z = 2 é dois intervalos de confiança é dois desvios Padrão né você vai ter um uma confiança deixa ter o bicho colocar aqui do lado se eu tiver o z e aí vou
ter a confiança o grau de confiança que eu tenho tá se eu colocar um cd 2 a confiança vai ser de noventa e cinco porcento eu tenho confiança de que noventa e cinco porcento das estimativas da média que eu tiver caso repita o meu estudos em vezes em 95 delas vai tá ali dentro tá se eu pegar um parecido perto de três ela o valor e um pouquinho Diferente mas é próximo de três vou ter 99 porcento de confiança você pegar um igual a um 67 por cento de confiança que é muito pouco tá em
geral a gente adotou dois ou três tá é o mais comum mais para frente em outros vídeos gente vai fazer exercícios sobre isso tá então só para fechar o vídeo de hoje a definição matemática do intervalo de confiança e ele no intervalo em torno da média né aqui no caso né que eu tô usando média intervalo em torno Em torno da média no intervalo de totalmente mais pode ser outro estimativa mas por essa forma e onde tenho onde associo a onde eu associo 1 grau é de confiança se deus assim um grave confiança que é
o z e isso é importante e uma medida o de acurácia é da minha amostra da amostra observada e na mostra observado O que é isso é a medida do erro padrão ah tá porque o erro padrão e desvio padrão sobre a rainha isso aqui ó é o erro padrão tá eu vou passar uma medida de acurácia como eu falei anteriormente e por quê por quê que eu fiquei esse e porque se você olhar na fórmula uma multiplicação e na teoria de probabilidade quando uma coisa acontece ea outra né você usar a regra do e
você multiplica tá então o que que é o intervalo de confiança é isso aqui ó Isso aqui é uma medida do intervalo porque a mais e mais ou menos mais ou menos a média então é um intervalo lendo essa fórmula em português né é um intervalo em torno da média mais ou menos a média intervalo em torno da média onde eu associo um grau de confiança que é o z e a acurácia da minha mostra o que acontece quando o erro padrão e 0 o que acontece quando o erro padrão e 0 né se o
erro padrão for zero essa parte Zero vai multiplicar pelo z que não importa quanto eliana se o erro padrão for zero vai multiplicar por isso vai cancelar essa parte vai ficar só a média ou seja eu tenho uma verdura na média eu tenho a verdadeira o verdadeiro valor se o erro patrão for zero a média da amostra igual e que ela verdadeiramente quando eu erro padrão é zero porque a distância entre a minha amostra e a população e 0 logo a minha mostra é a população tá quando eu padrão e 0 tá bom Quando o
erro padrão é diferente de zero quer dizer que eu não tenho a população então não adianta eu ter um grau de confiança aí eu limpo o grau de confiança quando o erro padrão é zero quer dizer que a minha mostra é a população logo minha confiança 100% é total tá a partir do momento que o erro padrão é diferente de zero você já tem uma distância entre a minha média e aí o verdadeiro valor da população tem uma distância aí vale a pena entrar entre o Erro em a confiança e acurácia da minha da minha
amostra tudo bem tá se o erro padrão é pequeno não é pequenininho ele vai multiplicar ele vai me explicar pouco isso aqui né então o intervalo de confiança ficar pequeno é a média mais ou menos um pouquinho pouca coisa tá tudo bem então o objetivo agora dessa parte final é estruturar vocês a entender a fórmula do intervalo de confiança tá então para aula que vem Para o vídeo que vem né é o que que ficou em aberto você viu que a gente a percorrer um caminho muito grande nem duas horas a gente a cumprir você
achava que não que a coisa fácil não é eu dou bastante conteúdo mesmo porque eu quero que vocês estudem bastante tá então a gente só retomando a gente viu lá daquele pai pile né gente viu lá tipo de variar o fenômeno né a teoria da medida validade e precisão aí tem que tipo de variável variável fator toda aquela Discussão aí entre o tipo a variável qualitativa variável quantitativa e tem subdivisões aí a gente entrou nos tipos de variável contínua né nas medidas descritivas para variável continuar gente viu média variância desvio padrão erro padrão agora coeficiente
de variação tá o que que vai ficar com a próxima aula a gente vai eu vou retomar a ideia do intervalo de confiança a gente vai aperfeiçoar mais isso tá o intervalo de confiança é Eu quero deixar bem claro a importância disso é fundamental para você entender que verdadeira as médias das populações são as relações elas variam o tempo inteiro e é muito mais importante você tem sapo intervalo do que por estimativa pontual tá com a próxima aula vou reforçar mas isso ainda no intervalo de confiança para média a gente faz um exemplo aí eu
vou começar a falar vou voltar atrás e vou voltar nas variáveis categóricas medidas descritivas para Variável categórica a gente vai ver proporção vai ver mediana vai ver moda por aí vai todo esse caminho que a eu trabalhava continuar a gente vai construir para variável categórica tá e aí na no final da aula que vem eu vou mostrar como essa forma aqui não é como essa fórmula que interessante né que explica muita coisa a gente pode manipular essa fórmula para calcular o primeiro tipo de cálculo de amostra né é porque agora é uma questão importante Quantas
pessoas eu preciso para fazer um estudo né a gente vai entrar nessa discussão partir dessa forma essa fórmula ajudar um estimativa inicial de um de uma nova fórmula para intervalos de confiança tanto pelo menos desconto proporções tá e a partir daí a gente vai conseguir comprar coisas a gente já vai chegar né na lógica dos testes de hipótese e aí a gente consegue se instrumentalizar para entrar nos testes estatísticos em si e aí o curso com a Minha a galope tá espero que você tenha aproveitado como eu essa discussão e sempre gosto de falar sobre
isso porque eu começo da vida de um cientista tá você não precisa fazer ciência para ser cientista você precisa entender a estrutura epistemológica de como se constrói ah tá ia ser uma das formas não é a única tá mas é uma das melhores assim para pelo menos para pessoas no início daquela no início por meio da graduação Ou profissionais mesmo pessoas já formadas que que trabalham em áreas que são muito vagas assim e querem colocar um pouquinho mais de ciência de dados e estruturar um pouco melhor campos de pesquisa para testar hipóteses essa primeira aula
é fundamental para você começar a conversar sobre o tema tá estude bem esses conceitos porque eles vão ser muito úteis para daqui para frente se você internaliza bem a ideia de intervalo de confiança e depois como Você usar ela para comprar coisas na em grupos o curso vai ficar muito mais tranquilo daqui pra frente tá bom então espero que você tenha aproveitado e a gente se vê na próxima aula tá já que você começou aqui na chegou até até essa época até o final desse vídeo longo eu acho que você já tem potencial para ser
uma pessoa que vai aproveitar bastante esse curso tá seja resiliente a ciência não é e assim só não é tão fácil quanto as Pessoas acham mais uma forma estruturada de mostrar como ela funciona se você se interessar vou ficar muito contente de ter você como meu colega cientista tá bom que a gente vê na próxima aula e até mais