e aí e lá pessoal vamos para mais uma aula de estatística hoje vamos falar sobre média para dados em classe média para dados em classe e para isso eu vou voltar naquele exemplo lá do começo do curso que é uma pesquisa salarial no bairro alpha nós já calculamos essa média que várias vezes né tudo quanto é a aula a gente calcula essa média de novo e de novo e de novo a média vai dar 3,6 né então como é que era o exemplo e tem um bairro alfa e a gente vai fazer uma pesquisa salarial
a gente entrevista dez pessoas ea renda delas é expressa em número de salários mínimos então a primeira pessoa ganhar um salário depois nós temos três pessoas que ganham dois salários três salários quatro quatro cinco seis sete salários e objetivo vai ser calcular média né nós já calculamos essa média e várias vezes então quando os dados estão assim envolve mas como é que a gente faz a gente soma todos os valores e depois dividir por 10 porque são 10 pessoas então foi assim que a gente calculou média para dados em hall tão um com mais seis
das sete e dez 1823 3036 então o total a renda total é 36 salários mínimos são 10 pessoas na hora de dividir vai dar uma renda média de 3,6 salários mínimos então isso aqui foi a média para da olá meus dados aqui estão segundo um rol matéria lá do começo do curso nós também já aprendemos a calcular essa mesma média quando os dados estão agrupados então o que que eu faço agora em vez de ele estar um por um eu coloco numa tabela de frequências então o primeiro valor o valor de um salário mínimo acontece
uma vez o valor de dois salários mínimos acontece três vezes e assim por diante isso aqui então vai ser dados agrupados por valor deixou diminuir essa tabela e deixa eu como aumentar o tamanho da fonte e aí e aí eu estou muito bem como é que você tá uma se os dados estão agrupados por valor né então aquele estão agrupados em e por e agrupados por valor então como é que fica calcula média para dados agrupados por valor então a gente começa a multiplicando o valor vezes frequência tão na primeira linha o valor vale um
salário mínimo e aconteceu uma vez a frequência um reses um dá um na próxima linha duas vezes três a seis três vezes um da três quatro vezes 2 da 85 6 e 7 muito bem depois é só totalizar total das frequências vale 10 total da coluna valor vezes frequências vale 36 e aí é só dividir então a média será 36 / 10 3,6 tão notem que o resultado bateu quando os dados estavam em hall a média deu 3,6 quando os dados estavam agrupados por valor a média deu 3,6 de novo eu tinha que bater afinal
de contas são os mesmos dados só dispostos de uma maneira diferente na primeira tela eles estavam dispostos um a uma lista exaustiva no hall e agora eles estão dispostos numa tabela de frequência mas são os mesmos dados então a média tinha que bater a e agora vamos pegar estes mesmos dados e vamos agrupá-los em classe vamos agrupados em classes ou seja o que que é classe relembrando classe são faixas de valores então a vamos lá e aos cantos que eu defini foram essas aqui a primeira classe vai de 1 até 4 a gente já estudou
classes em aula passada né essa simbologia aqui ó de 1 até 4 então essa terninho aqui indica que o um faz parte da classe então o valores iguais a um serão considerados usando lado do quatro nesse lado aqui não tem peninha então significa que o quatro não faz parte da classe ou seja valores iguais a 4 não entraram nessa classe ou seja vou considerar vou considerar valores até o 3,99 seria isso bom então muito bem vamos voltar lá no nosso hall e vamos pegar de 1 até 4 bom então vou pegar um ou dois o
2 o 2 o 3 o 4 exatamente quatro não entra não é o quatro fica de fora dessa classe então essa primeira classe tem um dois três quatro cinco tem cinco observações a frequência dela vale5 e a frequência dela vale sim muito bem essa foi a primeira classe é a segunda classe vai de quatro até 7 horas oi e agora eu vou considerar o quatro e não vou considerar ossete então tá aqui ó quatro quatro cinco seis o 7 fica de fora então a próxima classe ela tem um dois três quatro observações oi e a
última classe vai de 7 até 10 incluo 7 não inclui o 10 a última classe só tem o valor 7 frequência dela vale um muito bem então no momento exato em que eu abro o pênis dados em classe qual que é o pressuposto o pressuposto é que eu só tenho acesso a essa tabela só tem acesso a essa tabela e não tenho mais acesso ao hall original né perdi o hall original joguei fora tava muito ruim trabalhar com ele tava muito complicado porque às vezes é um rock tem um milhão de valores então não vou
trabalhar só com essa tabela não enxergo mais o rolo original esse é o pressuposto é muito bem se esse é o pressuposto eu já não dá mais para calcular média por quê para eu calcular média teria que somar todos os valores depois dividir por 10 é mas no momento exato em que só tem acesso a essa tabela eu não sei mais quanto ganho esta 5 pessoas a primeira classe eu só sei que elas ganham de um salário até quatro mas eu não sei mais exatamente quanto ganha cada uma e pode ser que todas elas ganham
um salário mínimo pode ser que uma ganhei um outra ganhe 3 eu não sei mais quantos é quanto elas ganham então eu não tenho mais como somar todos os valores eu não tenho mais como calcular a média vamos anotar isso e quando só se tem acesso aos dados agrupados em classe perde-se informação não sabemos mais exatamente quanto ganha cada pessoa logo não é mais possível somar todas as observações logo não é mais possível calcular a média tão pronta essa é a característica marcante dos dados em classe a gente tem perda de informação victor então para
quê que se usa dado em classe a gente pede informação nós só usamos dados em classe por conta do ganho de espaço e tempo então imagina uma pesquisa com um milhão de pessoas imagina fazer um rol com um milhão de número sou o espaço que isso ia ocupar a dificuldade que se tratar esses valores né você olhar para ele se não enxerga nada né é um mundaréu de número mesmo que eu agrupasse por valor essa tabela teria centenas de linhas há milhares de linhas talvez uma tabela com centenas dele não adianta nada fica muita coisa
para eu olhar não consigo olhar para o negócio tão grande assim então para ganhar espaço para ficar uma coisa mais compacta que eu consiga bater o olho enxergar algo a gente já grupo em classe então as forças tivesse analisando milhares de pessoas eu poderia ter uma linha que vai de um salário mínimo até eu sei lá cinco salários nessa linha tem eh duas mil pessoas depois de cinco salários até 10 nessa linha aqui tem mil pessoas e de 10 salários para cima aqui eu tenho 500 pessoas então resumir 3.500 pessoas em três linhas é compacta
alguém espaço eu já consigo facilmente ter uma noção aí do que tá acontecendo então para isso que serve dados em classe para compactar os dados mesmo que si mesmo se forem 5.000 dados cinco milhões de dados 500 mil dados entendeu e é para isso que serve eu ganho espaço mas eu perco informação é uma balança né por um lado eu bem espaço por outro lado eu perco informação tá bom se não é mais possível calcular a média como que eu resolvo o exercício então jesus pediu para calcular média tão e para calcular a média para
calcular a média daremos um chute a gente a gente vai fazer uma consideração que consideração é essa consideramos que todas as frequências se referem aos pontos médios das classes então eu vou supor eu vou chutar o que todas essas cinco pessoas aqui ganham exatamente dois salários mínimos e meio porque dois e meio por que é o ponto médio dessa classe e é isso que eu vou fazer um chute é a certeza que essa cinco pessoas ganham dois salários mínimos e meio não é mas é o melhor que eu posso fazer se não tem outra opção
eu tenho que chutar então o ponto médio da classe o ponto médio da classe que vai ser a minha variável x né então primeira classe é de 1 até 4 né como é que eu cometi calcular ponto médio de classe né então eu a primeira classe e vai de 1 até 4 basta somar e dividir por dois um mais quatro das cinco dividido por 2 da um dois e meio o 25 então é assim que se calcula o ponto médio da classe a e depois sete mais quatro das 11 / 2 das 5 e 6
10 mais sete das 17 horas dividido por 2 da oito e meio pronto calculamos todos os pontos médios é uma dica né se você não quiser ficar fazendo essa soma e divide por dois toda hora tem uma forma mais rápida que a seguinte você calcula o primeiro ponto médio tá aqui um mais 4 das 5 / 2 2,5 calculei o primeiro e aí nós tem que os valores aqui vão aumentando de três em três homens ou 3 unidades é de um fã tá quatro de quatro foi para frente e depois de quatro foi para 7
de 7 foi para 10 então todos os valores são aumentando de três em três então por propriedades da média o ponto médio também vai aumentando de 3 em 3 2 e meio mais 35 e 65 e meio mais 385 bom então é uma outra forma você calculou só o primeiro e vai somando soma três soma três soma 31 é muito bem já poderia calcular a média de x mas ainda não vou fazer isso ainda vou usar variável auxiliar lembra da variada auxiliar então vou criar mais uma coluna e vou criar uma variável auxiliar aqui só
para tirar esse e-mail né tem muito meio dois e meio 5 e 6 8 e meio então vou tirar esse e-mail fora então vou pegar vou fazer o seguinte vou pegar a variável auxiliar será x - 5 e 6 com isso eu vou anular o valor central é tão cinco e meio quando eu subir traz 5:30 vai dar 08 e meio quando eu subtrair 5 e 6 vai dar 32 e meio quando eu subir traz 5 e 6 e vai dar - 3 - 3 muito bem e vamos agora passar limpa se esses valores ou
menos 30 e três agora é só e multiplicar valor por frequência valor vezes frequência valor qual o valor valor de de né vou calcular média para a variável b ou menos 3 x 5 da menos 15 0 x 4 da 03 x 1 a 3 agora eu só totalizar como calcular os totais né total das frequências 5 + 4 + 1 da 10 total de valor vezes frequência menos 15 mais três da menos 12 e aí facilmente eu posso calcular a média de de ter a média de basta dividir os dois totais - 12 e
basta dividir os dois totais menos 12 / 10 - 12 o / 10 - 12 / 10 o que dá menos 1,2 maravilha ah mas eu não quero a média de de eu quero a média de x e eu sei que de vários x menos cinco e meio e portanto x = di-vi mais cinco e meio e deixa melhorar esse dia aqui que ficou estranho né e agora basta aplicar a propriedade da média a média dx será a média de mais cinco e meio então a média de x vai ficar quanto que era média de
de menos um ponto dois então vai ser menos 1,2 mais cinco e meio bom então a média dx será 5 e 6 - 1.2 vai dar 4 oi vírgula 3 a média de x deu 4,3 em e a média de x deu 4,3 a média de x eu 4,3 salários mínimos muito bem e se vocês bem se lembram a média verdadeira de quem tem acesso a todos os dados ao real completo a média verdadeira deu 3,6 3,6 a média verdadeira deu 3,6 e a média verdadeira de quem tem acesso aos dados completos o vale três
e vocês mas a média calculada para dados em classe deu 4,3 então deu diferente não bateu nós erramos em alguns será que a gente ruim alguma coisa e se a resposta é não né aqui não é certeza que vai bater por quê que não é certeza que vai bater porque eu perdi a informação e no exato momento em que eu perdi informação precisei dar um chute e aí o e kichute foi esse eu precisei dar um chute eu precisei dar um chute nós consideramos que todas as frequências se referem aos pontos médios das classes mais
isso foi só um chute é só uma consideração é o melhor sujo que eu podia dar é o melhor que eu poderia fazer é mas não significa que esteja correto por exemplo na última classe eu disse né eu supus o que todo mundo da última classe ganhava um salário de 8 e 6 8 salários mínimos e meio isso é verdadeiro não se você for lá nos dados originais não tem ninguém que ganha outro salários mínimos e meio se você for nos dados originais lá só tem uma pessoa e ela ganha sete salários mínimos e não
outro salários mínimos e meio então quando eu chuto quando eu faço aquela consideração não é certeza de que tá certo é só um chute é o melhor que eu posso fazer dado que eu não enxergo os valores originais então vai dar diferença mesmo tá vai dar diferença mesmo então quem tem acesso aos dados completos sabe que a média verdadeira é 3,6 mas quem só vê os dados em classe já calculou uma média de 4.3 é o melhor que eu podia fazer tá bom então na aula de hoje nós iremos o conceito de média para dados
em classe vimos que ela é uma aproximação por quê porque a gente ganha espaço uma as pede informação e na próxima aula a gente vai resolver as questões de prova para agente praticar encerramos por aqui este vídeo bons estudos e até a próxima