o olá pessoal tudo bem então esse é um vídeo quero é te ensinar a fazer a nova de uma via com medidas repetidas no r ah é então a gente vai aprender várias coisas que são importantes para a gente fazer esse teste da forma adequada a primeira coisa que eu vou te explicar é como fazer uma transposição do banco de dados mudar o formato do banco de dados o formato que a gente é realmente usa é esse formato wide que seria no material do seu aí amplo e a gente tem que mudar de se formado para um formato que é o longa que em português é chamado de longo ou dados em painel é só reestruturando esse banco de dados que a gente consegue fazer a nova de uma via depois disso a gente vai verificar as os pressupostos da nova de uma via então a gente vai verificar a normalidade ea presença de arte laércio pelo grupo pelos teste de shapiro-wilk por uma função específica para detecção de alt liars que eu até usei já em vídeos anteriores que é a identificar york liars é depois disso a gente vai fazer o teste de esfericidade né verificar e feliz o lugares pelo teste de malte lhe é o mesmo que o spss faz e a esse felicidade é um pressuposto quando a gente está trabalhando com medidas repetidas ela substitui o pressuposto da homogeneidade que é quando a gente está trabalhando e com medidas não repetidos né e depois a gente vai fazer a nova de uma via com medidas repetidas e fazer todas as comparações entre pares que são apropriadas inclusive vamos usar a mesma que o a espécie é isso já faz e no final a gente vai pedir as estatísticas descritivas dos dados fazer um gráfico ver como que as coisas estão e aí bom então antes da gente ir para o r vamos pensar qual é o problema eu vou relembrar com você o que que a nova de uma via com medidas repetidas faz a nova geladeira com medidas repetidas ela é usada quando eu tenho uma única variável independente e essa variável independente é uma variável intra-sujeitos que é aquela oi tinha isso jackson que a gente chama né em inglês essa variável entre o sujeito é uma variável que todos os sujeitos do meu banco de dados é têm valores para todos os níveis dessa variável então nesse nosso caso eu vou te explicar aqui qual é a qual é a nossa variável entre o sujeito mas antes disso só fazendo um lembrete de que esse tipo de discussão mais teórica e mais curta eu faço lá no instagram então se você ainda não me segue por lá é a roupa estatística aplicada me quem me procura lá que você vai ver que a gente geralmente faz essas discussões por lá é por exemplo de hoje a gente vai usar o banco de dados site que contém as notas de 30 alunos é qual é a ideia por trás do banco de dados 7 os mesmos trabalhos desses 30 alunos foram avaliados por quatro professores diferentes e então o cada um deu a sua nota e o que a gente vai verificar é se o professor interfere na nota do aluno ou seja se existe um efeito do professor sobre a nota e aí a gente vai treinar como descrever os resultados nesse caso a gente tem quatro professores diferentes e a nota do aluno foi dada por cada um desses professores então o professor vai funcionar aqui como a variável independente de medidas repetidas a variável entre a sujeito porque a nota do aluno foi dada por cada um desses professores eu tenho mesmo aluno sendo avaliado em cada um desses níveis e em cada um dos pra cada um dos professores eu dei aqui o exemplo do professor crescer uma coisa diferente o mais comum é a sua variável entre o sujeito o seu tempo então você pega medidas da mesma pessoa ao longo do tempo e o tempo funciona como a variável independente tô por exemplo se avaliar a mesma pessoa cada 3 meses por um ano eu já sei também que algumas pessoas vão falar assim ah mas esse não é o melhor teste enfim é meio complicado se esse seria o teste mais adequado para responder essa pergunta porque uma opção seria a gente fazer análise de confiabilidade de ir lá e habilite como é o caso do coeficiente de correlação entre a classe e ser mas por outro lado o coeficiente de correlação entre a classe ele não ia me dizer se um professor fazer uma nota muito diferente de todos os demais né a gente teria uma nota de reprodutibilidade mais geral ah e outra coisa outro motivo para eu estar insistindo nesse banco de dados é que esse é o mesmo banco de dados que eu já usei para montar aula de a nova de uma via com medidas repetidas no spss eu tô usando o centro mesmo banco de dados para se você for uma pessoa fazendo a transição de um programa para o outro você puder assistir o vídeo do spss para entender o que mudou tá então esse foi o nosso exemplo quero saber se tem algum professor aí que é mais rígido ou algum professor aí que é mais sei lá tá dando nota de graça aí ok então vamos supor aqui bom então aqui é o script do erre né da nova de uma via com medidas repetidas como sempre o script e o banco de dados estão disponíveis para download aqui na descrição do vídeo o que é e como sempre também o primeiro passo foi se a gente carregar os pacotes que serão usados eu vou usar o que pai aqui eu sempre uso né vou usar esse pacote e zerar aqui que é um pacote que faz a nova de uma via com medidas repetidas de um jeito mais fácil mas intuitivo tem vários jeitos de programar nova de uma via com medidas repetidas mas eu vou usar esse pacote que foi que eu gostei mais estudantes sobre isso é a gente também vai usar essa biblioteca esse pacote we shape que é para mudar o formato do banco de dados e um que também já ficou aqui conhecido no canal que é o r e startcs que né também conhecido que eu nunca consigo falar o nome dele eu vou rodar toda esse código já expliquei ele com detalhes em vídeos anteriores mas eu tô dizendo basicamente para instalar o pacote de caso ele não esteja instalado no seu computador e caso ele já esteja carregar esses pacotes então rodando tudo e às vezes se dá uma de molhadinha dependendo do seu da sua hum e dependendo da conexão da internet se tiver instalando né pô aí o segundo passo é a gente carregar o banco de dados estabelecer que o diretório de trabalho meu já está estabelecido e eu vou ler aqui banco de dados usando a função ide csv2 e como eu falei para vocês substitui a gente usar o iks cs vez em o2 e aí tem que colocar qual é o separador decimal e qual é o separador de colunas então esse aqui já assumi eterno firmado em português que é quando a gente usa o separador de coluna sendo o ponto vírgula decimal sendo a vírgula e aí como eu faço vou usar de novo essa função que eu sempre uso que é a viu dados que abre aqui uma tabela que é muito parecida com excel mostrando aqui mas minhas variáveis então vez que eu tenho que a identificação do sujeito de uma 30 o professor né então professor um professores professor três professor quatro e as notas de cada aluno então cada linha corresponde às notas do mesmo trabalho né então veja aqui que esse aluno tirou 6. 2 com primeiros seis pontos clássicos segundos 6. 1 terceiro e 5.
8 com o quarto bem parecidas as notas né e assim por diante então eu tenho inspira todos os professores alguns eu tenho uma discordância maior então olha esse aluno quatro aqui primeiro perdeu 19 e o segundo professor de 8,3 o terceiro dia deu 7. 9 isso daqui até que tem um concordando e o último deus 7. 2 então tem uma diferença de até três pontos a a ser um livro que ter quatro né é outra função que eu sempre uso o gosto bastante essa função greenpeace sendo que ela mostra para mim a estrutura aqui do banco de dados então avatar identificando que o sujeito aqui ela tem que ficou com o número inteiro e são números de 1 a 31 as notas de cada coluna de professor né foi identificada como de vr que é double quer dizer que é um número com vírgula tá certo é um de na verdade ele tá aqui identificado como número inteiro mas ele não é um número inteiro porque eu sei que ele não é um número inteiro é porque é na verdade não é que o aluno dois é duas vezes o aluno um né que nós não tem essa relação à distância é esse número não significa nada é um número de identificação não sei não é muito diferente do que sei escrever esse nome deles né tô na verdade o e de ser um fator como se fosse o nome tá mas isso a gente vai ter que se preocupar daqui a pouco então o primeiro passo como eu falei para vocês a o modelo da nova de uma via com medidas sempre te dizer isso só pode ser feito se a gente reestruturar o banco de dados do formato ângulo para o formato longo então é isso que eu vou fazer e é para isso que eu baixei esse pacote e shape que ele faz isso de uma forma bem fácil e intuitiva tá então vamos lá primeira coisa eu criei um banco de dados com outro nome só para a gente ter os dois e você enxergar as diferenças então eu chamei aqui de dados l porque tô dizendo que o banco de dados em formato longo e para e essa reestruturação e você vai entender melhor quando eu comparar os dois bancos de dados mas essa reestruturação vai fazer com que cada professor diferente fique numa linha diferente então o sujeito um que tem quatro notas uma olhada por cada professor ele vai ter ele vai ter quatro linhas uma cor nada do professor uma canal do professor 2 e uma corretas para obter três e uma nota do professor quatro e assim sucessivamente para isso a gente vai usar essa função chama mel se do pacote cheip e aí primeiro vou dizer qual é o banco de dados então é o meu chamados outra coisa que a gente precisa ter é dizer qual é o identificador qual é a variável que identifica os diferentes sujeitos meu caso tinha que ela variável e de né então fica aqui ó e deu e é se você não tivesse vai ter que criar uma dessas variáveis e aí a gente precisa dizer quais são as variáveis que são de medidas repetidas que vão ter que ser colocadas da linha para coluna então vem aqui ó mede é igual esses e é de concatenar e quando a gente tem mais de uma coisa então a gente coloca esses e e aí são as quatro variáveis professor um é todas os nomes entre aspas tá professor dois professor 3 e aí prophecy 4 em ok e aí a gente roda esse esse código tá o ok nada aconteceu mas ele cria um banco de dados novo então vou apagar aqui minha colinha e eu vou fazer vou usar a função viu de novo só que agora eu preciso o banco de dados para você comparar as diferenças então veja o que que aconteceu desse para esse nesse aqui hortinha quatro colunas cada uma com uma nota é os diferentes professores e aqui é veja que assim eu tenho a nota do professor um pra cada um dos alunos aí se eu descer eu voltei a nota do professor dois precisamos de uma trinca você descer vou tirar nota do professor três para os alunos de 11 a 30 e depois notas do professor quatro para os alunos de 11 a 30 tá é isso que mudou quem é e aí eu vou só fazer algumas modificações para deixar esse banco de dados novo com uma cara mais agradável o que eu gosto demais então primeira coisa eu quero primeiro mudar os nomes das colunas também daquele chama aqui de id variable é nivel velho então na verdade não é muito informativo esses nomes né e deixa certo mas eu vou mudar os outros nomes então para isso eu vou usar esse call names que então o nome das colunas ó e vou dizer que eu vou mudar a dos dados ele tá e como que vão ser os novos nomes vou usar denovo cê zinho hoje concatenar que eu vou colocar mais de um né então o primeiro vai ser deitado tá certo o segundo vou chamar de professor u e o terceiro por chamar de nota e é isso tudo aqui que a gente está fazendo é o que de certa forma uma espécie é se faz quando você programa anova de medidas repetidas tá então rodei isso se a gente abrir aqui de novo o dados veja que ele já trocou para professor em alta outra coisa que eu não gosto não gostei é que ele coloca ordenado pelo professor e eu gostaria que ele colocar colocar as ordenado pelo id isso fica mais agradável mais fácil de entender na minha opinião eu gostaria que ele colocasse as quatro notas do 1º aluno aqui aí as quatro notas do 2º aluno e é muito fácil pedir isso para isso a gente vai usar a função sorte então eu vou dizer que eu quero que banco de dados l seja equivalente ao mesmo banco de dados só que é ordenado de acordo com a variável e p então para isso a gente usa essa função sorte underline df que vende próprio pacote cheip e aí vou dizer que eu quero mesmo banco o dados é só que eu quero que a variável que ordena isso seja a variável que chama ideia e aí eu rodar esse código aqui quando a gente abre veja que já tá ordenado aqui tem as quatro notas um as quatro notas de 2 e assim sucessivamente ok outra coisa que vai ser importante já já é que se a gente pede aqui o grito sim de novo para o banco de dados novo né o banco de dados série a gente vai ver que ele identificou o professor como factor como um fator tá certo ele identificou nada como de bow também tá certo mas entrar ainda identificando e de como inteiro e como eu falei para vocês aqui vai ser vai ser relevante a gente vai ter que mudar então eu tenho que eu quero que ele entenda que na verdade eu lhe dei o número inteiro ali mas ele é um fator ele é só o nome do sujeito então para isso eu vou colocar aqui ó dados o e de ideais desculpa dados l cifrão e de porque você colocar só dados eu teria mudando no primeiro banco de dados né e a gente vai usar o banco de dados no formato longo aí eu vou dizer que ele era um factor então vou pegar o própria variável que eu vou dizer que ele recebe a mesma variável só que agora transformada em fator tá bom então se a gente rodar isso e pediu glimpse de novo a gente vai ver que agora ele considera um fator 1 e como eu comentei com vocês a nova de uma via de medidas repetidas ela tem alguns pressupostos é um deles é a esse felicidade que eu não vou analisar separadamente ele já analisa dentro da do código de a nova de uma vida de medidas repetidas do pacote e é o que eu vou fazer aqui é chegar normalidade ea ausência de all players usando o pacote r statistics ok então o primeiro vou verificar se existem outliner supergrupo então vou pegar o banco de dados da gisele vou usar o operador piquet é o control shift n ou maior percentagem maior porcentagem primeiro vou dizer que eu quero que esses dados são agrupados então eu vou usar o group by helô usar que eu quero que seja gripado pelo professor ou seja eu quero que ele procure out lá eles dentro das notas de cada professor vou usar de novo control shift n e aí vou usar a função também do r o que é a identify underline rottweilers e aí vou identificar isso na nota a rodando ixi veja que ele vai dizer aqui que tem 3 altis life professor um é que são três notas bem baixas tá vendo ó dois pontos 42.
9 2. 8 e aqui como a gente conversou já na aula de a nova de uma via de medidas repetidas é ele identifica se é out lá e esse é o molde lá eles tremam que eu esses três valores são outros são de são verdadeiro para ser um auxiliar mas são falso para ser um outline extremo o que diferencia se é um out little é um áudio laye extrema o cálculo que a gente usa para o limite é o auti lá ir usa o padrão que é um ponto 5 e o auxiliar extrema usa o limite de três vezes a amplitude interquartil é portanto essencial tilar extrema é considerado um auxiliar mais influente mais preocupante o ideal seria não quero tilar nenhum mas eu vou seguir a análise considerando que bom pelo menos ele softwares não são tão extremos e depois de avaliar a presença de out lines eu vou avaliar a normalidade do grupo então de novo vou pegar o dados vou usar tinha um control shift e me vou usar o grupo ai para dizer que eu quero que o resultado saia separado para cada professor entrou analisada normalidade das notas de cada professora e aí vou de novo usar o contraste tiemi e vou usar o shakiro underline teste também desse pacote que é o r statistics porque é os outros chapinha se a gente já o shapiro normal do pacote base ele não vai funcionar aqui dentro desse desse de playa aqui dessa coisa que a gente fez de primeiro dividir em grupo tá então vou fazer assim usando o shakira underline teste não shapiro ponto teste oi e aí quando a gente faz isso a gente veio aqui e os diferentes grupos têm todos distribuição normal sei disso olhando o valor do p né então a gente sabe que o valor dp se ele for maior que 0,05 a gente não vai rejeitar a hipótese nula vou considerar que os dados apresentam distribuição normal que eu nesse caso vou considerar que todos apresentam distribuição normal esse aqui tá é meio que pendente para para terminar o normal mas vou considerar tudo bem e aí o passo 5 é de fato fazer o meu modelo de anova de medidas repetidas usando esse pacote e z os né que é para é um jeito uma brincadeira para dizer que é um pacote fácil tá primeira coisa que a gente tem que fazer usando esse pacote é construir o modelo de a nova então eu vou chamar esse modelo que eu tô criando de mod ponto a nova aqui você chama do que você quiser sair com seu coração e aí eu vou usar a função e z a nova lembrando sempre de tomar cuidado e com maiúsculas e minúsculas que o wesley diferenciam e aí a gente tem que algumas informações primeiro qual é o meu banco de dados fazer aqui que é o da do célio lembrando que não possa e não pode usar o o banco ou ficar no formato ai gente tem que usar o formato logo aí a gente vai dizer quem é nossa é de ver que que a dever é a variável dependente né ela que tem dois filhos que tá invertido mas é a variável dependente então nesse caso minha variável dependente que foi coletado é anota aí tem aqui o w e de que nada mais é que eu preciso identificar qual é a variável que identifica o sujeito por isso que a gente tem que mudar lá para fator lá em cima senão ia dar um problema aqui eu vou dizer que a minha variável te chamei dele aí eu vou usar vou identificar quem quer waiting wishing é a variável entre a sujeito né de berlim subject que nesse caso o professor lembrando também de não dá bobeira que descrever uma coisa com letra minúscula quando no banco tá como maiúscula e aí a gente vai outro colocar outras duas coisas aqui uma delas é que eu quero de taught igual a tua você quer uma recomendação até do and field que ele dá uma quando a gente coloca de ter igual ao tio ele libera um resumo da do teste mais detalhado que vai ser mais útil e outra coisa que a gente pode mudar é o tipo de soma dos quadrados se a gente não colocar nada não digitais itaipu ele vai fazer o tipo 2 e o melhor pensou a gente quando você tem algum desbalanço de desenho experimental e que é o padrão do spss usar o whatsapp igual a três então usar o tipo 3d soma dos quadrados eu mudei tudo isso vou apagar minha cola veja que eu deixei tudo anotado aqui na no script para você quando você estiver lendo isso daqui é um se você lembrar o que que a gente tá falando tá então tenho que uma colinha para você também bom então de encontro entre não aconteceu nada né não aconteceu nada porque na verdade só modelo foi criado mas eu ainda não pedi aqui o modelo não pediu resultado como que a gente pede a gente só digita o nome do modelo então pronto oi e aí esse é uma ao sumário do né um tamboril resumo dos resultados que é bem detalhadinho e que não foge muito do que o spss libera então vamos lá vamos entender nessa primeira parte ele mostra para o inter septo que a gente não vai analisar como a gente não analisa na espécie mas aí todos esses modelos são modelos lineares eles podem ser representados por uma reta e o inter 7 ao intercepto dessa reta então quê que esse essa linha está analisando last winter certo é diferente de zero em geral você não vai ter uma esse não vai ter uma interpretação é o que importa para gente é a que o efeito do professor então ele dá aqui o grau de liberdade lembra que a gente sempre na nova tem a estatística f e tem dois graus de liberdade do modelo do erro então aqui do modelo e do erro ele dá que as somas dos quadrados e ele dá que o valor de f que é o que a gente recorta e o valor dp então veja que nesse caso é 8,15 levado a 10 - 11 é muito pequeno ele também coloca com um asterisco super menor que 0 05 e esse g&s que libera é uma medida de tamanho de efeito que eu não vou entrar em detalhes eu quero fazer aulas específicas para também defeitos sei todo o vídeo seu like comentando mas você não falou isso também de efeito eu sei gente eu tô ligada que eu vou fazer aulas separados para também de texto tá bom e ainda nunca expliquei historicamente eu quero fazer uma coisa mais bonitinha e aí depois disso então por aqui a gente já poderia interpretar só que a gente pra lembrar que essa interpretação aqui ela só vale quando os dados são esféricos o que que me disse os dados são esféricos o teste de malte tá liberado logo aqui embaixo então esse aqui é o teste de malte de preço felicidade a inveja que ele tem mais estatística do teste que é uma estatística w e ele tem valor dp que aqui deu 3 ponto 2 elevado a 10 a menos 5 ou seja bem menor que 0 05 ele até botou asterisco em aqui então vamos entender qual quais são as hipóteses nula e alternativa do teste de março a hipótese nula do teste de mouse ele é que os dados são esféricos então que a esfericidade enquanto que a hipótese alternativa é o contrário de que os dados não são esféricos não a infelicidade como ter que ser menor que 0 05 a gente vai rejeitar a hipótese nula e ficar com a hipótese alternativa vou considerar que não existe a experiência e o que que tu muda aqui na interpretação esse resultado que libera na primeira tabela é o resultado que inclusive lá no spss aparece dizendo assim esse serviço tia sú mede o que é esse é o resultado para quando estou assumindo que existe a felicidade para quantidades realmente estão esféricos é esse isso aqui então eu no momento que eu acabei de analisar que não dá para considerar que os dados são esféricos eu não vou interpretar esse teste eu vou interpretar é uma nova de uma via corrigida para esse problema de infelicidade ou o r libera por essa preço pacote duas correções essa aquele chama aqui de gg que é a green house guys e green house né fazer sexo ea hf e que essa ruins elstile para ser sincero no segundo como pronunciar é eng o hawk-eye se ela é um pouquinho mais conservadora mas ela é o padrão se reportar as atraente para ela ser mais conservador então se a gente olhar aqui ó eu tenho uma correção então aqui eu tenho valor the greenhouse gas ser que é o épsilon e a gente tem aqui o valor dp e corrigido por greenhouse-geisser então veja que ele é 1.