Olá pessoal Bom dia eh espero que estejam todos bem acho que deu tudo certo aqui h vamos começar nossa 24ª aula né do curso estatística aplicado a psicologia parte um que é a aula sobre análise de correspondência né Eh Esse é um teste muito legal né Ele é bem bem interessante assim tem aplicações bem particulares e se agora que a gente já passou pela análise fatorial e o PCA A análise de correspondência ela vai ficar Bem ela fica bem mais intuitiva tá ela é bem mais fácil de de pegar a sacada eh O objetivo dessa
aula é só uma aula né então A análise de correspondência dá para explicar numa aula numa aula só sobretudo Porque a gente já viu muitas coisas anteriores muitos conceitos anteriores então facilita bastante eh então e Eh vamos começar eh sobre a anl de correspondência de correspondência a gente viu no a gente Viu em em testes anteriores né na análise fatorial e o PCA análise fatorial e análise e o PCA eles só aceitam variáveis contínuos ou originais tá se a variável é contínua ou ordinal o dá para fazer análise fatorial exploratória e o PCA né sem
problema só colocar no programa ele faz e mas quando quando você tem variável nominal né as variáveis nominais você não pode usar né então por exemplo se Você tiver uma variável nominal tipo região onde você mora né e a região a b ou c né Essa variável as categorias da variável região não tem ordem pode ser CBA né tanto faz porque as regiões não temm uma ordenação própria intrínseca né então a variável não é nem original eh logo dentro do do da análise fatorial e do PCA não tem como usar né Por qu se se
você relembrar como éfeito basicamente análise fatorial né você tem Que transformar a variável num eixo e aí tem por exemplo a região né Eh como não tem ordem por que que vai ser assim a BC Por que que o a é menor do que os outros né então como como as categorias não tem uma ordem não tem nem como começar a fazer análise fatorial não tem nem como começar a colocar ele num eixo Tá então não dá para fazer a A análise fatorial nem PCA com variável nominal né Eh Poxa mas não tem como usar
essa Variável para nada né não tem como usar essa variável para alguma coisa e tal não né dentro dentro do do da análise fatorial colocando ela junto com outras coisas não dá não dá para fazer fator né não dá nem para agrupar né no no gráfico como no PCA e Poxa mas isso meu trabalho só usa variável nominal o que o que é comum em algumas áreas do conhecimento né Eh usar só análise só variável nominal né E principalmente muitas áreas que são que Se chamam de áreas qualitativas utilizam muita variável nominal né Ah então
não dá para usar essas técnicas a Rigor não mas tem uma técnica que seria uma forma de agrupar né variáveis nominais que é a análise de correspondência então para isso que ela serve tá então o grande uso tá assim pros íntimos Tima de anacor né e o grande uso da anacor é a geração geração de perfis com Base em agrupamentos agrupamentos de variáveis qualitativas qualitativas eh sejam elas sejam elas nominais ou ordinais tá tanto faz você nominal o ordinal e aá correspondência trabalha né então acaba sendo muito útil né tipo é a pedrinha que faltava
para completar fatorial e o PCA é a análise de Correspondência né E aí a gente tem tipos de análise de correspondência não não tem um tipo só né todas assim na na parte prática o jeito de fazer é a mesma coisa mas tem algumas subdivisões Então a gente tem a a um uma técnica que se você procurar na literatura chama ca só ca né que é a análise de correspondência simples de correspondência simples análise simples é quando você só tem duas variáveis tá então quando você Quer relacionar apenas duas variáveis E você tem o MCA
que é a análise de correspondência múltipla correspondência múltipla que é quando você quer mais de duas variáveis no mesmo modelo tá E aí o o MCA ele tem alguns tipos também de MCA que é o método que você utiliza para criar o gráfico né o método mais comum de MCA ele é chamado R tá isso é o nome do algoritmo só dando nome caso você leia por aí né método hom list squares Maximum homogen alguma coisa assim tá então isso aqui é o principal algoritmo quec do gráfico e aí a gente entra no principal no
principal resultado da né que é o gráfico né só demonstrando Como como é esse gráfico né da aná correspondência vamos imaginar que eu Tenho por exemplo uma variável vou pegar a mesma variável região tenho aqui uma variável região então tenho três regiões a b c e vamos imaginar que eu tenho um grupo um grupo A e vamos imaginar que eu tenho a idade só que aí a idade não pode ser contínua eu tenho a idade em faixas idade de de 18 a 30 de 30 a 50 e mais que 50 uma coisa assim tá eu
tenho Essas três variáveis né como o que a gente conhece até agora né como que eu poderia relacionar essas variáveis né porque quadrado então o o a análise correspondência ela é uma uma um avanço do Que quadrado é um avanço do k quadrado [Música] tá eh tudo que você faz no Q quadrado você pode fazer na anál de correspondência Tá bom então assim se você quiser substituir o q quadrado por Alguma análise você pode substituir pela análise de correspondência tá eh com com mais vantagens tá bom com mais vantagens então por exemplo eh se eu
tenho essas três variáveis eh e todas elas são categóricas né até agora o único teste que a gente aprendeu é o q quadrado né E só que o q quadrado não dá para fazer das três variáveis você consegue fazer dois a do aqui né então aqui eu consigo fazer o quadrado e aí eu consigo fazer o q Quadrado da região com a idade da região com o grupo e do grupo com a idade né E aí lembra como é o q quadrado você faz aquela tabelinha né então por exemplo região e grupo eu vou eu
vou ter aqui dois grupos e três regiões você faz a tabelinha né que é tabelinha de contingência aí você vai ter os dados observados baseado no observado você calcula esperado aí faz o observado menos o esperado dá o resíduo pega o resíduo eleva ao quadrado divide pela Frequência esperada dá o q quadrado né E aí soma todos os q quadrados dá o q quadrado final né lembra disso gente do q quadrado vocês lembram Isso é uma pergunta vocês estão vivos vivos lembra dessa ideia Geral do q quadrado tá e o q quadrado só dá para
fazer com duas variáveis de cada vez né não tá errado fazer aqui só que aí o o eu quero fazer um modelo que a P as três variáveis juntas tá eu não quero fazer um modelo Dois a dois eu quero fazer um modelo que junte junte as três variáveis aí que entrar na cor aí o que quadrado não dá para fazer né E como que funciona né como é que funciona isso daqui a pouco eu mostro a ideia geral da conta tá mas mas o resultado final disso é você agrupar essas três variáveis todas aqui
né E você vai criar perfis perfis e a gente vai ver o que que é um perfil então o o eu vou agrupar essas três Variáveis vai gerar um gráfico grande né e ele chama o nome dele é biplot bipot nome desse gráfico tá E aí o que que vai acontecer cada variável vai ter suas categorias representadas no gráfico então eu vou ter aqui por exemplo uma a região a região vai ter aqui né o a o b e o c n um pontinho para cada um aí o grupo vai ter por exemplo o a
e o b e as idades vão ter seus pontinhos também né ou seja todas as categorias de Todas as variáveis serão representadas então aqui de 18 a 30 de 30 a 50 e mais que 50 né E aí o que que o que que eu faço quando quando eu olho esse gráfico né você tem que é você que decide tá não é o programa Você Decide um perfil e o que que seria um perfil você vai olhar né a a a interpretação de um gráfico assim interpretação parte do de uma premissa que é o seguinte
quanto mais Próximos os pontos quanto mais próximos os pontos que são as categorias categorias mais associadas elas são tá então o análise de correspondência também é um teste de associação igual aqui quadrado só que ele é um teste de associação para duas ou mais variáveis se você tiver só duas variáveis ele faz o gráfico também não tem nenhum problema tá só que ele Permite fazer com mais de duas O que é mais legal né então por exemplo eu posso olhar aqui por proximidade mesmo tá E e você decide não tem o critério até onde é
é é realmente visual então por exemplo ó eu tenho aqui o o a região C com 50 anos e o grupo A pronto ó eu posso pegar aqui ó eu junto aqui da minha cabeça mesmo e aqui eu criei um perfil um tá então o meu perfil um ele não dá valor de p não dá valor de p tá não tem p não tem nada ele calcula Com base na proximidade então o o o meu perfil Perfil um são pessoas pessoas do grupo A eh da região C que moram na região C E tem mais
de 50 anos essa é a descrição do meu perfil um e e pronto É isso aí eu posso olhar um outro perfil também se eu quiser por exemplo aqui ó não precisa ter todas as categorias de todas as variáveis tá eu posso pegar por exemplo aqui ó né isso aqui seria um perfil dois dependendo da Proximidade não precisa ter todas as variáveis representadas não tá eu posso pegar esse aqui também ó posso fazer um outro perfil Então teria um perfil três por exemplo tá E quem que decide isso você mesmo né por isso que a
análise de correspondência ela entra dentro de uma classe de análises qualitativas né porque o uso que você faz final da análise é gerar uma qualidade é gerar um perfil então o que que seria um perfil o perfil é um Agrupamento agrupamento qualitativo qualitativo de categorias eh um agrupamento qualitativo de categorias de variáveis e diferentes dentro de um bipot né que seria o gráfico e a gente dá algum nome para esse viés de escolha Não não é um viés não é um viés de escolha né E porque não não é um critério de escolha tá as
pessoas associam o viés com coisa errada Mas não é é um viés é uma é um critério o critério de escolha é a proximidade E aí quando você for apresentar os resultados você apresenta o gráfico e apresenta os os os perfis que você construiu né eu posso questionar Ah esse perfil aqui eu preferiria usar outro Tudo bem mas a análise é a mesma o gráfico é o mesmo isso é exatamente igual uma pesquisa qualitativa né a a quando você entrevista uma pessoa né Eh eh a o produto que a pessoa produz né o Resultado da
entrevista é o mesmo a interpretação que você dá da da entrevista pode ser diferente mas o produto base é o mesmo é exatamente igual aqui né o gráfico não muda se os dados são os mesmos o gráfico dá igual a maneira como vocês cria os perfis pode variar né Tudo bem a aí é é um um uma escolha de cada pessoa você ter que justificar Por que esse é um melhor perfil enfim tá por isso que a análise de correspondência é uma análise Qualitativa né então ele está a análise de correspondência está dentro da caixa
de análises qualitativas tá é uma cisão é uma falsa dicotomia você separar os métodos em métodos qualitativos e quantitativos tá completamente errado na verdade quando você pensa em Quali e quanti eh você tem uma linha você tem técnicas que são puramente qualitativas técnicas puramente quantitativas e tem intermediários essa é uma técnica bem Intermediária intermediária já indo pro pro qualitativo tá eh e isso é uma coisa que tem que ser atacada assim e e Ah eu sou um pesquisador qualitativo separar as áreas sabe em qual e quanti é um erro muito grave muito grave tá então
Toda vez que você faz por exemplo uma etnografia uma análise de conteúdo alguma coisa assim você também tá quantificando né você tá quantificando menos que fazer uma análise fatorial por exemplo mas também Tem uma quantificação emem em toda produção metodológica existe uma quantificação tá em todo em toda a pesquisa quantitativa existe uma uma atribuição de qualidade também né tanto é exemplos né se eu te dou o mesmo banco de dados para duas pessoas diferentes elas podem produzir resultados diferentes com eh com métodos diferentes inclusive ã o o Bruno né então o perfil é um agrupamento
qualitativo de categorias de Variáveis diferentes dentro o saco eh dentro de um bipot tá dentro de um bipot Tá bom então o o a Patrícia não perdeu nada eu não coloquei a pergunta ainda mas a pergunta já tá ficando Clara agora né eu est falando do uso então o principal uso da análise de correspondência é a geração desses perfis né com base em análises em variáveis qualitativas em variáveis categóricas né Eh sejam elas ordinais ou Nominais hã a pergunta da anacor a pergunta da ANAC é igualzinho a pergunta do q quadrado né então é é
basicamente um q quadrado com esteroides a A análise de correspondência então a pergunta seria eh eh qual não é se existe existe a associação entre duas ou mais variáveis eh categóricas qualitativas né categóricas existe associação entre duas Ou mais variáveis categóricas essa é a pergunta da An da aná de correspondência muito parecido com do q quadrado só que com mais abrangência né então tudo que um q quadrado faz você consegue fazer no gráfico tá tudo e quando você faz a análise de correspondência simples que é apenas duas variáveis A análise correspondência simples ela substitui o
q quadrado né ela entra aqui no lugar do q quadrado de contingência então tanto é eu vou Mostrar depois no programa quando você faz a análise de correspondência simples ela gera o quadrado dentro dela ela faz o quadrado e dá o gráfico né então acaba sendo mais legal tá já análise de correspondência múltipla não usa o método do que quadrado ela faz outra coisa tá que eu vou mostrar também então é muito legal assim olhando à primeira vista é uma análise bem legal mesmo mesmo e não sendo próxima da pergunta de Pesquisa de algum de
vocês é muito legal saber né Então quem trabalha com pesquisa qualitativa deveria saber essa técnica minimamente Então você faz por exemplo Eh vamos imaginar uma etnografia né Eh você quer entrevistar pessoas representativas de um certo grupo social né hã então a a pergunta do brudo né a aná de correspondência não gera nenhum valor de resultado gera um gráfico ela gera o gráfico né que é o mais importante mas é Você tem que saber se a análise ficou boa e aí ela tem indicadores de qualidade tá Então na verdade o grande resultado da naare o gráfico
e aí você tem que colocar outros outros resultados para justificar que a a esse perfil ele de fato é representativo da maior parte da sua amostra tá então assim não adianta nada você fazer os perfis e depois você vê que você não encontra pessoas que representam cada um deles né então tem tem tem indicadores que aí são Valores que você tem que ver nos resultados também para aferir a qualidade da do bipot tá eh mas a gente já vai já vai chegar lá mas o resultado em si da anacor é o gráfico é isso e
os perfis aí o perfil você constrói e de novo eu posso não concordar com o seu perfil mas isso não invalida A análise porque o dado bruto é o mesmo tá eh isso é muito legal muito legal assim para para é é é uma técnica bem subutilizada ainda Tá para algumas áreas do conhecimento ainda ela é bem subutilizada tá povo da pesquisa qual Dev usar isso correntemente eu vou mostrar algumas aplicações né Eh tem várias não não tem várias mas tem algumas né e é bem legal tá então o o a análise de correspondência simples
ela substitui o que quadrado análise de correspondência múltipla aí ela usa um outro método né para gerar mais de duas variáveis no mesmo gráfico Tá mas veja que é é um Pouco parecido com a o fator né só que não tem essa coisa de variável latente não não entra nessa discussão é uma coisa mais mais descritiva ainda então uma uma coisa importante aqui de deixar claro é que o perfil é diferente de um fator tá quando quando eu penso em perfil o perfil é diferente do fator porque o fator ele ele de fato determina alguma
coisa pelo menos em teoria né então o fator determina a a o teste o resultado do teste que eu tô Vendo né então o o o fator pensando no fator como variável latente ele isso é diferente do perfil tá o perfil é algo mais descritivo é uma descrição Geral do dos seus dados tá é é um uma coisa mais descritiva é mais descritivo né já o seu o fator a variável latente né então ah a inteligência explica o resultado do teste né aquela aquela coisa que a gente discutiu nas aulas anteriores aí seria uma coisa
mais Explicativa então ah você eh você tem um desempenho no teste por causa de uma variável latente que é a inteligência seria uma ideia mais mais forte né o perfil não o perfil é descritivo se você mudar a população alvo Você vai em outra população coleta as mesmas variáveis pode dar perfil diferente tá mas é uma ideia uma ideia é é é é uma análise descritiva bem bem mais robusta tá do que só calcular proporção né porque quando a gente tem variável categórica O Que que você faz por exemplo com como uma análise descritiva calcula
proporção né do grupo A B das idades pode até fazer uma tabela cruzada né cruza lá o grupo o grupo com a idade vê as proporções né é uma análise descritiva você fazer aqui o bipot dá gera uma análise descritiva mais robusta tá eh não Não misture saí com o perfil de personalidade isso é completa pseudociência é namasté gratidão completo tá eh eneagrama ã Como que Chama o outro eneagrama meer Briggs misericórdia joga isso fora tá tá na mesma classe do horóscopo se for pior Tá bom então não tá bom completa profal de ciência não
existe não existe tipo de personalidade o que pode existir são traços de personalidade agora perfil e eh perfil de personalidade ou tipo de personalidade é paranauê tá não foi nenhum sentido mbti misericórdia tá sai sai né Isso Aí tire tira isso daqui tá estamos falando de coisa séria tira isso Daqui misericórdia eh então não H muito bem então espero ter começado a vender o peixe da análise de correspondência que é um teste muito legal convenhamos né assim tem muitos potenciais né e e e pode ser usado né esse análise de correspondência ela é o único
teste do curso um o único que o spss faz melhor que o jamovi mas já teve melhoras do ano passado para cá né ano passado quando eu dei essa aula e eu mostrei que o jamovi Tinha umas limitações né tinha algumas limitações ã e e Mas algumas dessas limitações já foram superadas esse ano saíram atualizações dos pacotinhos que estão melhorando tá então esse é o único teste que eu vou usar o spss para mostrar assim todos os detalhes mas no gemovi já dá para fazer tá pro ano que vem deve melhorar ainda mais o pacote
tá eh por quê Porque a análise do o e a a a a conta né ela é meio Computacionalmente e demandante tá a conta disso aqui é é meio pesada né Principalmente quando tem muitas categorias e muitas pessoas tá e sobretudo a homous a homous pro computador ela pesa um pouco e no caso do do spcs eles conseguiram fazer uma solução computacional muito rápida né E aí fica melhor tá mas a questão de tempo questão de tempo e é fora análise de correspondência todo o resto do curso a gente faz no jamovi no jasp ou
o que Quer que seja dá tudo certo tá o jasp não tem análise de correspondência não tem então quem encarou a O Desafio Foi o jamovi o tem dois pacotes diferentes um um é muito bugado mas o outro tá melhor né Eh mas eu vou fazendo já movi só para mostrar como faz mas a boa parte da análise Vou fazer ainda né Espero que pelo último ano não é spss tá eh mas é muito legal né Eh os traços de personalidade não é feito com essa análise é análise fatorial análise Fatorial procure eh coisa sobre
o Big f Big f e análise fatorial não usa nada de anacor tá Por quê o jasp não tem não tem análise de correspondência tá eh e e não não tá ainda na na no caminho do de lançar tá porque de novo é é computacionalmente bem pesado assim é é fazer um algoritmo que calcula todos os a as matrizes de similaridade rápido tá quando eu mostrar a conta vocês vão ver que dá para imaginar que é pesado Tá mas Mas enfim tudo bem né questão de tempo a gente melhora isso ã então Eh bom então
espero que a gente tenha pegado né vou mostrar um exemplo real já feito né que é um artigo clássico eu mostro todo ano porque é um artigo muito bem feito né que é esse aqui está na descrição do vídeo esse artigo né Eh esse é o artigo ó o título do artigo ã É verdade que o spcs é mais visto academicamente no caso sim não ele é Mais visto porque ele é antigo o spss existe desde os anos 80 né então ele é ele é ele é muito mais antigo eh mas não é que ele
é mais bem visto academicamente estatística é conta se a conta é igual o resultado é igual qualquer programa que tem o mesmo a mesma fórmula dá tudo certo tá você dizer você dizer que o spss é melhor que outro programa é um sinal de que você tá confiando mais numa caixa preta do que a outra e a ideia não é ser uma caixa Preta A ideia é você saber fazer a conta pelo menos e idealizar como ela funciona por isso que eu nesses casos eu defendo R né o r que é a programação é melhor
porque você tem que saber o que a conta quer dizer minimamente para usar o o r né não longe disso um artigo nunca vai ser recusado porque ele foi feito no janvi não vai né tanto é que dá o mesmo resultado porque a conta é a mesma né então coitado coitado do do do fiser né que ele teve que fazer a nova na mão Porque ele criou a nova não tinha programa né não não aceitara a tese dele Claro que não né Para com isso tá só não aceita o seu programa se ele tiver com
a conta errada né mas isso é você que tem que saber também tá então também Eh vamos dar uma olhada nesse artigo ó a cor da Morte ó só olhando o título só olhando o título né causas de óbito segundo características de raça no Estado de São Paulo tá bom eh então ó olhando o título só o título Da pergunta tá eh que que que variáveis eu tenho ó eu tenho a causa de óbito né causa de óbito e eu tenho características de raça né ou seja causas de óbito e Raça são variáveis de que
tipo qual o tipo dessas duas variáveis causas de óbito e raça que tipo de variável elas são causas de óbito EA categóricas certo as duas são categóricas nominais né categóricas nominais muito bem eh Olhando só o título ó a gente não viu nada do artigo olhando o título que teste você usaria para fazer a a relação dessas duas variáveis causa de óbito e e Raça basiado no que a gente viu até agora né tá que teste você usaria para relacionar isso então que quadrado certo que quadrado beleza né então causa de óbito tem várias causas
e e e Raça tem algumas também então né vou fazer de quadrado aí tem que vir na sua cabeça né a tabela Dado observado esperado resíduo tudo mais né eu gosto sem eu mostro todo ano esse artigo porque ele é muito bom né Eh e o o é o pessoal da epidemiologia né que que fez então beleza então assim olhando pela pergunta aqui do olhando pelo título tem que ser feito aqui quadrado em algum lugar tá bom né Aí como eu já sou bandido mal mesmo né já vou pular aqui introdução porque não precisa eu
vejo aqui no abstract ó já aparece ó teste de que quadrado tá vendo Então foi Us usado que quadrado falou beleza né Eh tá bom né Aí eu pulo T aqui porque eu já sei mesmo ler já já já entendia análise T aqui não pisa olhar aí eu já vou no resultado né aqui a tabela ó causa de morte tem várias e as cores também né Beleza então essa é a tabela de contingência né Essa tabela aqui é o dado observado ou esperado Recordar viver vai gente essa tabela é o dado observado ou esperado observado
né É o que eu observo tá aí Baseado nisso lembra do do que quadrado né eu vou pegar cada uma das células aqui eu vou pegar somatória da coluna ó que tem aqui vezes a somatória da linha dividido pelo total aí eu faço isso para todas as caselas né E aí eu vou criar a tabela do esperado aí eu subtraio essa tabela do esperado vai dar o resíduo aí eu pego o resíduo elevo ao quadrado divido pela frequência esperada vai dar o q quadrado vai dar vários q quadrados aí eu somo todos vai dar esse
aqui ó 1829 Esse é o valor do q quadrado Você deve lembrar a distribuição q quadrado né ela começa no zero e vai embora né Ela é assimétrica né 18.000 Tá longe hein Tá longe do zero né Eh e o p deu 0 aqui né ou seja existe associação entre a causa de morte e a cor tem Associação né Mas a questão é aonde são muito muitas categorias né aonde e é um pouco mais de dois para três assim um pouco mais de três já passou do 5% Então aqui tem 18 18.000 né tá bem
longe então o o o desafio agora né se o artigo parasse aqui se o artigo parasse nessa tabela com Q quadrado mostrando que tem associação entre causa de morte e cor esse artigo não seria aceito para publicação Parando aqui com os mesmos dados não seria aceito para publicação por quê porque é muito difícil ver aonde tá a associação né E e ter associação entre causa de morte e cor é meio que já conhecido é meio chovendo molhado né não Tem uma Inovação de resultado ou metodológica que justifica a publicação do artigo até aqui né O
que os autores fizeram que foi uma coisa bem legal que justificou a a publicação é é transcender dessa parte do que quadrado né então beleza A gente viu no no curso no no na aula de q quadrado né que quando você tem uma tabela maior que 2 por2 para você ver aonde tá na associação né Eh você tem que fazer o resíduo ajustado Né lembra o resíduo ajustado né então o que quadrado dá grande por duas razões porque tem muita categoria E porque o tamanho de amostra gigante ó são 647 mil pessoas esse banco de
dados É muita gente morreu uma galera todo mundo aqui morreu 647 mil pessoas tá então é um banco de dados muito grande tem muita categoria então que quadrado fica grande mesmo caso tenha Associação tá eh Então beleza aí o que que ele fez aqui depois ó ele colocou uma outra Tabela que é essa aqui ó resíduos padronizados né O que que é o resíduo padronizado é o zcore do resíduo né e onde o resíduo é maior que dois ou menor que -2 né é onde tem Associação significante aí você vê ó ele ele marcou aqui
ele deixou em né só a os positivos mas os negativos também são são significativos tá Se eles forem maiores que dois né é que eles ele quis reforçar associações eh eh positivas Onde por exemplo ó aqui aqui deu 38 o o Resíduo ajustado que é muito grande então existe uma associação entre uma morte por neoplasia que é câncer existe uma associação entre uma por neoplasia e ser branco de forma positiva então quanto e eh quanto maior o número de mortes por neoplasia maior a quantidade de pessoas brancas naquele grupo né quando você olha o preto
e o Pardo por exemplo ó dá negativo os dois são significativos só que ao contrário Então quanto mais mortes por neoplasia menos Pessoas pretas e pardas eu tenho nesses nesse grupo tá nesse grupo de pessoas com neoplasia então ele escolheu colocar marcar apenas os valores positivos para para interpretar como mais né então quanto mais morte por neoplasia mais pessoas brancas quanto mais morte por por problema no sistema respiratório mais brancos e por aí vai tá mas olhando essa tabela tanto tanto os valores de resíduo positivo quanto negativo Se eles forem maiores que dois Todos eles
são significativos A 5% tá E então dá para ver que tem tem vários a a maioria do do do das das caselas eh São significativas e de novo se você parar o resultado aqui né também o artigo não vai ser publicado porque você tá mostrando que tem muitas associações significantes mas mas ainda tem a ainda é muito complexo né é muito muito pesado de ver né tanto é que ele marca aqui ó o os negretes estão os resíduos com valor positiva a 1.96 né que seria o dois né Que corresponde ao nível de significância para
o excesso de ocorrência isso A 5% tá então ó veja que mesmo sem ler o artigo sabendo teste estatístico como você já conhece você já consegue interpretar o resultado bacana né gente bacana né então dá para ler o artigo rapidinho tá então olhando aqui não dá para tirar muita coisa porque tem muita coisa mesmo aí veio a cereja né que fez o artigo ser publicado que é o seguinte eu transcendido que quadrado Porque aqui que quadrado você qualquer aula tem que quadrado você consegue fazer né Então sai saiu do que quadrado aqui mostrou os dados
descritivos mostrou o resíduo né E aí ele fez esse gráfico aqui esse gráfico foi o que fez o artigo ser aceito né meu Deus eu não consigo interpretar fal Calma vou mostrar como é fácil rápido indolor é o seguinte tem a ver com a premissa que eu falei antes né então se categorias são próximas quer dizer que elas são Associadas tá então escolha uma categoria de uma variável então por exemplo branco Ó veja que todo tipo de desgraça a só branco Ó tem muitas causas de morte próximas a ele ele morre de tudo né ó
T várias doenças né tá tá mais próximo do Branco Aí você olha o parto causa externa o que que é morrer por causa externa Hein gente fala para mim que que é o que o que que é essa categoria causa externa o que que é morrer por causa externa é a Morte matada ou morrida Hein gente é matado né morto matado né é a morte veio até a pessoa né a morte matada tá causa externa a morte foi para uma coisa de fora olha o tamanho da associação gente olha olha o tamanho né não precisa
ver nada né o melhor tipo de gráfico para fazer as pessoas acreditarem que elas entendem estatística é esse né Você bate o olho Nossa estou entendendo não é verdade a morte foi atrás do sujeito aqui e aqui Não né então assim V convenhamos convenhamos Veja isso aqui ó aqui é muito claro essa Associação e aqui é muito clara a associação do branco com essas outras categorias né se você olhar pretos né Eh Quais são as categorias mais associadas morte por transtorno mental que é o que tá mais perto e morte na gravidez ou no parto
né Eh veja que são categorias mais próximas também né Então veja que olhando o gráfico é muito claro ver Essas associações mas agora olhando essa tabela tipo é um é muito difícil não dá para ver né então olhando essa tabela não tem como ver né Essa Associação agora quando você transforma isso em distâncias e faz o gráfico as associações ficam muito mais fáceis Então esse é o gráfico da análise de correspondência essa é uma análise de correspondência simples por quê Porque só tem duas variáveis né que a cor e a causa de morte mas fica
muito claro né Quando existe a associação mesmo é muito claro muito fácil muito legal né Eu até faço piada que que se você sabe usar bem a anacor né você vai num congresso o seu o sua apresent tem três slides só três slides é o primeiro é o título O segundo é o gráfico e o terceiro é brigado acabou né três slides Você já faz o a pesquisa toda né Eh aí o que quer dizer o Perinatal e o congênitos Né o Perinatal e o morte Perinatal e congênita é mais associado Com branco né Tem
mais tá mas ainda é distante tá provavelmente essas duas categorias ficaram isoladas porque proporcionalmente tem menos casos né como tem poucos casos no no banco de dados ela vai ficar meio isolada mesmo tá mas existe uma maior Associação com o branco do que com os outros tá eu vou explicar o que que é o eixo ainda tá mas a ideia é entender a interpretação né É porque agora que Vocês entenderam o gráfico vocês vê que é fácil quer saber Como é que foi feito não é verdade então mas primeiro né vislumbre né Aqui é aqui
é um efeito artístico né vislumbre aqui o efeito artístico do gráfico Tá bom então quanto mais próximas as categorias mais associad elas são tá eh onde que acaba né então aqui aqui eu sei que o branco tem várias causas de morte né mas onde que acaba não não sei não sei você determina o final né Desse o tamanho do perfil né e eh tem algumas categorias são muito Óbvias né Eh aqui causa externo e par não tem como tá mas onde você determina o final é você que decide mas se você olhar uma outra coisa
desse gráfico que é interessante ó olha aqui morte por doença infecciosa aqui em cima né a morte por doença infecciosa Se você pegar uma régua né Ela é equidistante do Pardo do branco e do preto ela está à mesma distância de todos né ou seja o bichinho não tem preconceito nenhum né pegou morreu pegou Morreu tá o bichinho não faz não tem preconceito né isso também é um resultado para ser descrito foi descrito no artigo que morte infecciosa não respeita a cor né se você tá ali o bichinho entrou já é era e eh GG
você né então Eh É isso aí tá eh Então veja que é um assim você não precisa de nada da análise nada né você bota o gráfico explica o superfíci acabou né então é muito boa muito boa a análise bacana mesmo e é uma análise Qualitativa veja que isso aqui não é uma análise quantitativa o o produto do resultado que são os perfis é uma análise qualitativa tá eh eh toda toda área de ciência social deveria usar esses gráficos correntemente tá melhorando tá eles estão usando mais tá melhorando tá saindo do blá né eles estão
fazendo isso sobretudo agora porque tem muita gente da agora eh eh tem na área de Ciências Sociais tem a área de dados e tal então o pessoal tá Começando a se apropriar dessas técnicas finalmente mas eu dou aula disso aqui é pelo menos 10 anos eh você vê que a melhora ainda é é tímida né mas está acontecendo tá está acontecendo Então assim já consegui vender o o peixe para vocês que o teste é bacana né antes de explicar a conta tá vou mostrar uma uma outra aplicação né então Obrigado né Obrigado teste bacana o
artigo está na descrição aí é é é legal porque se agora vale a pena né Eh olhar aqui o o método Né vale a pena aqui cadê a sessão de métodos Vale a pena ler tá porque aqui tem ó ele explica o que que é análise de correspondência né E e aí é legal assim quando se você for usar análise de correspondência em algum artigo você pode se basear aqui nessa descrição tá vendo esse parágrafo aqui ó eh é a descrição legal de uma aná correspondência bem didático tá eh aí aqui como a análise de
correspondência É simples só tem duas Variáveis né É obrigatório apresentar o resultado do Pi quadrado né então só dá para esse gráfico aqui ó ele só é válido porque o q quadrado é significativo tá então em outros artigos o cara apresenta o gráfico e na na legenda do gráfico ele coloca o valor do que quadrado p e tal para mostrar que o gráfico é significativo e por isso justifica interpretar tá eh Então é só isso é o mínimo que você tem que fazer né numa análise de correspondência É apresentar O valor do q quadrado e
aí usa o gráfico tá beleza uma outra aplicação aí já mais de uma análise de correspondência múltipla é desse artigo aqui 2020 fecho esse abro esse esse artigo aqui 2020 que é uma associação entre bruxismo né e bruxismo insônia e apneia numa amostra representativa de São Paulo tá eh esse esse estudo né escrito por um grupo aqui então Associação ó bruxismo e sua Associação com insônia e apneia numa população de São Paulo então bruxismo se Você tem ou não e insônia se tem ou não e apneia tá então são todas variáveis categóricas e é um
estudo de associação então né e eh tem a ver com que quadrado e e usa bastante análise de correspondência e o n é grande né aqui o tamanho de Amer é grande Tá e aí a gente pula aqui a introdução porque não importa o artigo está na descrição blá blá blá e fala lá do da relação das variáveis teórica enfim né foram feitas outras análises aqui ó foi feita a Regressão logística foi feita a análise de árvore enfim mas não importa Mas o que importa aqui é o método análise de correspondência usando análise de homogeneidade
que é o romans né então aqui a gente aqui foi usado uma análise uma análise de correspondência múltipla tá por isso que chama romos beleza a gente pula aqui as tabela aqui que que não importa Mas o que importa é o gráfico né Vai lá a tabela aqui o gráfico Eh essa carinha do gráfico deixa até aumentar mais aqui a carinha do gráfico aqui né eh e aí o que que esse gráfico mostra né você tem ó você tem a variável IMC né múltiplo é duas mais de variáveis mais de duas variáveis só isso tá
então o que que esse perfil tem tem o IMC das pessoas tem o insônia né tem o grau de apneia que é medida pelo ih número de eventos por hora o grau de apneia a presença de bruxismo ou não e o sexo das Pessoas e aí colocou-se essas categorias e foram criadas três perfis tá vendo que o desenhinho até feito meio paint brush mesmo tá E aí o que que seria o primeiro perfil ó São pessoas que dormem bem né boa qualidade de sono entre 20 e 35 anos eutróficas né e com o ih menor
que CCO ou seja não tem apineia então esse grupo aqui é o grupo tudo bem né são as pessoas ok né então elas as categorias se agruparam né nesse plano aqui as categorias se agruparam e esse é o grupo Das pessoas ok esse grupo aqui ó são as pessoas de 50 80 anos mais velhas e obesas e com os graus de apneia mais elevados né todos os graus acima de entre 5 e 15 maior que 15 então todo mundo aqui é apneico obeso e mais velho é é o outro grupo tá e tem um grupo
intermediário aqui né Tem um grupo intermediário que são ah onde entra o bruxismo e ônia né e a e o sobrepeso então aqui ó você tem os homens aqui embaixo ó homens né Eh os Homens não tem não tem bruxismo tá então esse no seria o bruxismo não tem bruxismo tem algum sobrepeso eão entre 30 35 e 50 anos tá entre 35 e 50 anos e tem diagnósticos de insônia tem algum eh eh algum algum reclamam um pouco de insônia tá então assim o o aqui dá para ver que o homem de meia idade não
tem bruxismo tem um pouquinho de insônia e por sobrepeso né E e essa insônia é relacionada com sobrepeso aí o artigo descreve assim que essas pessoas aqui Jovens tá tudo bem conforme elas saem eh elas deixam de ser jovens Elas começam a ter para lá para 35 anos né o isso também o comentário do Bruno é bom os os GR leppers estão pertos do homem né então nessa amostra representativa de uma população de São Paulo né dá para população de São Paulo né a a maior parte dos good S leppers são homens beleza e jovens
né aqui são são jovens tá quando quando a idade aumenta entre 35 e 50 o o homem não tem Bruxismo começa a ter um pouquinho de insônia e começa a ter sobrepeso E aí Isso aqui caminha conforme ele vai ficando mais velho né Eh ele vai ficar com apneia e obeso Então esse é o caminho do homem tá E e aqui aqui está está se propondo um paralelismo tá entre os good leppers quando você é jovem e homem quando você tem começa a ter um pouquinho de sobrepeso né a variável crítica que é sobrepeso e
a ausência de bruxismo e quando você fica velho você Fica penco tá já as mulheres é diferente ó as mulheres elas elas estão mais próximas das duas questões de bruxismo né então a mulher tem uma proporção maior de bruxismo e uma proporção maior de insônia né também então e eh São que a gente chama de endofenotipo são endofenotipo tipos diferentes você tem um endofenotipo masculino que o cara começa a ter insônia porque tá tendo sobrepeso né E isso evolui pra apneia E você tem o Caso da mulher que ela começa a ter insônia porque tem
bruxismo isso não necessariamente evolui para apneia tá não não não evolui PR apneia tá por aí vocês estão falando uma coisa do do eixo por que que esse gráfico não tem eixo porque o eixo é irrelevante o que você tem que considerar é a proximidade das categorias o eixo O que quer dizer eixo não quer dizer mais gravidade ou menos o eixo é completamente tá o que você vai criar de associação a Associação está na proximidade dos pontos daqui a pouco eu mostra a conta aí você vai ver que o eixo não importa tá tanto
é que em vários gráficos de anacor não se põe o eixo porque para não não chamar sua atenção tipo ah o que quer dizer esse esse Zero O que quer dizer esse eixo que vai 0.2 não importa o que importa é a proximidade dos pontos quanto mais próximos os pontos mais Associados eles são tá aí a pergunta do do Felipe o alfa de cromb você só Reporta na análise de correspondência múltipla tá na simples você só vai usar o que quadrado não não tem Alfa de cromb na na análise de correspondência simples só na múltipla
depois eu vou explicar o porquê tá então aqui eu estou dando uma ideia de interpretação tá e e eh é importante notar que esse essa essa descrição desse resultado como se fosse eh eh temporalmente o efeito da idade temporalmente afetando os grupos isso não é resultado dessa análise Isso É uma interpretação que os autores estão fazendo tá como é um dado populacional representativo eu estou por isso que é uma análise qualitativa eu como pesquisador estou dizendo que o o homem jovem quando ele é bom dormidor o homem a as pessoas em geral jovens né dormem
bem quando você fica de meia idade tem uma separação entre homem e mulher o homem começa a dormir mal por causa do sobrepeso e a mulher começa a dormir mal por causa da do bruxismo e quando o Homem fica velho ele vai ficar com a pineia e a mulher não necessariamente Isso é uma interpretação desses autores tá você pode discordar da interpretação desse gráfico completamente mas o gráfico é o mesmo né o que vai mudar é a fazed dura desses desenhos aqui desses perfis Tá mas o gráfico é o mesmo tá bom você pode construir
uma interpretação diferente tá isso que é legal da análise de correspondência Isso é uma análise qualitativa e é muito legal convenhamos É muito legal tá então espero que vocês tenham pego as potencialidades dessa análise tá eh porque é muito interessante mesmo tá então assim ela complementa essa análise aqui ela é depois tem a análise eh a regressão logística tem outras análises antes mas essa aqui dá uma complementada legal sabe no nos dados né aqui o biplot e tal né Eh então espero que vocês tenham entendido essas duas aplicações tá de Uma análise corresponder ência simples
e uma análise múltipla tá é bem legal bem bem bem legal né então acho que eu consegui vender para vocês a importância da análise que é muito boa né convenhamos é muito boa então a a você ter esse grau de explicação técnico do perfil quanto mais conhecimento teórico da área você tem melhor fica a descrição do perfil isso tem muito a ver com a análise qualitativa então para quem er por Exemplo da área da antropologia né antropologia tem uma técnica muito própria da área né que é a ah etnografia né a técnica da etnografia foi
criada dentro da antropologia quanto mais conhecimento do do público que você quer fazer a etnografia Você tem quanto mais conhecimento vivencial você tem melhor fica a descrição do perfil mais preciso fica melhor ficam as suas hipóteses A partir da análise qualitativa o que eu tô fazendo aqui é Uma uma etnografia entre aspas epidemiológica de um conjunto de pessoas de uma amostra representativa de São Paulo né então estou estou criando isso né para isso você tem que ter conhecimento Clínico da área né da área de bruxismo da área de insônia enfim você tem que ter conhecimento
Clínico você tem ter conhecimento epidemiológico né O que é muito legal por isso que os autores são dentistas né e e profissionais da área de sono né para Integrar esse tipo de explicação é muito legal gente então convenhamos né convenhamos que a Eu gosto da análise de correspondência porque claramente Dá para ver que a análise de correspondência ela deixa a a linha entre qual quante bem tênue sabe e E aí coloca um peso também na na no estudo da teoria né então por exemplo se você pode saber apertar os botões e fazer uma anacor se
você não tem estofo teórico da área você não consegue criar o perfil Você cria um perfil de uma forma muito muito tosca assim você não consegue ficar bem o perfil né então o o o a análise de correspondência se ela é bem feita ela exige muito do pesquisador do ponto de vista teórico para construir os resultados né para construir os perfis certinhos né É muito legal muito legal tá então agora atendendo a pedidos Vamos à análise né eu vou dar uma ideia de como funciona a análise da análise de correspondência tá da na cor então
a a Vamos dar uma mostração uma ideia da análise né porque envolve também uns conceitos de álgebra linear eu não vou entrar no no fundo da coisa mas D para dar uma ideia tá vamos imaginar que eu tenho o meu banco de dados tem duas variáveis tá vamos imaginar aqui um grupo A BC e uma idade eu categorize as idades de das pessoas em jovem adulto e idoso por exemplo tenho três categorias tá Então eu posso fazer um um vou o meu primeiro passo é fazer aqui a tabela de contingência a BC eh jovem adulto
e idoso aqui né botei as minhas categorias bonitinhas aqui né e e dentro de cada categoria eu vou ter o número de pessoas A a minha variável observada Tá eu vou chamar isso aqui de n vai ser o n1 1 por que que é um porque a primeira linha A primeira coluna né aí N1 2 n13 n21 N2 2 n23 n31 n32 e n33 tá só que é o número de pessoas em cada um estou atribuindo a uma variável tá bom E aí eu vou ter os totais Total tanto por linha quanto por coluna total
aí o total eu vou chamar né aqui na coluna né coluna C1 C2 C3 e na linha L1 l 2 e L3 tá é é isso tá até aqui tudo bem É o dado descritivo né é o número de pessoas aí assim para cada Para cada casela né para cada casela por exemplo para esse número o que que eu tenho o que que eu tenho que calcular eu tenho que calcular o quanto que esse número aqui contribui para a linha e para a coluna é isso que vai me dar a ideia da distância né então
o o gráfico do bipot o o que o o eixo quer dizer não importa porque os eixos são distâncias então no gráfico do biplot né os eixos são Distâncias os eixos são distâncias são distâncias entre as categorias essas distâncias o nome dela desse desse atributo dessa quantidade é similaridade similaridade entre as categorias tá a similaridade entre as categorias então a distância entre uma categoria E todas as outras vai é uma matriz de similaridade similaridade entre as categorias tá no no linguajar da An Essa similaridade ela tem um um nome né que é Chamado d quadr
d qu isso é a similaridade o que eu vou até onde a gente chega para calcular o d quadado tá E aí você vai ver que o d quadado na verdade é só uma distância então não importa o que tem o eixo X e o y o que importa é a distância entre os pontos tá então assim meu gráfico final né quando eu for fazer o gráfico final do da An cor e vai ter aqui o grupo a b c e vai ter lá o jovem adulto e Idoso vai ter aqui o jovem o adulto
e o idoso por exemplo tá não me importa o que tem no no eixo X e o y porque isso aqui são distâncias tanto é que nos programas eles chamam isso aqui de D1 dimensão 1 e D2 dimensão 2 não não não tem nome né na análise fatorial você dá nomes PR os eixos porque os eixos são os fatores aqui não aqui você não tem fator o que você quer quantificar é só a distância entre os pontos e essa distância é esse D2 Né você usa o eixo meio que para colocar o as categorias só
é só um local onde você tem uma referência um zer zer aqui para colocar as categorias Só isso tá e o eixo você não usa para nada tá E então vamos ao cálculo do vamos chegar tentar chegar nesse D2 então A ideia é você descobrir o quanto que essa esse número contribui pra linha e pra coluna tá então a a primeira coisa que a gente faz é um negócio que chama perfil da linha perfil da linha e depois o perfil Da coluna né o perfil da linha ó eu vou pegar esse N1 veja que eu
vou fazer isso para cada valor Tá eu vou fazer isso aqui só para um valor de exemplo mas eu tenho que repetir esse mesmo processo para todos os outros tá então o perfil da linha vai ser o n11 dividido pelo L1 que é o total da linha né quando eu faço essa conta o que que eu vou descobrir eu vou descobrir o quanto que O n11 contribui para o total né então isso aqui é a contribuição do n11 para o total na linha e eu vou fazer o mesmo na coluna Então seria o n11 sobre
o C1 que é a contribuição na coluna né Eh tudo bem gente tudo bem pegaram essa ideia básica né então ó repare e eu vou repetir na verdade quando eu fizer o perfil da linha eu não vou ter um número só eu vou ter um número para essa casela mas eu ter que repetir para todas as outras né ou seja isso aqui isso aqui Vai me gerar uma nova tabela né E quando eu fizer da coluna vai me gerar uma nova tabela eu vou ter uma tabela pro pros perfis da linha e uma tabela pros
perfis da coluna ou seja a contribuição de cada elemento pra linha e pra coluna vai me gerar duas tabelas vocês conseguiram imaginar que eu vou repetir essa conta aqui em todos tá eh conseguiram imaginar gente tá bom então isso é uma parte da análise aí outra parte da análise é é Ver a contribuição das Linhas para o modelo e a contribuição das colunas para o modelo tá então as linhas como um todo e as colunas como um todo então eu vou ter que calcular também a o perf o aí não chama perfil de linha chama
média média da linha e a média da coluna tá o que que seria a a eu esqueci de colocar um valor eh Welder né seria Quantos por cento aquela casela contribui pro valor da linha e da coluna isso eu só não vou Multiplicar isso aqui por 100 para transformar em porcentagem Mas é uma ideia a proporção de contribuição daquela casela pra linha e pra coluna tá é a proporção de contribuição eh tem um valor extra aqui que é o geral né que é quando eu somo todo mundo aqui ó eu vou ter um valor G
esse valor G é de geral tá o que que seria a média da linha a média da linha é o valor da linha L1 dividido pelo G que é o total né e a coluna seria o C1 so G tá isso aqui Também vai gerar uma tabelinha isso aqui também vai gerar uma tabelinha tá bom eh e de novo então eu vou ter a contribuição da lha de cada elemento paraa linha para coluna e a contribuição de cada linha para o total e de cada coluna para o total tá tendo esses valores né eu vou
conseguir calcular três eh três resultados que são os principais resultados da anacor tá isso que vai me gerar o D2 Para eu conseguir eh a tabela da média é menor essa tabela aqui é menor essa tabela é pequena em relação a essa mas também gera uma tabela tá a tabela do perfil da linha e da coluna tem o mesmo tamanho da tabela geral a tabela da Média da linha e da coluna é menor tá mas vai ter também aí com base nesses valores eu vou criar três resultados o primeiro resultado ele chama Massa massa tá
o que que seria a massa a massa ele é ela é calculada por linha e por coluna né também então ela seria o peso de eu não vou chamar de peso porque Parece coisa de ele lembra coisas de física Tá mas seria a contribuição contribuição ã de cada linha na verdade a contribuição de cada casela né porque é a linha em coluna Contribuição de cada casela para o modelo Total tá então como cada ponto cada cada casela vai ter uma um perfil na linha e na coluna quando eu combinar esses dois perfis vai me gerar
a massa que é a contribuição de cada casela para o modelo tá a a massa Ela seria a você você vai pegar por exemplo o o n11 ele tá aqui e o n11 tá aqui tem o perfil da linha e da coluna né então o o Aí assim a massa para feita para uma uma casela porque de novo você vai ter uma tabelinha da massa né a massa feita por modelo todo seria o n Opa seria o n11 a contribuição do n11 da linha mais o n 1 1 da coluna dividido pelo G que é
o geral Então seria a contribuição dessa casela para lha pra coluna ponderado pelo geral né E aí eu vou fazer pro N1 2 n13 e para todo mundo tá então isso aqui Também vai gerar uma tabela é a massa tá outro valor importante é a inércia aí veja as coisas com física né a inércia a inércia Ela seria a importância ou a contribuição né eu vou vou colocar o mesmo nome para não porque é a mesma coisa eu não quero criar palavras diferentes a contribuição contribuição da variável para o modelo tá lembra que essas três
variáveis aqui ó essas três categorias é A variável grupo né E essas três aqui é a variável idade né Eu quero saber a contribuição da variável para o modelo não não das categorias da variável toda aí é a inércia aí é aqui no caso a gente vai ter duas inércias que é a inércia do grupo e a inércia da idade tá então isso também é relacionado com os perfis de linha e coluna né só que aí não só de uma uma variável mas de da de todas as categorias da do grupo e depois da idade
tá é a contribuição da inércia a inércia Ela é calculada eh através da massa você vai usar a informação anterior da massa da de uma certa linha né vezes a a distância da linha a a massa da linha é na verdade é a massa da linha a vezes a massa da linha B né o a b e a massa da linha C linha C isso aqui eu vou fazer para para descrever a massa do grupo né Depois eu tenho que fazer o mesmo paraa Idade então é a massa do da do J do a e
do i tá a mesma ideia então vai me gerar duas inércias tá bom e tem um outro valor importante que é o nosso famoso já conhecemos o Vel aigen V que é o alto valor né o a v ele é a importância da dimensão pro modelo de novo contribuição não é Import dig contribuição para ficar tudo igual contribuição da dimensão para o modelo Tá então o que o que que representa a inércia total é você tirar a média das duas inércias ou a média aqui no caso eu tenho duas variáveis então eu tiro a média
das Duas né se você modificar a inércia e transformar ela em porcentagem você vai ter a explicação Geral do modelo então a inércia média que é a média de todas as inércias de todas as variáveis tá então a a ideia da inércia média é uma medida da contribuição da na Verdade da proporção proporção da variância dos dados variância dos dados que o modelo Explica explica tá então a a ideia da inércia média meda disso o quanto que o modelo geral capta dos dados tá é uma medida de de qualidade Geral do modelo tá inerci M
Mas você pode apresentar a inércia por variável também se você quiser saber qual variável contribui mais pro modelo Né no no no programa dá para ver ele faz um grafi Quinho disso tá então o eigen value é a contribuição da dimensão pro modelo porque se você lembrar que o o biplot é um gráfico com duas dimensões dá para fazer um cubo né só que aí fica ruim de interpretar então em geral na na em geral no biplot é um são duas dimensões só né então você vai ter a dimensão D1 e a dimensão D2 né
Cada dimensão vai ter um eigen velue né vai ter o igen o o aen velho 1 e o eigen Vel 2 O que você quer é que os eigen velos sejam parecidos o ideal aqui é que eles o E1 seja igual ao E2 não precisa ser exatamente igual mas tem que ser parecido tá por quê Porque se uma dimensão explicar muito mais dos dados do que a outra né os os as categorias vão ficar todas muito perto aqui da dimensão ó as categorias ficam perto de uma dimensão aí fica ruim de enxergar o as associações
tá se o se a dimensão dois explicar muito melhor que a um os Pontos vão ficar tudo tudo perto aqui tá quando as duas dimensões TM a mesma explicação o as categorias ficam aqui no meio E aí fica mais fácil de interpretar tá então o Val é uma medida disso então assim ag em geral você não reporta mas se se você bater o olho e os dois valores tiverem parecidos aí quer dizer que os dados vão ficar mais ou menos no meio do gráfico né então legal tá então esse esses três esses três valores são
a os principais valores que Você acaba reportando numa análise de correspondência é a tabelinha da massa os valores de inércia e o igen v nem tanto tá o aen velho ele é muito representado pelo Alfa de cromb né o alpa de cromb ele é uma medida substitutiva do iG vue então no o spss faz isso o jamovi tem um pacote que faz o outro não tá mas o o o eigen value ele pode ser substituído pelo Alpha de krbe tá que é uma medida de Equilíbrio Das dimensões para ver que o se o gráfico fica
no tá então em alguns artigos que US usaram o spss Você tem o off de cromb em outros você vai ter a massa e a inércia né a a ideia da in inércia média é legal né para ver o quanto a porcentagem da variância dos dados que o modelo explica é legal né Eh então acho que assim do do do ponto de vista da qualidade dos indicadores de qualidade a gente já conseguiu descrever bem tá E aí falta só um detalhe o que Que seria a similaridade né que é o d quadrado o d quadrado
ele é uma relação desses quatro valores do perfil da linha e da coluna e da Média da linha e da coluna quando você combinar esses quatro valores e aí para combinar você tem que combinar isso por produto interno que é um negócio de álgebra lineá eu não consigo explicar isso sem gastar mais duas horas de aula né mas eh dá para dar uma ideia deixa eu tentar dar uma ideia como que a gente chega no no D Quadrado tá eu não eu não vou explicar por que é assim porque porque aí eu tenho que entrar
na teoria do que que é um produto interno tá mas por exemplo para eu calcular o d quadado de um [Música] eh de uma linha ou uma coluna eu vou fazer o seguinte ó para eu calcular o d Quad entre eh L1 e L2 o d quadado do L1 com L2 o que que seria esse D Quad com L1 L2 ó eu vou ter a categoria A e a categoria B né Elas são L1 L2 certo eu quero calcular a distância entre elas tá Mirela o valor de de D quadrado tem a ver com a
verosimilhança do q quadrado não não não tem nada a ver com Q quadrado né Ele é uma medida de distância outra mesmo então assim ó imagina que eu tenho duas categorias A e B podia ser o a e o J eu vou pegar essas duas aqui tá como exemplo eu quero saber a distância entre elas eu quero saber a distância entre o a e o b quanto que Elas vão estar distantes no gráfico tá isso é representado pelo L1 L2 bom porque elas estão aqui na linha né então eu quero calcular o D2 do L1
L2 tá como que isso é feito você tem que fazer o o o cálculo disso é o perfil perfil e L1 o perfil da linha 1 menos o perfil da linha 2 dividido pelo pela média do perfil da linha aí como é que a gente a gente chega Nisso vai ficar meio vago mesmo tá porque eu tenho que explicar o eu tenho que explicar umas coisas a mais me acho que não cabe Tá mas só para dar uma ideia de que sai o número eh o que o que que isso seria na prática vai ser
o eh n1 1 divido por C1 eh menos n21 divido por C1 a quadrado então o que que eu vou fazer ó eu vou pegar eu tenho o N1 e o n21 né ó eu tenho esse aqui que é da da Da categoria A e esse aqui que que é da categoria B né eu vou pegar ã a contribuição desse na a contribuição do N1 na coluna a contribuição do n21 na coluna tirar a diferença entre eles elevar ao quadrado por que que eu elevo ao quadrado porque eu quero uma distância porque eu não quero
distância negativa não existe distância negativa então eu elevo todo mundo ao quadrado o que que vai o que que é esse valor aqui esse valor é a Distância entre a e b as categorias A e B em respeito em respeito a eh coluna J então eu tô calculando aqui ó a distância entre o entre o a e o b em relação à coluna J aí eu quero calcular a distância A e B em relação à coluna A o que que vai ser N1 2 so C2 - n22 so C2 qu né Ou seja eu vou
somar isso aqui com uma outra distância e depois somar com Uma outra distância e depois eu vou fazer isso tanto na na na coluna quanto na linha eu vou fazer tudo isso e vou somar tudo isso no final essas somas todas vão me dar essa distância né aí eu vou somar todas essas distâncias né do A e B em relação a linha e coluna eu vou somar todas essas distâncias e dividir pelo geral pelo tamanho geral então eu somo todas essas distâncias em relação a duas duas categorias e divido pelo geral aí vai me dar
a distância delas como Elas vão aparecer no gráfico tá tudo bem gente Vocês pegaram o vislumbre de como que seria o d quadrado tá o a similaridade né a similaridade calculada assim é isso que é computacionalmente meio pesado tá Por quê Porque se assim se você tiver muitas linhas e colunas é muita soma né vai dar muita soma e se você tiver um n Grande nossa né aí tem que somar mesmo e aí demora tá demora para fazer muitas vezes não converge e aí que dá problema essa parte Aqui que é computacionalmente pesada tá e
depois transpor isso no gráfico fazer uma uma análise gráfica disso é bem pesado tá bom essa parte mas vocês conseguiram ter um vislumbre de como funciona né a a técnica acho que isso já valeu tá Estou deixando uma referência que mostra a conta toda bonitinha e tal né mas acho que deu para deu para pegar a ideia Então veja que a A análise de correspondência ela lembra muito o A análise fatorial lembra muito então Assim Tem uma tabela que sai do Tem uma tabela que sai do no resultado mesmo que aqui que aqui aqui escrito
D1 e D2 seria dimensão um dimensão dois né Eh e aqui nos nos eixos você vai ter as categorias Então você vai ter um D1 D2 PR variável grupo e um D1 D2 pra variável idade então por exemplo vamos imaginar que aqui é jovem adulto e idoso depois você vai ter uma tabela dessa para outra variável e aqui vão ter Números Então vamos imaginar que aqui deu 1.3 aqui deu 0.7 aqui deu 0.2 e aqui deu 1.9 aqui deu 1,5 1,5 tô inventando esses números tá estô inventando esses números O que quer dizer esses números
O que quer dizer esses números são distân D2 são essas distâncias D2 dessas variáveis aqui né e o que quer dizer isso ó se você olhar aqui na primeira L na nas dimensões ó aqui deu 1,3 e aqui deu 0,7 né O que que isso Quer dizer que essa categoria J ela vai est mais próxima da dimensão um do que da dimensão do é meio que uma localização geográfica da onde está cada categoria em relação ao eixo um e dois tá então não tem espaço se eu for fazer aqui ó se eu for fazer um
gráfico ã eu vou fazer o gráfico aqui eu vou ter aqui o D1 e o D2 né o o a categoria J ela é 1.300 07 Então ela tá mais perto da dimensão 1 do que da dimensão dois ela vai tá aqui tipo 1,3 nessa dimensão e 0 1,7 na outra vai tá mais ou menos aqui ó isso aqui seria o J tá mais perto da dimensão um do que da dois né o outro ó 02 e 1.9 então 02 aqui 1.9 na outra aqui vai ser o a e o i tá à mesma distância
das duas né então ela vai ficar uma coisa assim mais ou menos a mesma distância das duas tá então esse às vezes esse Gráfico são os pontos de localização Tá bom se você quiser fazer a nac com mim é o missen tem que virar uma categoria se o missen não virar uma categoria ele não coloca tem que chamar lá botar um número para todos os missen aí ele coloca tá eh aí o que qual que é o nome de cada um desses assim na a a Então essa é uma tabela comum que aparece na anacor
mas é a tabela de localização dos pontos tá só para ter uma uma ideia do que é Ã eu acho que eu falei dos principais valores e Ah e existe um paralelismo né o o anacor é meio primo irmã da análise fatorial né Apesar deles terem usos diferentes tem uma certa similaridade então quando a gente pensa em massa né Isso aqui é meio similar à ideia de carga fatorial tá a ideia não não não quer dizer que é a mesma coisa mas a ideia é parecida né é a contribuição de cada casela pro modelo total
que que seria a Carga fatorial né é a contribuição de cada variável pro modelo né quando você pensa em inércia você vai pensar na comunalidade comunalidade tá a comunalidade é a importância eh de cada aqui na inércia né a contribuição da variável pro modelo a comunalidade é a importância da da categoria né da variável pro modelo também e E aí você tem o eigen velho nas Duas né que a a a a importância da dimensão e aqui a importância do fator do do da do fator isso Aé velho né então ah Rosana você não viu
isso porque na época A análise de dado categorizado ainda não era tão famosa porque computacionalmente é muito demandante né então aqui isso aqui é na anacor isso aqui é no no Efa análise fatorial tá então tem similaridade dessas coisas tá aqui o ame value na na Da dimensão e Aqui é do fator tá bom se duas categorias T um D2 na horizontal e supondo o mesmo D2 na vertical a interpretação Seria a mesma sim sim porque é proximidade né e como é uma distância tanto faz onde onde essa distância vai est se é em D1
ou D2 né O que importa é a distância entre os pontos né tanto faz tá bom eh tudo bem gente Vocês pegaram a ideia então assim eu eu dei uma aplicação de Assim eu consegui vender para vocês que a técnica é bacana né Eu dei um vislumbre de como é a conta eu cheguei até bem perto de como é a conta tá E agora falta mostrar no computador como é que faz né E essa é a parte a gente encerra a a a discussão de análise de de análise de correspondência é por isso que eu
explico essa técnica depois da fatorial porque muitas das coisas são similares Aí fica fácil tá então Eh vamos ver aqui mais um um detalhe essa técnica é fantástica né Não não e de novo a a diferença entre pesquisa qual e quante é completamente artificial completamente para de achar assim ah eu sou um pesquisador por isso que me me incomoda o nome eh data Scientist analista de dados me incomoda esse nome né como é que você vai fazer análise sem dados sabe não não não tem velho e eh é tipo é muito redundante né mas enfim
eh e e e o povo que faz Pesquisa qualitativa também é um data Scientist é um analista de dados né A questão é que o método é diferente então por exemplo eh vou vou até falar um uma palhinha aqui de aplicações ã a eu mostrei já duas aplicações mas uma aplicação importante aqui é em entrevista entrevistas por exemplo imagina que eu quero entrevistar uma e eh perfil de entrevistas né você fazer perfil de entrevistas por exemplo eu estou numa Escola tá vamos imaginar que minha eu estou dentro de uma escola e eu quero entrevistar um
aluno que sofreu bullying por exemplo eu quero avaliar o fenômeno do bullying na escola tá eh e eu quero achar um aluno que sofreu bullying é difícil né assim mas você vai sortear um aluno você vai perguntar quem quer fazer parte da minha entrevista sofreu bullying Duvido que você acha alguém né ou talvez Pega aquele moleque desgraçado que é troll né que vai lá Para inventar né Eu quero descobrir eu quero fazer uma entrevista com alguém eu quero fazer uma análise qualitativa né meu foco é qualitativo tá bom eh que que eu posso fazer né
para achar o melhor candidato ou os melhores candidat né uma estratégia que o povo da pesquisa Quali deveria fazer mas não faz dá muito mais trabalho seria o seguinte propor um questionário questionário com questões fechadas Questionário fechado tá em que você coloca questões eh sobre Bullying mas mas não coloca diretamente você sofreu bullying você você cria por exemplo situações né Eh você descreve assim o qu o quão frequentemente ou isso acontece com você e aí coloca uma situação tipo ah os meninos ficam te empurrando sei lá né então você descreve aqui uma situação um uma
situação dois e uma situação três situações onde é Possível Onde existe bullying né mas você não diz que é bullying você só pede pra pessoa falar sobre a situação e aí a pessoa descreve em em categorias né Ela diz que é pode ser ordinal tá ela diz que não existe ne não existe Ela diz que existe pouco e existe muito por exemplo três categorias tá E aqui eles fazem a mesma coisa ne pouco e muito né que n n n e pouco e muito tá aí V imaginar que eu fiz três questões aí o que
que eu posso fazer eu Posso pegar fazer um bipot né Aí cada pessoa Responde lá tem várias respostas né então no meu banco de dados vai ter lá o sujeito um sujeito dois até o sujeito n vai ter o resultado da questão Um em que o resultado da questão pode ser N E P ou M então uma variável categórica ordinal Mas tudo bem né coloca aqui questão 1 do e e três e eu vou fazer um bpot questão Um Questão dois questão três e coloco aqui aqui vai ter o o ne Eh P e m
de uma uma certa variável né de uma questão vai ter lá o n o o ne p e m de outra questão né E vai ter o ne p e m de outra questão também né Tudo bem o que é esperado é que se a grupe né é o que o que é esperado é que se agrupe aqui ó Quem sofre muito de de alguma coisa vai sofrer muito dos outros em expectativa né vai sofrer muito tá eh aí o que que você vai fazer Tem uma outra coisa fantástica que aí só dá para fazer
mostando no programa é que isso Aqui é o bipot é o bipot das categorias isso aqui é o biplot das categorias de cada variável né porque aqui vai ter o o que não sofre não existe o pouco e o muito de cada um né dá para você associar esse gráfico com um outro gráfico que ele gera também né que é a localização de cada indivíduo eu consigo localizar cada indivíduo nesse gráfico e aí vai ter uma nuvem de ponto se você aplicou em muitas Pessoas vai ter muitos pontos né aí ó não não tem o
perfilzinho aqui ó tem esse perfil aqui que é o muito muito muito né você recorta esse esse gráfico cola em cima do outro e aí vai ter vai ter as pessoas que vão cair aqui ó aí você pode pegar esse cara aqui ó e sortear um né E aí você vai atrás dele aí você consegue entrevistar você consegue achar as pessoas né dentro do grupo E aí você consegue entrevistar quem você quiser muito melhor do que Pegar a pessoa ao Léo aleatória tá então por que que você na pesquisa qualitativa não tá fazendo isso aplica
um questionário genérico para gerar perfis Gerais sabendo que existe o perfil geral depois você consegue entrevistar uma pessoa de cada grupo pega uma pessoa também que nunca sofreu entrevista também a pessoa né não é um tipo de amostragem isso não é uma amostragem Você tá criando uma segmentação né na verdade isso também Não é uma pesquisa de classificação classificação é mais mais é um modelo preditivo ISO aqui na verdade é uma pesquisa de segmentação eu estou segmentando a minha amostra em perfis tá não é amostragem amostragem você tem que fazer antes da coleta bom aí
o que que acontece muita pesquisa qualitativa o cara tem um n pequeno e ele tira as entrevistas da bunda né ele pegou o vizinho para entrevistar ele perguntou para alguém Você conhece alguém que usa tal produto por não né e não você tem você tem que ir numa amostra grande pegar um questionário fechado com poucas perguntas pergunta nas pessoas tira o perfil e aí acha uma pessoa dentro do perfil e entra em contato com ela para aprofundar o perfil por meio a entrevista né mas dá para fazer muita coisa mas muita coisa O povo não
faz Por ignorância por desconhecimento metodológico mesmo né povo da pesquisa Qual fica encastelado naquele negócio quando na verdade tinha que estudar Isso aqui também é muito legal e o povo da pesquisa quante sobretudo quem trabalha com questionário tem que aprender pesquisa qualitativa também né então por que que você diz que o cara está com traços depressivos só porque ele deu mais que 14 numa escala né O que qual que é a correspondência qualitativa entre o resultado numa escala e o que a pessoa tá sentindo de verdade isso é um Tópico de pesquisa qualitativa né que
o povo que fica aplicando questionário loucamente não ignora completamente tá temos que diminuir esse GAP temos que diminuir esse GAP entre a pesquisa qual quante mostrando que é uma falta é uma óia ignorância você separar dessas áreas tá você pode ser lá o cara namas gratidão que tem lá a sua área qualitativa e tal gosta de entrevistar sentir o A Voz do Povo conversar com todo mundo sem uma forma uma formação Mínima em análise correspondência você não vai conseguir tirar nada de de ouro dos seus dados né vai parecer muita coisa Poxa a pessoa falou
duas horas que que será que eu consigo tirar de informação dessas duas horas de conversa análise qualitativa aqui a A análise correspondência ajuda muito né como que eu acho o indivíduo ideal para entrevistar análise aqui análise correspondência Então você só tem a ganhar tá tem temos um um segmento do Povo da psicobio que é o povo da pesquisa Quali por favor estude essa técnica muito legal legal tá eh muito bem então já já consegui vender o peixe para vocês disso também vamos agora fazer dura no programa né vou começar mostrando no jamovi o jamovi tá
meio bugado tá eh assim melhoramos muito do ano passado já teve uma melhora tá porque antes tinha que você tinha que pegar duas variáveis fazer um k quadrado salvar a Tabela aqui fazer um outro banco de dados dava dava um trabalho tá tem um pacote que chama meda meda me dá meda né esse esse pacote tá eh eh na descrição do vídeo tem a descrição do pacote tem um site inclusive que é muito legal porque ele coloca os exemplos tá Ah o Bruno em que aspecto os perfis da anacor são diferentes de clusterização completamente diferentes
eh na verdade você tá Você tá confundindo dois nomes segmentação e Clusterização são coisas diferentes tá isso aqui é importante de novo o povo na área lá no no nas ruas fica usando a mesma palavra para coisas diferentes Então vamos lá e agora at um bom momento para falar isso então vamos imaginar assim ó eu tenho um banco de dados eu tenho aqui os meus sujeitos S2 S3 até SN e eu tenho as minhas questões minhas variáveis v1 V2 V3 até o VN tá E aqui dá para juntar as três técnicas o Que que o
que que a análise fatorial análise fatorial faz aula passada que que a análise fatorial faz ela pega as variáveis agrupa essas variáveis num fator E aí ela agrupa essas variáveis num fator E aí você pode salvar esse fator no banco de dados como uma coluna lá o PCA e esse fator aqui vai ser uma variável contínua o fator é sempre uma variável contínua tá análise fatorial o que que é Análise de CL clusterização não tem nada a ver com segmentação é completamente diferente do ponto de vista estatístico tá o que que é análise de cluster
o que que é clusterizar eu não não falei de análise de cluster eu falo isso no curso dois tá mas clusterização é você não agrupar as colunas você agrupa as linhas você agrupa as pessoas eu vou agrupar as pessoas aqui em cluster no cluster a no cluster b e isso vai me gerar um cluster A ou B que é uma variável categórica tá então o o clusterização É você agrupar as linhas de um banco de dados sendo que as linhas são os sujeitos análise fatorial é você agrupar as colunas do banco de dados sendo que
as colunas são as variáveis tá isso é clusterização clusterizar é isso tá segmentar não tem nada a ver segmentária é o que a análise é a análise de correspondência produz né na A a anacor você não salva nada no Banco de dados nada tá você vai pegar duas variáveis pelo menos duas variáveis que são categóricas que tem lá categorias e pegar essas duas variáveis e colocar no bipot ter o x y z de um grupo e o x y z de outro isso é segmentar então Ó esse x z e y né então quando eu
faço esse gráfico do bipot e associo o bipot com o gráfico dos indivíduos dos indivíduos então eu crio Criei um perfil aqui ó x y z e depois Vejo aqui no gráfico Quais pessoas que correspondem isso é segmentação isso é segmentar tá muita gente coloca segmentar como clusterizar como sinônimo e não é não é sinônimo tá errado tá clusterizar é aplicar análise de cluster e análise de cluster é completamente diferente da análise de correspondência o que o que a análise de correspondência faz é segmentar você não vai salvar no banco de dados os segmentos tá
por qu porque Isso aqui é qualitativo eu posso discordar eu posso discordar do do do seu método de segmentação né E dizer ah não essas pessoas não fazem parte desse perfil porque eu não concordo com esse perfil eu acho que tem que ser as pessoas T que ser agrupadas usando esse perfil aqui ó Então na verdade você vai pegar essas pessoas tá então a segmentação é uma coisa mais qualitativa a clusterização não se você pegar o mesmo banco de dados e aplicar o Mesmo método de cluster você vai segmentar nas mesmas pessoas não tem não
tem dúvida tá se você usa o mesmo algoritmo com os mesmos dados gera a mesma variável igualzinha tá segmentar não a segmentação pode dar diferente porque é qualitativo porque quem cria é você tá então é muito boa sua pergunta pergunta Bruno muito boa pergunta porque permite esse comentário que é muito importante é um comentário técnico mas é importante tá Eh então segmentar você não salva no banco de dados né segmentar ele é um é um resultado resultado ã dos elementos dos sujeitos representativos representativos de um perfil aí eu falo perfil no ponto de vista na
cor perfil qualitativo Por que que é qualitativo porque veio dar na cor e você que você Que escolhe o perfil Você que escolhe tá isso é segmentar clusterizar é outra coisa de novo você vai ouvir por aí a galera coloca como Sinônimo Deixa Tá mas não é sinônimo clusterizar é o resultado de um método de cluster o resultado de uma análise de cluster e essa análise não é qualitativa o os clusters são fixos p o mesmo conjunto de dados Se você usar o mesmo algoritmo dá a mesma coisa o cluster é fixo os segmentos não
Segmentos você pode discordar do meu segmento tá você pode discordar do método da análise de cluster que eu fiz mas se você usar o mesmo método que eu vai dar a mesma coisa tá então os clusters são são são reprodutíveis os segmentos não segmentos não necessariamente tá então assim a área que usa muito essa coisa de segmentar clusterizar é área de comunicação mar administração enfim tá que é terra de ninguém convenhamos né é uma terra de Ninguém louca também a psicologia também psicologia é terra arrasada né o outro não é terra de ninguém na na
administração você gasta mais tempo tentando convencer os outros de que você sabe alguma coisa do que sabendo alguma coisa né convenhamos o povo fica muito daqu daquele formalismo lá aquela coisa hierárquica e no fundo estudar mesmo né No Duro descer a a cara no livro é pouco né administração e E economia também contabilidade salva a a muita gente vê dessa área assim contabilidade de eh administração e tal vê o patinho feio como sendo a contabilidade né tanto é que é a piada do Dilbert não sei se vocês conhecem os quadrinhos do Dilbert o Dilbert é
um engenheiro que trabalha numa empresa são piadas de tipo The Office né piadas de empresa e aí quando ele desce nas Catacumbas da empresa ele chega lá no no no inferno e o inferno tem os diabinhos Que são os contadores né mas Uma das uma das áreas mais sérias cientificamente hoje em dia é a contabilidade né Os caras estão trabalhando bem né mas enfim eh então o o tem que justificar o critério para escolher na na cor o o PCB eh O que que você o que você quer dizer com critério eh só explique melhor
um pouco isso aí tem a pergunta do laerson eu preciso fazer cálculo amostral antes de aplicar a na cor Boa pergunta então vamos pensar em amostra Para anacor não tem cálculo de amostra tá por como como a anacor não gera um p assim né Você só tem que ter o p do quadrado né quando H duas categorias se tiver mais que duas nem isso né não tem um cálculo de amostra formal mas e tem uma regra que é assim que é seguir o cálculo requerido para o q quadrado para o q quadrado então assim se
você tiver n Pequeno o que vai acontecer que o gráfico Vai ficar ruim vai ficar todo mundo muito distante né as categorias vão ficar distantes umas das outras você não vai conseguir interpretar então o n pequeno vai gerar um gráfico que você não interpreta bom segue mais ou menos o cálculo do Quad E aí tem uma observação an Não aceita não aceita zero nas Caselas se tiver um Você pode ter milhões de pessoas se tiver alguma casela com zero ele dá pau e não roda porque não tem como calcular contribuição distância ele D pau tá
então se tiver alguma alguma categoria com zero ele não roda como justifico minha escolha de agrupamento critério de distância no gráfico então a a você tá falando o perceb né você tá falando do do dos perfis né então então é é você Que decide o o a sua escolha vai ser justificada pela pelo grau de propriedade com o qual você descreve o perfil né então ah minha anacora é essa eu tô descrevendo esse perfil Amarelo né se eu mostrar que esse perfil Amarelo gera uma boa discussão uma boa interpretação dos resultados faz sentido tá justificado
é qualitativo mesmo e de novo você pode discordar do meu perfil mas você não pode discordar do dado você Pode pegar os mesmos dados e gerar uma nova interpretação então tem várias interpretações possíveis do mesmo gráfico e assim que é a pesquisa qualitativa mesmo né a pesquisa qualitativa ela V ela é vista como pouco rigorosa né Eh porque ela tem ela entre aspas aceita várias interpretações quando na verdade mesmo na pesquisa qute é a mesma coisa vde vi a última questão da prova um né Eh que eu dou o mesmo banco de dados Para todo
mundo vocês podem chegar em conclusões Diferentes né Isso é muito muito comum tá se isso acontece com pesquisa quant não vai acontecer com qu Claro que vai né no caso dos valores Perdidos na anacor qual seria uma estratégia recomendada para lidar com eles não ter eles então assim é que assim uma coisa é dado perdido outra coisa é casela com zero então se você tiver lá sua tabela né você tem lá sua tabela e uma Das caselas for Z não dá fazer não roda porque não tem como calcular D zero zera tudo toda conta tá
então tem que ter gente pode ter dado perdido mas tem que ter gente tem que ter pelo menos duas TR pessoas quro em alguma casela tá Se tiver zero não faz então é isso essa é a grande restrição da ANAC ele não aceita zero nas caselas tá Se tiver Miss Mas isso não inviabilizar a presença de elementos em todas as caselas tranquilo tá Então vamos finalmente a fazed dura Do teste ã voltar aqui no no já movi e melhoramos eu já movid do ano passado Espero que pro ano que vem melhore ainda mais né os
passinhos Estamos chegando tem o pacote meda M da meda né o pacote meda inclusive na descrição do vídeo aqui eu coloquei o site né do github do do pacote meda inclusive é legal porque ele explica ele faz um exemplo é é bem legal tá E aí Aqui tem tem várias opções mas tem a análise multivariada tem análise de componentes principais né e Tem a análise de correspondência simples e múltipla tá Ah ele faz ele faz as coisas só que o gráfico fica meio feio ainda é meio bugado tá eu vou fazer um exemplo de análise
de correspondência múltipla aqui ó você coloca né Aí ele vai pedir variáveis ativas né esse banco de dados que eu tenho aqui ó banco anacor né Eh esse banco de dados aqui ele são cinco variáveis tá na verdade elas nem São ordinais deixa eu colocar elas como nominais eh são todas nominais tá porque é tipo de trabalho estado civil eh grau de escolaridade eh sexo e e cor tá então aqui ó eu tenho eu tenho cinco variáveis e eu tenho um um monte de pessoas tá eh imagina que isso aqui é uma cidade tá imagina
que é uma cidade e eu quero fazer o perfil das pessoas nessa cidade né são todas variáveis categóricas né e Eu não quero fazer aqui quadrado dois a do eu quero fazer um perfil só né descrever mais de um perfil e tal então um um teste legal é análise de correspondência como a gente viu e é uma análise de correspondência múltipla porque eu vou fazer várias variáveis né mais de duas tá então eu coloco aqui ó as minhas variáveis ativas E aí tem um uma coisa eu vou eh veja que ele demora um pouquinho para
fazer tá vendo né porque ele tem que Calcular todas as distâncias o n é grande então não não é tão rápido tá então mesmo mesmo conseguindo fazer demora um pouco ainda tá bom então nisso nisso pagaram bem o programador do spss porque ele conseguiu fazer bolar um jeito computacional lá para fazer rápido tá ó esse é o gráfico das pessoas tá essa disposição das pessoas no gráfico né Legal Eh aí aqui ó tem a a esse primeiro gráfico é a representação das variáveis não é das categorias de cada Variável então por exemplo ó estado civil
grau de escolaridade e tipo de trabalho estão próximas são variáveis associadas tá cor e Sexo tem alguma associação também tá bom então essa interpretação não é das categorias essa interpretação são das variáveis como um todo tá isso aqui esse é o gráfico da inércia tá bom isso aqui é um gráfico que leva em conta a inércia e você vê né ó tá vendo que aqui em cima tem um número ó 13 pon eu não sei se dá para Ver porque eu deixa eu aumentar mais aqui veja veja que eles geram os gráficos Ok mas os
gráficos ainda são meio feinhos né ó aqui é o gráfico das pessoas ó veja que aqui na dimensão 1 13.35 e aqui na dimensão 2 10.06 isso aqui é inércia tá é a inércia de cada dimensão isso ficou baixa a inércia tá então e esse modelo não é tão representativo das pessoas Tá mas por um critério didático tudo bem né então aqui é a relação das variáveis E aqui é a relação das categorias das variáveis tá vendo Então olhando aqui que que perfil a gente faz né você pode escolher uma categoria por exemplo as mulheres
ó e mulheres aqui tá tá perto do Full Time Ó o homem tá mais perto do trabalho a Full Time do que a mulher né A mulher tá mais perto dona de casa o divorciado tá mais perto da mulher tem o divorci aqui e o Junior College também né os divorciados tem mais uma uma escolaridade mais baixa né o homem Casado trabalha Full Time tá vendo tá mais próximo aqui né o viúvo e tem uma escolaridade mais baixa menor que High School e o aposentado coitado tá aposentado tá sozinho aqui no canto tá a gente
fez um perfil tá bom E então dá para fazer já no jamovi o gráfico ainda fica meio mais ou menos mas e eu eu sempre acompanho os os fórums né vai ter atualizações tá anacor pode ser usado com escala liquit pode sendo ordinal a variável dá para fazer tá sendo ordinal Dá para fazer tranquilo então veja aqui né a gente gera um perfil aqui tá E aí aqui ó tem o igen velho tá vendo ele criou Até 14 dimensões mas na verdade a gente só vai usar duas né Então essas duas dimensões ó o em
velha 0,28 explica 10% da variância isso aqui que o o a inércia média né 10% da variância e e a a variância cumulativa é 23% Então na verdade a inércia total né Eh seria meio que a soma dessas duas aqui que ele Isso quer dizer o Cumulativo tá então aqui o dado descritivo né aqui ele coloca um um p valor relacionado a um que quadrado de cada variável né os todos deram significantes né veja que aqui ó a o prog ainda o algoritmo ainda está sendo feito porque isso aqui é a saída do do R
né direto tá então tem ainda algumas coisas aqui ó aqui o estiment ele coloca as massas né as massas de cada de cada variável ó né coloca aqui a questão da massa e e é isso tá Então veja que ainda O pacote de análise correspondência múltipla no no jamovi tá saindo né se você assistir a aula do ano passado não tinha isso era menos que isso mas foi foi uma evolução grande olhando a aula do ano passado para cá é uma evolução grande né Eh eh onde que tá a dificuldade desse pacote é que ele
demora um pouco para fazer né E aí tem uma dica tá ã quer ver ó eu vou eu vou eu vou tirar uma variável ó só vou tirar uma variável acho que ele vai dar erro Deixa eu ver se ele dá erro acho que ele nem vai fazer é porque ele fica com medo de dar pau deixa eu rodar de novo colocar aqui meda anál correspondência múltipla em vez de colocar eh as cinco variáveis eu vou colocar quatro H quatro ó ele dá um erro ó ele fala dados não convenientes tá Por que que dá
esse erro é porque tem uma opção aqui embaixo ó que é o número de fatores número de dimensões tá aqui ó tá cinco Dimensões e eu tenho quatro variáveis tá bom a dica é que você tem que colocar um número igual ou menor de fatores então se eu tenho quatro variáveis eu tenho que colocar quatro fatores pelo menos ou menos tá quatro fatores ou menos aí ele faz tá vendo Então tem muita gente que trava aqui porque não conhece essa dica tá o número de fatores aqui tem que ser parecido com o número de variáveis
ou parecido ou menor tá aí aí não dá erro ele demora sempre um pouquinho e faz Tá Bom coloca o gráfico no pente isso né Aí tem gente que usa arte aqui tá aí você pode fazer a sua seu talento artístico Tá bom então só só esse comentário é importante tá coloca aqui o número de fatores igual ao número de variáveis que você tá colocando no modelo aí ele faz tá bom eh Então esse esse pacote ele tem dois inconvenientes um que ele ainda o gráfico ainda não tá 100% né e o outro Inconveniente É
você viu que ele demorou Né o banco esse banco de dados real ele tem 1500 pessoas tá é um n Grande aqui ó eu peguei só só 200 deixa eu ver cadê Aqui ó eu não peguei o banco de dados completo eu peguei o banco de dados só com 200 pessoas tá eu não peguei o banco de dados real banco de dados real tem 1500 Se eu colocar aqui as 1500 pessoas para ele rodar a gente tem que sair para almoçar e voltar porque demora tá Então Na verdade aqui só tem 200 pontos se o
seu tamanho de amostra aumentar a análise vai ficar muito mais demorada tá no spss agora vou fazer o exemplo no spss que tem mais detalhes né no spss ó você vai ver aqui que o o banco de dados tem as 1500 pessoas tá vendo ó tem 1500 ele roda tá ele roda então eu espero que você assim dá um crédito pro cara né que fez o pacote tá eh porque você vê né aquele cálculo daquele D quadrado e tal demora tá então Aqui no spss eles fizeram por um milagre devia ter dado pagado mais eu
acho que o cara que programou isso aqui o o pacote do da anacor deram um pouco dinheiro para ele né aqui sai rápido tá bom E aqui dá para fazer os dois exemplos de de análise de correspondência então ó é o mesmo banco de dados mesmas variáveis eu vou fazer uma análise de correspondência simples e depois a múltipla tá no análise de correspondência simples fica aqui ó Dimension reduction Você já tem o fator né Isso aqui é análise fatorial confirmatória exploratória desculpa análise fatorial exploratória E você tem dois botões ó análise de correspondência e optimal
scaling análise de correspondência aqui é análise de correspondência simples né E esse de baixo é o romal análise de correspondência múltiplo então ó se eu fizer análise de correspondência simples né correspondên analises ele abre aqui Uma janelinha né ó linha e coluna só aceita duas variáveis né aí eu vou colocar por exemplo estado civil e tipo de trabalho tá E aí tem essa interrogação que é o número de categorias tá o o PCA fica aqui também o wer Né o PCA fica ali no no Dimension reduction também lá dentro do fator né Eh então ó
estado civil aí eu tenho que definir o define Range aqui é o número de categorias do estado civil tá assim aí você tem que olhar quantas categorias Tem Eu já sei que tem cinco categorias que vai de um a cinco tá são cinco categorias do do do estado civil então aí você tem que confirmar tá E e do tipo de trabalho são sete categorias que eu tenho então coloco aqui de um a sete e põe em update Então você tem que avisar quantas categorias tem em cada variável tudo bem né só isso E aqui no
statistics eh aqui você pode pedir ó ó perfis da linha perfis da coluna são aqueles aqueles cálculos da contribuição de Linha e de coluna você pode pedir isso para você ver tá eh e o plot acho que ele vai eh já tá marcado aqui o bipot ó bipot tá marcado o bipot beleza né então é isso que a gente precisa a gente vai fazer uma análise de correspondência simples a gente dá ok aí o que que ele vai fazer aqui né aqui né então ó essa primeira tabela é a é a tabela de frequência mesmo
ó os tipos os estados civis e os tipos de Trabalho tá beleza aí tem ó perfil de linha perfil de coluna né aí calcula a massa tá vendo a massinha beleza né Aí ele dá um resumo ó que que seria o que que está no resumo ó tá vendo que quadrado e a significância né ou seja como tem só duas categor duas variáveis ele calculou o q quadrado e o q quadrado deu significante tá na análise de correspondência simples é isso que você precisa para dizer que o resultado o o gráfico é válido tá um
gráfico de Análise correspondência simples é válido quando que quadrado D significante e deu n beleza e aí o que importa aqui esse gráfico Vamos dar um B deixa aumentar um pouco o gráfico gente V melhor aqui né ponh estão pequenos estão feios n se você clicar isso é vantagem do spcs se você clicar duas vezes aqui na bolinha n el abre umas opções não é pera aí deixa fechar aqui se você clicar nas bolinhas você clica nas Bolinhas Ah ele vai abrir aqui separado n deixa eu ver aqui se ele se eu clicar na bolinha
ele deixa ele marcou marcou as bolinhas aí eu posso clicar nas bolinhas eu posso aumentar o tamanho delas posso deixá elas grandes com uma borda grossa tá vendo ó agora as bolinhas ficam maiores né é editar gráfico no spss é terrível mas no já movi nem dá para editar né Eh então tudo bem dá para aumentar aqui Né ver as bolinhas melhor enfim né então aqui eu faço os perfis ó pessoas que nunca se casaram em geral São aposentados não estão trabalhando os aposentados são viúvos são coisas meio óbvias né porque só tem duas variáveis
eh quem trabalha fulltime ou divorciado ou é casado ou separado né tal então né legal tá então a gente viu aqui a an cor para duas variáveis mas o legal é fazer para todas né Então mostrei uma análise de de eh um um uma análise de Correspondência simples né então só só só para mostrar aqui deixa eu só fechar aqui para já deixar tudo arrumadinho aqui bonitinho da interpretação hã abre aqui não Beleza então vamos vamos agora finalmente sobre a interpretação então a a interpretação é a seguinte quando você faz uma análise de correspondência Simples
né O que que você deve reportar deve reportar o valor do q quadrado q qua q quadrado né o valor de q quadrado e o p e é bom reportar a inércia das dimensões né para ver a contribuição das dimensões lá do do modelo né e Bas e o e o bipot bipot mais e perfis E aí vem a sua interpretação tá a análise de correspondência Múltipla mas correspondência múltipla O que que você vai interpretar não tem o q quadrado né não tem o q quadrado é é porque tem mais de uma variável mais de
duas né então você vai você na na na na cor múltipla você vai entar o valor do Alfa de cromb e o alfa de cromb ele tem que ser maior que 0,8 tá para para a o o perfil ser aceito para pro biplot ser aceito um Alfa de cromb maior que 08 a inércia das dimensões Também né e o biplot o biplot mais fío tá Então veja que é uma apresentação simples não precisa florear muito e veja que não tem P isso que eu gosto da análise correspondência porque é realmente uma análise qualitativa tá eh
isso eu também faço o mesmo que o o Bruno tá eu assim o o jamovi para fazer as análises é excelente a a grande vantagem do jamovi é que ele é gratuito e ele é muito bom muito bom mesmo faz um Análises muito legais aí você tira as tabelas joga no Excel ou no R mas gráfico o gráfico mesmo é no R ou ou alguma coisa no no PowerPoint para ajeitar né É legal mas pras análises o o jamovi é muito conveniente assim né somente as análises mais elaboradas você pode fazer lá é que isso
eu não mostro no curso um mas no curso dois tem como você transformar o resultado do jamovi numa sintaxe do R porque o jamovi é feito em cima do R né E aí dá para Estudar um pouco a sintaxe então é é é legal mesmo tá Então veja que essas duas análises são análises qualitativas análises qualitativas né então é bem bem bem legal tá E para dar aula é melhor programa para dar aula não tem melhor programa do que eu já movi não tem é é fácil você mostra o resultado é sensacional Então vamos agora
agora que a gente já fez a análise de correspondência simples vamos fazer a Múltipla né a múltipla você vai usar todas as variáveis então a gente volta Dimensional reduction optimal scaling né no optimal scaling vai abrir uma uma janela ó ele pergunta todas as suas variáveis são nominais né aí a análise de correspondência múltipla né análise de correspondência múltipla Beleza então isso é a homos tá a homos É esse aqui beleza Vamos definir aí ele abre uma janela que é essa aqui em que você coloca suas variáveis aí você bota bota Todas aqui né minhas
minhas variáveis tudo bem né todas vão ter o mesmo peso então assim para mim to são igualmente importantes por isso que é um para todas tá você pode variar isso se você quiser a menos você tem um critério para isso você pode colocar todas né E aí o importante é você entrar aqui no plots variable né no plots variable ele ele vai perguntar como que você quer montar o bipot e e aí tem isso aqui ó o o join category plots o join category plots é Quantas variáveis você quer colocar no mesmo gráfico e eu
quero todas Então você marca aqui ó todas as variáveis Você joga aqui dentro do Joint category plots você tá dizendo pro programa ó Faça um gráfico para mim com todas todas as variáveis juntas tá beleza H E aqui display plot ele vai mostrar o gráfico pra gente tá bom né Então veja que é fácil né é tranquilo ã dá para reduzir as dimensões com PCA antes e depois rodar na cor dá só que aí Assim o PCA é para variável contínua né então você consegue reduzir o número de dimensões com variável contínua e depois você
tem que categorizar esses essas dimensões aí porque se se for contínuo não dá para fazer an coror tá você tem que categorizar depois tá bom mas mas dá para fazer todas essas análises conversam tá bom dá para misturar fatorial com com anacor se depois que você fizer os fatores você categorizar os fatores né Baixo médio alto Alguma Coisa assim se colocar como contínuo ele não roda tanto é que a primeira pergunta que o teste faz né você viu todas as suas variáveis são nominais Então faz esse esse teste se não for nominal não dá para
fazer tá E aí beleza ó vamos rodar aqui o gráfico aí o que que ele faz pra gente ó rodou aqui né ó aqui ele dá o alfa de cromo aqui ó veja que o alfa deu 0,47 ó olha como ele fez rápido primeira coisa né não tinha só 200 pessoas tinha 1500 ó ele fez rapidinho Tá então convenhamos né o spss nesse ganha tem que dar o braço a torcer com o spss nesse aqui esse escalonamento m Dimensional spss ganha tá ainda ainda estamos em busca tá eh então o alfa de cromo aqui ó
deu 0,47 então assim no frigir dos ovos essa análise não é boa tá esses perfis não são bem adequados aos dados vamos fazê-los por um critério didático aqui tá mas tudo bem E eh para esse gráfico aqui ser aceitável a gente deveria ter um Alfa de cromac maior que 08 ou seja uma boa adequação dos dados mesmo né Eh e esse valor próprio é o ame velue bom o ame velue das dimensões enfim tá aí aqui o gráfico de todo mundo junto veja só que beleza né o gráfico toda a galera junta olha aqui ó
né olha só tem um monte de gente vamos aumentar aqui os pontinhos só para ficar mais fácil de ver né porque o spss não ajuda Eh pera aí deixa eu clicar aqui nos pontos isso agora aqui ó vamos vamos deixar uns uns pontto grande aumentar Aqui uns tamanhos uns 15 Agora sim deixar uns pontos Grande mesmo pronto Ah melhorou né Melhorou agora os pontos né Dá dá para ver melhor então Ó que que a gente faz aqui né caos né caos então pera aí deixa deixa eu até aproveitar aqui copiar aqui um um um negócio
né eh deixa eu pegar aqui copiar aqui que aí D mas agora é aula de arte né agora passou a estatística agora é aula de artes né vou pegar o nosso gráfico aqui ó colar aqui Mesmo né aqui bem grande Olha só agora assim grande mesmo para não ter dúvida né Vamos botar o nosso gráfico aqui beleza né Então pronto agora vamos pintar né tá como é que eu interpreto isso você tem que começar fixando uma categoria fixe uma tá Fix uma categoria Então vamos pegar as mulheres ó mulher tá aqui né O que que
tá perto dela ó mulher dona de divorciada Trabalho meio período então Ó Eu posso meu prazer eu posso fechar um perfil aqui ó por exemplo aqui ó tá uma sugestão isso aqui seria o P1 vocês podem discordar não tem problema aí tem os homens ó homem trabalha Full Time bacharelado ou graduação casado branco o branco tá que distante né o branco entraria nos dois então eu vou tirar ele Vou Colocar assim ó P2 perfil dois o o branco Vale pros dois tá tanto masculino quanto feminino né Aí Eu eu olho aqui ó negros não estão
trabalhando outras profissões tem o part-time um pouquinho também né mas o parttime acho que tá mais perto das mulheres tem que ver na régua tem que ver na régua isso mas daria para fazer um outro perfil aqui p3 né E quem nunca se casou está desempregado ou tem outros outras etnias né Eh aqui deve ter um viés de idade né aqui deve ser os mais jovens também P4 né aí ó tem o separado coitado separado tá no no tá isolado Tadinho né e os viúvos são aposentados também estão isolados né fazer o quê é assim
mesmo então a gente criou esses três perfi tá os perfis não podem ser cruzar na H pode pode o ideal é que você crie os perfis mais distintos possíveis tá mas você pode ter alguma categoria que compartilhe os dois mas só uma não não muitas porque senão é melhor juntar todo mundo né então assim temos o perfil um que são donas de casa que trabalham meio período Divorciadas com formação High School e mulheres e brancas né E temos homens casados que trabalham Full Time com bacharelado e graduação e também brancos pronto formei dois perfis né
E aí por aí vai né agora então já tem temos aqui quatro perfis né temos nossos quatro perfis Beleza então imagina que é uma cidade né temos quatro perfis né vamos supor que o alfa de chroma que deu bom E aí esses perfis de fato descrevem a maior parte das pessoas Legal vamos imaginar agora que eu quero tirar aqui uma pessoinha de cada um desses perfis aqui para fazer uma entrevista entender melhor essas características aqui né tipo como que é a sua vida o que que acontece né Eh então as categorias que sobraram não é
que elas são excluídas elas ficam no gráfico né só só que você pode você não conta ela no perfil ou você faz um perfil separado então teria aqui um perfil Cinco que seria os aposentados viúvos e tem o isolado aqui o separado Tadinho ficou separado né ficou isolado tá o divorciado foi para lá né Eh acontece Às vezes sobra variáveis mesmo que não não são tão representadas faz parte Tá mas eu tenho quatro perfis principais aí vamos imaginar que eu quero entrevistar uma pessoa de cada perfil né aí o que que a gente faz volta
lá na anacor né por isso que esse essa até é uma técnica fantástica V voltar Aqui Fechar essa janela aqui que não precisa e vamos voltar aqui na outra à Não não é essa o é essa aqui aqui né nosso gráfico Se você olhar mais para baixo aqui ó aqui são as 1500 pessoas gente ó aqui Essas são as 1500 pessoas tá vendo aí você pode vir aqui ó coisa fantástica você pode pegar é que aí tem que aí tem que ter o trabalho de arte né mas você pode pegar aqui o o esse gráfico
os pontos os indivíduos né eu venho aqui Beleza né Pego aqui os meus indivíduos o né e dou meio que um bizu aqui ó agora é aula de arte total né pego meus indivíduos aqui e dou dou meio uma olhada né então eu olho aqui isso dá Dev D para mexer nas opacidades das camadas depois tá mas dá para dar uma olhada ó ó por exemplo esse esse esse o P1 aqui ó o P1 ele tá aqui entre o - 1,52 e o z0 e aqui ele tá mais ou menos no meio né então aqui
-1 - 1,52 e zero então estaria por aqui - 1,52 e 0 estaria por aqui de um lado e do outro estaria entre o -1 e o zer -1 e 0 aí eu ten que achar esse esse ponto aqui essa caixa mais ou menos mais ou menos vai est por aqui assim então aqui ó aqui e aqui ó mais ou menos essa é a área de atuação do P1 Essa é a área de atuação do P1 tá aqui ó né Aí eu posso entrar aqui tem os números ó por exemplo 350 350 quem é o
350 vou na linha 350 aí eu acho a pessoa 350 né Aí eu posso entrevistar elas ó são as pessoas daqui e eu faço o mesmo pros outros né O P2 vai est mais ou menos por aqui né Mais ou menos tá e o P4 vai tá por aqui então dá para sortear né P2 P4 você sorteia uma pessoinha de cada um dentro desse grupo aqui pronto olha só que beleza gente não é legal essa análise convenhamos se você nunca ouviu falar dessa análise agora você não vai esque Porque é uma análise muito boa muito
boa né pra parte qualitativa assim para pesquisa de mercado paraa área social fantástica fantástica recomendo que vocês estudem com carinho essa análise porque ela é muito legal e ela é prima irmã das análises de interdependência que vimos antes né a saber a análise fatorial e o PCA né então na na na área da psicobio principalmente o povo do rato célula e o povo das pessoas Usa usa relativamente bastante análise fatorial E tal mas essa análise é negligenciada infelizmente esperamos colocar essa análise onde ela merece né que é em várias áreas né em várias áreas de
atuação mostrei um exemplo da epidemiologia né que usa relativamente e mostrei um exemplo da área clínica que já está usando tá e a ideia eu recomendo que vocês Se tiverem necessidade e eh lembrem dessa análise com carinho tá no no spss ela é bem fácil de fazer tá bem implementado no jamovi questão de tempo Né no no J movi questão de tempo eh chegaremos lá tá então com com essa análise encerramos os testes de interdependência e entramos no último bloco de de testes do curso um né que são os testes de regressão Olha só Chegamos
na regressão quem diria né mas começaremos devagar começaremos devagar na próxima aula começaremos com correlação vai ser uma aula de correlação vamos explicar vários tipos de correlação pieron spma autocorrelação Correlação parcial um monte tá então a a a aula que vem vai ser focada em correlação e a partir a partir daí construiremos as bases para entrar na regressão linear né E daí vamos avançar eh eh dentro desse último bloco de testes tá eh então conto com a paciência atenção e vontade de vocês nesse último nesse último respiro nesse último Sprint né que temos aqui dentro
do curso um está acabando está acabando né nosso último Mês de aula teremos ainda muitas emoções tá gente então coragem espero que vocês tenham gostado da análise de correspondência é uma técnica muito legal Lembrando que ela é uma técnica qualitativa tá E e nos vemos semana que vem na na aula de correlação tá bom gente então Obrigado pela paciência e atenção de todos e até semana que vem tchau