E aí o Olá segunda-feira 24 Janeiro de 2022 Universidade Federal de Uberlândia faculdade de gestão e negócios curso de gestão da informação disciplina análise dados quatro dando continuidade ao nosso conteúdo gente está tratando do conteúdo análise fatorial exploratória F E e essa oportunidade nessa aula de hoje Principalmente voltada a esclarecer dúvidas reforçar conteúdo reforçar os fundamentos a partir das dúvidas que foram apresentadas Tá bom então vamos lá é como diria valendo alguém quer começar alguém quer começar a perguntar tem algum ponto que vocês gostariam de tratar é seguindo a ordem das entregas querem tirar dúvida
da primeira lista querem enfim como que querem proceder como que a gente pode pode seguir em Frente E aí o pai José Eduardo é o seguinte eu gerei não sei se você conseguiu ver o que eu gerei lá no spss na lição você passou lá você passou lá algumas informações ou do Rio Grande do Sul aqui um lar para a gente interpretar em cima daqueles dados que você deu depois eu fui ler com mais precisão e Eu verifiquei isso é isso Mesmo né o o número um deixou só um instantinho que eu vou passar a
lista um inteira pode ser a aí a gente vai detalhando e vai adicionando azul de você direitinho o show E aí E aí E aí E aí E aí E aí o Chão aumentar aqui para G1 um só instante check-in E aí E aí E aí e Se você começar a dar Eco se ficar ruim vocês me avisa por favor tá bom E aí E aí e É consegue em ver minha tela né bom então vamos lá é essa essa primeira lista essa lista de exercícios né Ela é composta por um dois três quatro exercícios
e esse primeiro exercício o que que acontece com as primeiro exercício Cintia e você já matou a charada você Havia perguntado É e aqui né então o que que a gente tem Aqui eu tenho enunciado da questão eu tenho quais variáveis foram utilizadas e eu tenho uma saída da análise fatorial Então na verdade né quando eu estou fazendo análise fatorial esta tabela que a gente tem aqui olha só se você tiver fazendo análise fatorial pelo spss essa tabela ela tem e é esse resultado aqui esse essa parte é uma tabela no spss Essa parte a
gente pega de outra tabela no spss e esta parte aqui a gente pega De outra tabela no spss então quando nós estamos rodando análise análise fatorial no spss esta esta saída né Essa tabela que tá aqui na lista de exercício ela é referente a três A3 aut puts do spss Tá eu vou e eu vou executar aqui o spss para para vocês verem que aí a gente vai pede né vou tratando os assuntos reforçando os assuntos é a medida que eles forem aparecendo então eu vou voltar nessa Nesse exercício aqui né só para Então tá
olha interprete as cargas fatoriais na matriz Quanto acionada é Interprete a comunalidade e interprete-a o percentual de variância Total explicado então a letra A é esta parte aqui a letra a a carga fatorial então isso aqui a gente chama de carga fatorial a comunalidade é isso aqui e o percentual da variância Total explicada é isso aqui entenderam letra essa parte na verdade né o nome das variáveis está presente em todas tá Mas essa que a letra A esta aqui a letra é e esta aqui a letra C ok oi oi então aí deixa eu te
fazer uma pergunta assim é quando a gente vai fazer análise da comunalidade a gente fica que varia de 0 a 1 de 0 a uma como namorar o melhor resultado seria de 0,5 assim que é o que eu entendi isso acima acima de 0,5 0,5 para cima quanto mais próximo de 1 melhor e há quanto mais próximo de 1 melhor melhor é E aí o Que que acontece é aí você me deu aí com relação a essas variáveis aí quando for fazer essa análise aí é para mim fazer a análise comparando todas as variáveis Qual
que é a melhor oi ou é para mim fazer análise de variável por variável Boa pergunta simples uniwar uniwar yada Ótima pergunta tá Cíntia o que que acontece com esse tipo de análise em geral sim então vou te falar para isso Aqui e vou te falar para passar análise de uma forma geral quando a gente faz Tá bom então Normalmente quando a gente está na visão é claro que tem inscrições Tá mas de uma forma geral quando a gente está analisando esse tipo de situação sítio o que que o que que acontece tá a gente
não Analisa e aqui em outros lugares normalmente a gente não Analisa uma por uma a gente faz uma análise geral Como que essa análise geral por exemplo tá a observar mos as Comunalidades né o que varia de 0 a 1 quanto mais próximo de 1 maior a variância compartilhada da variável com as outras variáveis então podemos observar que a variável que mais compartilha variância com as outras é a std1 cuja comunalidade é 0,86 a variável que menos compartilha a variância com as outras variáveis é Ímpar Gui e compartilha 55 porcento da variância com as outras
variáveis e né considerando que a todas as variáveis a comunalidade de todas as variáveis é estão acima de 05 conclui-se que baseado na comunalidade nas comunalidades a base de dados é adequada para fazer análise fatorial porque uma das condições né Para nós termos análise fatorial para nós executar mais análise fatorial é que as comunalidades sejam relativamente alta seja acima de 05 né Então tá vendo Eu não preciso de analisar variável por variável a gente faz uma leitura e geral uma análise geral da Comunidade das variáveis entendeu Ah entendi aí nesse caso do fator 1 e
fator 2josé você tá falando do teste cai melhor e o teste É bar mas tem o Barreiro marclei marclei isso e o ms Ah não aqui nós não estamos falando disso aqui nós estamos falando o seguinte ó é quando é o resultado da análise fatorial quando a gente executa Análise fatorial o que que nós queremos o que nós queremos fazer para análise fatorial nós queremos é reduzir a dimensionalidade dos dados ou seja nós temos e nós temos aqui olha só é uma duas três quatro cinco seis sete oito nove dez onze doze variáveis que nós
temos nós temos 12 variáveis e nós queremos reduzir a dimensionalidade dos dados que que significa isso Significa que nós queremos ao invés de nós usarmos 12 variáveis a gente consegue agrupar essas variáveis - dimensões e menos variáveis então nós estamos reduzindo as 12 e variáveis para outras duas variáveis que a gente chama de fator Então a gente tem um fator 1 e a gente tem um fator dois aí não sabe você também além de fator chamou o teu nome não é então pode ser componente pode ser fator tá então componente um componente 2 o fator
um fator 2 é mas a Rigor quando a gente olha a nossa base de dados né é uma outra variado e o que a gente cria na nossa base de dados tá a gente observar por exemplo até uma das perguntas que você menciona lá nas suas dúvidas é que uma das bases de dados já tá com faca e um aqui 2Pac três Na verdade eu rodei análise fatorial salvei as variáveis lá e esqueci de dar metade entendeu Então na verdade você vai ter que rodar de novo análise fatorial que aqueles factos que estão lá são
as Saídas do processamento que a gente faz daqui a pouco eu volto no spss aqui e te mostro direitinho como que é entendi tá então o que que a gente tem aqui como que a gente Analisa as cargas fatoriais a matriz rotacionado em casa matriz rotacionado depois eu vou mostrar leite para vocês já é o final a saída o resultado final do nosso do nosso processamento da nossa análise fatorial então o que que a gente tem de e de análise de solo só então nós queremos Saber o seguinte a variável uns TR ela vai se
agrupar no fator 1 ou no fator dois então quê que nós temos de carga fatorial essa carga fatorial varia de menos um até mais um então tanto se for para o extremo menos um como se for para o extremo mais um quanto mais próximo dos extremos mais forte a carga fatorial quanto mais próximo de do centro ou seja de 0 mais fraca é a carga fatorial então nós rodamos a nossa análise fatorial e nós vimos que as 12 variáveis se Agruparam em dois fatores então quando a gente olha quais variáveis se agrupam no fator 1
a variável a se agrupar no fator cuja carga fatorial foi maior por exemplo a hora que eu pego Prof então a maior carga fatorial hora em valor absoluto é no fator um então não fator um a gente tem é né a profe a gente tem a Prof m a gente tem a Prof s A gente tem e o std1 o st2 st3 estd quatro não interessa o sinal tá pode ser positivo ou negativo quanto mais distante de zero quanto mais próximo de 1 melhor não variável e no fator dois nós temos é MPN nós temos
é MPC o Nós temos e em pague e nós temos RMS a e a variável instrução em R Aqui nós temos um detalhe dessa variável Qual que é o detalhe dessa variável esta variável ela tem carga fatorial dobrada o que a gente chama de carga fatorial dobrada o que que é isso olha só os valores no fator 1 e no fator dois estão muito próximos então é esta variável ela não é capaz de discriminar de separar entre o componente o fator 1 E o fator 2 e componente dois então numa solução final essa variável seria
desconsiderada nossa análise fatorial Ela não é uma variável adequada para ser utilizada na nossa análise fatorial porque ela tem uma carga a dobrada os valores são próximos muito próximos aqui óleo entre o fator 1 e o fator 2 ok aí o zé no caso a gente fazer análises Então desse caso aí analisando as variáveis né E eles estão correspondendo Lá os seus fatores 1 e 2 a variável Prof a Prof ela o que melhor se a DECO vovó mais ou menos isso que você entender seria do fator 1 e o qualquer um aumente a winping
na é o fator dois seria mais ou menos nesse sentido Exatamente olha o que que acontece tá hora que a gente for olhar a composição do fator um nós vamos falar o seguinte ao fator um é composto por Prof F Prof M Prof s s t de um dois três e quatro essas variáveis compõem é O [Música] fator entendeu E o fator dois ela é composto por essas outras variáveis aqui olha olha que a gente olha o que que significa essas variáveis né Por exemplo olha só número de Empregados na indústria pela população número de
Empregados no comércio e serviço número de Empregados na agricultura e receita de ISS ICMS Então essas quatro Essas uma duas três quatro essas quatro variáveis ela se agrupam e formam fatores tá vendo faz sentido São variáveis que tem uma relação de sentido então analise mas só que quando eu estou rodando a técnica né a nossa técnica estatística eu não sei o que cada variável significa a técnica não sabe o que a gente vai ver depois é que faz sentido né e essas coisas variam né Elas têm uma forte correlação a base da análise fatorial é
que tenha Correlação entre as variáveis correto correto Ok ciências Ok Então essa é a composição do fator 1 e tem um detalhe que não sei se vocês chegaram a ver lá o PowerPoint né se vocês chegaram a leu material que tem um outro detalhe então o que que a gente Analisa né a gente analisa a carga fatorial a gente Analisa se existe a carga fatorial dobrada né duplicada cuja variável não é capaz de discriminar de separado no outro e existe o outro detalhe que se a Carga fatorial é estatisticamente significante Então esse carga fatorial Ela
depende do tamanho da mostra então né que normalmente para carga fatorial se ele estatisticamente significante com a mostra de de sem essa carga fatorial precisa ser maior do que 0,350 então nós temos né aqui todas elas olha só é aparentam ser estatisticamente significante tá vendo tá então a gente praticamente fez uma análise quase completa então da nossa Análise fatorial aqui então é essa é a análise da carga fatorial na matriz rotacionado tá vendo a gente falou da comunalidade e o percentual de variância explicada Total explicada por meio na Então esta Matriz que nós rodamos aqui
né Se vocês viram a aula também de assistir à aula lá do spss e como que a gente gera análise fatorial utilizando o spss aí a gente já era lá né de gerar matrizes rotacionada e qual rotação que A gente usa se usa varimax se usa né É qual daquelas opções que a gente tem lá então que utilizando agora e Max E aí nós observamos que o fator 1 Ele explica 59,80 e um por cento da variabilidade dos dados e um fator dois explica 37,28 por cento da variabilidade dos dados se nós somarmos é a
variância total explicada né 39 da 60 da quase noventa porcento não é isso quase cem porcento né quase noventa E trava lá para o cento da variância Total explicada então o que que significa isso olha só eu nós conseguimos até 7,07 por cento então o que que nós conseguimos Olha só nós reduzimos de 12 variáveis para dois fatores e nós perdemos menos de 3 e da variância dos dados ou seja o nosso processo é Reino é muito satisfatório que nós conseguimos simplificar os dados que a gente está utilizando tá Nós reduzimos de 12 para dois
componentes dois fatores e nós perdemos muito pouco muito pouco a variância porque para a gente explicar sem por cento da variância nós utilizamos as 12 e variáveis Nós deixamos de usar as 12 estamos utilizando dois fatores esses dois fatores juntos eles explicam 97 por cento da variância dos dados então extremamente satisfatório a nossa análise fatorial OK aí eu parece que eu tinha anotado no lugar Agora não tô achando 60 e poucos por cento o ótimo que seria quanto o o José aqui é o seguinte Eduardo quanto mais pros é de 100 é melhor mas não
diz para todos que gerou né dos fatores que nós retivermos normalmente antes da votação um fator um explica maior é a maior percentual da variância explicada é pelo fator 1 a segunda pelo fator dois a terceira pelo fator três casos têm Então nesse caso aqui o fator um explica 5981 fator 23798 os dois juntos 97 Em tem quanto mais próximo de segue melhor mas na vida real é muitas vezes Cíntia nós vamos encontrar sessenta por cento setenta por cento acima de 80 porcento já essas já são resultados muito satisfatórios tá normalmente a gente vai encontrar
coisas aí de 60 e 70 e 80 às vezes menos que 60 e assim aí né Nós vamos falar assim realmente a gente consegue reduzir a dimensão essas variáveis realmente estão Correlacionados ou não então aqui se questionar há que se pensar a respeito disso entendeu Mas não é quanto mais próximo do 100% melhor é o efeito melhora o resultado da nossa análise fatorial aí nesse caso José que que acontece você até falou é que um bom uma boa análise ela deveria ter né análise fatorial análise da Matriz de correlação as variáveis com as correlações Estatísticas
significativas ante o km Hall MS a comunalidade os fatores retidos avaliar a variância Total explicada a Deus e as composições dos fatores isso você falou que para uma boa análise para e o nosso trabalho isso é e também eu acredito que seja para o 2 por 3 e por 4 aí no futuro propriamente dito Então nesse caso aqui você só Fez análise fatorial no caso a comunalidade Oi e aí olha Total explicada só como Aqui ó Nessa primeira é eu só aqui não tenho km ó tá vendo eu não te entreguei time hora eu não
te entreguei Matriz de correlação eu não te xinguei emsa eu não te entreguei eu te entreguei é três ao tipo 3 saídas eu não fiz vocês devem ter visto nas aulas gravadas também que para nós análise fatorial ela é baseada na correlação EA correlação é baseada na média eo desvio padrão Ou seja estatística paramétrica então um dos pressupostos para a gente Para alguns pressupostos para a gente rodar análise fatorial né que os dados tem um correlação exista correlação obviamente não entre todas as variáveis entre tudo é que tem uns pares de variáveis que tenha com
relação é que os dados cinco uma distribuição normal então tem os testes que a gente pode ver se os e isso é normal né lá no material do pai lá no notebook tá bem detalhado faz todos os testes desde o mais simples Até O mais composto mais complexo né então eu parte da simetria curtose e assimetria e curtose padronizada é depois o teste da gostinho não tem aí até o mais o mais rígido quer o KS né o w e o KS tão sesp.es mais rígidos para normalidade então é para efeitos de aprendizado mesmo que
os nossos dados não sei contribuição normal e que a gente não consiga ajustar umas arrumar a transformação nos dados a gente vai ser visto no trabalho de vocês Nos exercícios tudo a gente vai Executar tudo porque nós estamos praticando e nós estamos aprendendo Tá bom mas na vida real se você por exemplo por fazer um artigo é um é mostrado no trabalho para empresa então esses Passos devem ser seguidos e eles devem ser reportados devem ser relatado às vezes usados não permitiram que nós aplicamos a técnica da análise fatorial entendeu Entendi então pode acontecer isso
pode acontecer nessas coisas podem acontecer tá bom Então nesse caso aí você fez a comunalidade você fez analisado explicada e a composição dos fatos EA composição dos fatores OK tá bom eu não sei sei se vocês lembram também lá nos vídeos que que vocês viram que lá nos vídeos eu copiei esse resultado lá para o Excel colei lá no Excel ordenei apaguei quando a gente fez lá em uma complexidade maior só para explicar como é que é o funcionamento Mas é a Mesma coisa que eu fiz aqui colorindo os resultados por você está bom bom
então isso aqui eu já dei uma né Eu já gerei o out para vocês eu não dei a base de dados eu não dei nada né Isso é essa tabela são ao tipo dicas Só Informações de um pós-processamento da análise fatorial eu falei para vocês o seguinte Olha eu rodei uma análise fatorial e encontrei esses resultados aqui Comente os resultados aqui e a partir da né da base Da sustentação conceitual do fundamento de qualquer coisa acontece entendeu Tá certo o chefe tivesse um professor aí o 2 o 3 e o 47 Cíntia e demais aqui
são três base de dados aí para essas três barras de dados aí a gente vai rodar na área setorial ok é o quê que foi aquelas que eu rodei te passei né José é aí agora né além dessa 3 saídas que nós analisamos Aí lá ah Cíntia né É nessas bases de dados aqui Pessoal elas são base de dados pequenas e eu não vou cobrar de vocês análise dos pressupostos da análise fatorial que é tamanho da mostra que é normalidade dos dados que é essa caso necessário fazer uma transformação dos dados aqui eu quero que
vocês relatem né se os dados seguem uma distribuição normal não se Qual foi o km ó Qual foi a NSA se existe correlação ou não e faça interpretação dos resultados a nossa tutorial que nós encontramos que as Principais são essas três aqui tá não limitados isso aí isso que obviamente Então os exercícios que se repetem tá é um como a base em indicadores financeiros E aí E aí O que costuma pegar eu não sei se vocês viram também porque lá na aula gravada tem que fazer uma pergunta pode fazer você quiser eu tenho que deixar
os colegas falar eu vou ficar mais saladinha deixa mas eu acho o seguinte as suas dúvidas Provavelmente é de boa parte também depois você vai perguntando E caso eles tenham dúvidas adicionais é da do espaço né para todo mundo perguntar inclusive hora que você tiver fazendo as perguntas caso alguém tenha alguma dúvida relacionada que não foi perguntado por você eu não foi comentado por mim sinta-se à vontade Abra o microfone e faça as perguntas por favor sabe qual que é que a minha pergunta é o seguinte a seguir lá o script de como a Gente
fez lá no spss né que você colocou lá algumas observações correto correto aí assim eu ainda ponho um o spss é eu posso compartilhar com você José pode chupar o meu compartilhamento aqui que aí antes disso alguém tem alguma pergunta alguém relacionado essa primeira questão alguém ficou dúvida Pergunte a pessoal a Cíntia tá usando o direito dela o Né o o espaço dela e se ninguém se manifestará vamos eu acho que vai ajudando todo Mundo né porque aí a gente aproveita para comentar alguma coisa mas antes eu não mente Alguém tem mais alguma dúvida A
esse respeito a respeito da questão 1 tá tranquilo professor é na verdade só para confirmar aqui eu posso fazer as análises tanto em pai tudo quanto ISS É spss né até qualquer um essa primeira questão você não precisa de sorte nessa primeira questão você tá ela já é o resultado janela output a nesse caso aqui é só fazer a descrição das agora Fazendo quiser cruzou Tiago pode usar o que que você quiser eu acho que eu mandei com vocês na semana passada se eu não me engano para próxima turma acho que não vai ser para
essa eu tô preparando o material todo em R também então a gente vai ter minha R1 pai então spss então é principal assim né é muito relevante eu acho né dado o contexto dado como que a coisa tá Acontecendo para onde a coisa caminha vocês já tiveram oportunidade de serem introduzidos ao R lá nas disciplinas analisados dois e três principalmente mas eu vou trazer uma outra visão também né Dr não vai ser para vocês nesse caso que não eu já tenho o primeiro material está praticamente pronta né Já tô fazendo de análise fatorial mas eu
acho que eu não vou conseguir entregar em tempo né Depois hora que chega no final do semestre ou agora que tiver pronto Esses quatro eu vou compartilhar material com vocês mas na próxima turma a gente já vai ter isso também é então eu não vou fazer isso também é então é estimulado mas não é obrigatório que vocês façam em Python e r o que quem for efetivamente trabalhar com isto nas empresas em qualquer lugar se for I vocês viram trabalhar com o pai tão é se for né o cientista de dados ele vai trabalhar com
essas duas As duas ó com as duas juntas não tem como muito fugir disso mas para efeitos de aprendizado do conteúdo Então Pode ficar à vontade para utilizar o spss tem cozinha e com outros sócios tá tem está tem eh militar bitens as tem nine ten Pode ficar à vontade para usar com vocês quiserem tá eu tô tentando trazer para disciplina né alguma coisa além do conteúdo em si mas não fiquem presos a ferramenta passa naquela que vocês melhor se sentirem melhor ou que Se quiserem desenvolver tá bom e na verdade para ser quem tava
te perguntando era o João Paulo mas muito mais então é a ideia e perguntar se era isso mesmo Porque sim senhor já tem mais é a mulher idade um esse mercado de trabalho principalmente esse de Uberlândia a gente fica sem fica naquela dúvida né diante tantas opções de estoque para poder fazer armários qual seria o queridinho preferido das empresas não só nesse caso o senhor Falou e o quanto você faz a linguagem pai então ela tem uma uma aceitação maior ligar eu vi a sua foto e te chamei de tirar vi nada não filha é
o que que acontece João Paulo por exemplo se você for trabalhar no Martins o Martins tem solução completa em sass tá então a hora que você for cedo né Para alguns de vocês amigos amigos seus que já já estão lá então E lá eles trabalham muito com os As então mas é uma solução caríssimas só ser pago é caro então não é qualquer empresa que tem condição de ter no na CTBC na Algar Telecom eles tinham o spss nutre banco Tinho spss eu acho que ainda tem a herança minha quando eu passei por essas empresas
nós licenciamos nós compramos Tá mas o que que acontece cada vez mais é até mesmo esse software dessas plataformas eles estão integrando com python e r Então tudo está integrando com pai com mulher Tudo tudo tudo tudo então se você quiser o cientista de dados a Rigor a Rigor ele vai trabalhar com python e o r Como sofre estatístico ele é mais antigo ele é mais estável tem mais recurso mas o pai tu é muito mais que um pacote estatístico o pai tem uma linguagem de programação ela é e não ele é orientado a objeto
então né a possibilidade de uso de pai tão vai muito além da análise de dados em si por exemplo eu tô no projeto já comentei com vocês Né que a gente tá prestando serviço para o FNDE para Fundação Nacional do desenvolvimento educação é e a gente está capacitando os gestores escolares escolas públicas nesta duais municipais EA UFU nossa equipe da UFF é responsável pela região Sudeste então é a gente vai levar os cursos para algumas cidades e a gente precisa de deslocar prefeitos vereadores secretários de educação diretores de escola para essas para Essas cidades né
então um dos centros de treinamento é é Montes Claros para isso aí então faz assim a gente precisava de gerar por a rodovia as cidades que estão até 250 km de Montes Claros então o que que eu fiz aqui né De certa forma bem rápido tá eu construí uma aplicação Zinha em Python ela não deve ter trinta linhas essa aplicação o que que eu faço eu leio uma planilha Excel com aí eu já dei limitei também eu tenho do Brasil inteiro né mas É o filtro a região não é estado de Minas Gerais mesorregião Norte
e tem lá também Jequitinhonha tem mais umas outras cidades lá e eu chamo apeie do Google né que ela ela já era a rota é para uma cidade qualquer então eu vou ler no município eu olhei lá Januária aí calcula a distância de Januária para Montes Claros a Porteirinha aí o cálculo distância de Porteirinha e já era uma planilha Excel né da distância de várias cidade e a Montes Claros então isso não É análise de dados não é exatamente estatística não tô falando isso aqui que eu tô falando a verdade mas eu utilizei o pai
então para isso e quase tudo hoje está por todos os lugares e não poderia fazer em R poderia poderia fazer mas ele dá um trabalho danado então parto além da parte de análise dados né tá sendo extremamente utilizado para todo lado então o Google já tem lá as suas apis as suas bibliotecas que entregam compacto então eu criei uma conta lá no Google né Então eu tenho achar não tem um acesso eu passo o meu acesso chama rotina de Maps do Google e cálculo isso gera uma planilha Excel com a distância de várias cidades tá
então né é vocês que quiserem trabalhar com isso que quiserem seguir nessa parte de cientista de dados e análise é de automação Python a linguagem entendeu a paz é o caminho é legal você é que integra também Conhecimento com outras áreas e também e se não for tem várias vagas que já são anunciadas que pedem conhecimento em Python Então já tem que saber tá e tem várias outras que ainda que não peçam se souber pai tem um diferencial Ah tá então é um caminho eu sugiro vocês né ficarem proficientes nisso é para quem ainda não
né não teve oportunidade de a partir de agora de cunhado de curso tem que custa todo lá tem né ajuda para todo lado eu tenho vários livros aqui Desses eu tenho compartilhado com vocês então tende a introdução à programação em Python desde as coisas mais básicas até as coisas mais sofisticadas têm curso para todo lado eu recomendo muito vocês colocarem isso aí no futebol de você está ok ok o professor só mais uma dúvida é coisa assim no no Júpiter leve presente quando eu Carrego um arquivo novo está inserido dentro de um diretório no caso
é eu preciso fazer a leitura de uma linha específica usual que eu tenho que fazer a leitura desde o início é para que ele incorpore as bibliotecas tudo que havia feito antes Existe algum botão vamos começar o que eu clico que ele faz a leitura geral da planilha inteira sem o capitão play play play play play tô fazendo você hora que você lá em cima na opção Você tem o que você clica com o Botão direito lá no urbano tem ROM ele roda todos os comandos uma vez só e as Ah tá Brunão seu agora
que eu vi que eu acho que vou à tarde mas não sabia dessa não vai aí ele executa tudo para você entendeu para você não ir lá passei não fazer uma burra né não desça aí outra outra dúvida acho que foi quem me perguntou acho que a Ana Luiza né Ana Luiza e deve ser dúvida de outros também tá então para quem tá trabalhando nesse ambiente Aí qual foi a dúvida da Ana Luiza fala para imagino eu tenha sido assim tá não se quiser corrigir fica à vontade ela tava ela estava trabalhando né fez o
processamento tal e depois ela resolveu fazer alguma outra ali só que aí o que que ela fez ela encerrou a sessão saiu do junto ele é bizarro anaconda aí tudo bem então a ela tinha gerado uma série de alto custo etc centro então o que que acontece hora que Ela vou E aí entrou já quero fazer mais uma modificação mais uma alteração e quero gerar mais um gráfico por exemplo tá então a hora que ela voltou pessoal aquele DF por exemplo as bibliotecas nós temos que executar aquilo tudo de novo porque aqui não só existe
em momento de execução então quando nós vim encerramos a sessão aquele ambiente a finalizado né a biblioteca fechada Aquela aquele DF que a gente crio Data Frame é uma variável e ela só existe ali naquele Momento de execução então depois eu preciso de ler o arquivo de novo então eu preciso de executar o comando de novo tá então a gente precisa aqui não existe é enquanto eu estou naquele ambiente eu saí do ambiente o finalizei o ambiente àquela variável não existe mais aquele DF deixou de existir Então a hora que eu entrar de novo eu
preciso de executar de novo para aquela variável ser carregado para ela ter valor tá bom E aí E Obrigado João pela pela pelos comentários pelas dúvidas Cíntia pode compartilhar dela Se você quiser tá compartilhar Pode sim o pessoal fiquem à vontade assim como fez o João Paulo tá vamo interrompendo perguntando vamos ficar lendo aí E o Zé hoje é o seguinte você tá conseguindo ver o meu aqui estamos em é a primeira dúvida que eu tenho tá vendo que o que eu trouxe aqui as bases de docência avaliação de cá dores Municípios que que acontece
eu gerei né gerei as informações até a saída Salvo é a saída agora vamos supor que eu quero eu tô aqui vamos supor que eu vou fazer a a do município ser aí eu vim aqui vejo as variáveis que aqui são as escalas nominais ou né fez o que é que são sequenciais numéricas então aqui eu vejo que algumas informações aí eu vou que analisar é dimensões fatores aí eu vou trazer Essas aqui que eu tô trazendo só as escalas Até aí tranquilo né vê aí o que que o que eu queria te fazer uma
pergunta é Eu segui lá o seu script direitinho vou seguir que esse aqui só para gente fazer na hora que eu te perguntar a essas duas não porque essas duas variáveis já são a saída já é o que foi gerado tá vendo entende essas duas ele foi pressão essas duas já foram geradas que você vai ver que vão nós vamos ver agora tá faca e um e fac2 tá vendo a apac 1 fakie 21 agora nós vamos gerar outra se você vai ver a Gente vai gerar essas outras variáveis aí Zé não vem aqui vem
discutir bonito na hora não coeficiente o nível de inclinação para a matemática mas ok continuar extração aí eu venho aqui quatro principais Matriz de correlação Ok ok pode continuar com base no valor maior do que um tem um exercício aí na lista que é para repetir com alto valor igual a meio não sei se vocês já viram aí que você vai trocar tá vendo entendi Ah entendi hora que for aquele lá você vai colocar 05 aí então tive que a gente tá fazendo a gente tá fazendo com um com superiores a um aí depois que
você vai ter que rodar um exercício de novo mudando para 05 aí Tá certo e para 05 neste louco que é o exercício dois a letra B do exercício dois aí tá te pedindo falar agora né com patamar mínimo parei de invernos alto valor né e quiser no alto valor Com base no alto Valor na lista tá escrito aí de inverno inverno é um alto valor então aí tá um que é o que tá que o spss faz automático a letra tá igual a um do exercício dois a letra b e você vai mudar para
05 é essa que você tá falando isto E aí ó você vai fazer a mesma coisa que você fez na letra A só que aí você vai gerar agora com 05 é super tem um pouquinho de paciência vamos com fé Então vamos lá vamos voltar aí aqui vou fazer cinco aí é 0,50. 5 eu acho que 0,5. Acho que ele vai passar não é zero, então tá bom vamos fazer aqui continuar aí a rotação carregando o gráfico para não continuar Ok E aí vem com pontuação aqui que eu quero te perguntar aí aí eu não
tenho essas informações aqui o bar tá o que que acontece ele gerou essas duas variáveis para você isso na Base que já tá gerada fakie uma fac2 essa um método é como que eu vou gerar essas duas variáveis então normalmente o que a gente usa é só mesmo tá entendi é porque poderia ser boa aula Deixa eu te perguntar você fala alguma coisa sobre eu vou falar que talvez só fala errado você falou sobre o piercing som que varia de menos um a mais um e não não é isso aí não é isso aí você
falou do teste bartet barkley também não é isso aí a né não Também não é isso aí amanhã o Anderson Rubi é esses métodos aí porque eles não são testes eles são como que eu vou calcular o valor dos fatores Então a gente vai calcular os fatores utilizando o método de regressão eu vou voltar lá e te mostrar depois né O que que você vai ver o teste esse esse felicidade the barclay não é isso aí tá então o teste a gente faz ele normalmente para gente Observar se a nossa mata bom então é igual
a matriz Identidade aqui é qual o método eu estou utilizando para gerar os valores dos fatores que estão calculando não é teste que eu tô fazendo aí não entendi deixa só pego ver alguma coisa que eu sei que você pediu financeiro mas gente vai fazer isso aqui daquele jeito mesmo agora vamos falar o heliponto é exibir eu errei eu queria voltar lá na definição da extração eu posso continuar posso voltar lá na rotação Pode posso voltar volta próxima Mais traça o Hulk aqui para o voo e isso entendeu Pode se ainda não executou nada você
só tá configurando entendeu mesmo ou depois que você executar você pode voltar e tá de novo voltar e mudar entendi aí aqui é quem definiu tudo essas opções aqui Zé não colocou Mas eu sou meio gostosa eu vou perguntar é casos por par pela média um dos grandes questões é Ótima pergunta tá Cíntia uma das grandes questões quando a gente Trabalha tá trabalhando com análise de dados isso para você e para todos em qualquer situação uma das grandes questões que a gente tem que interessar é quando existem dados ausentes dados faltantes a gente pega a
nossa base de dados e tem uma determinada variável por um determinado indivíduo que não tem respostas dado ausente cavalo ah vasinho kawase Aí que tipo de tratamento nós podemos dar para dados vazios Tem muita gente que de forma errada Substitui por zero a situações que o dado ausente eu quero mas na grande maioria não é na grande maioria eu não posso substituir o dado ausente por zero Por que que eu não posso a maioria do software ele tem que tratar explicitamente o que que eu faço quando ausente o spss ele já meio que faz isso
automaticamente para gente a gente não precisa preocupar muito mas já tem que saber o que que a gente vai fazer então a gente tem a Opção de substituir o dado ausente por algum valor ou a gente tem opção de não trabalhar o que que acontece excluir casos por lista então eu tô trabalhando com o nosso caso aí nós temos umas oito variáveis né uma duas três quatro cinco seis sete oito nove variáveis nós temos nove variáveis bom então o que que significa are excluir casos por lista se eu deixar esta opção selecionada imagina que lá
Água Rasa tá o primeiro Primeiro município aí né Água Rasa que tivesse faltando acabamento a renda ele Excluir toda todo o registro de Água Rasa Água Rasa não iria participar da análise ela estaria fora da análise que ela falta o valor para última variável e não estou excluindo a lista inteira Eu Tô excluindo a variável inteira Então eu só escrevi falou ali eu não excluo tá o spss mais ali na Água Rasa inteira nenhuma das variáveis irá participar da irá fazer parte do conjunto de dados que Eu irei analisar porque eu tô excluindo a lista
a linha isso em inglês chama silício Aires a alguns dos sócios alguns lugares vocês vão ouvir listwise então se faltar uma valor para uma variável que eu estou levando em consideração na análise aquela linha inteira não será analisado Ok na parte de baixo vou explicar todas as outras aí você entender aí excluir casos por par ou pé Waze significa o seguinte Olha tá faltando o Renavam renda familiar para para o município Água Rasa então eu não vou excluir a água Rasa Só quando eu for utilizar a variável renda familiar o município de Água Rasa não
será considerado Só quando eu for utilizar a variável renda familiar se eu não for utilizar a renda familiar a água Rasa vai ser utilizado em todas as análises porque não exclui a água Rasa da minha análise Então essa é a segunda opção excluir caso por par Eu só Não considero àquela variável que tem dado ausente naquele determinado momento da análise tá Então essa é uma opção e outra opção que nós fazemos o spss nesse caso já faz isso automático é está faltando a renda familiar para o município Água Rasa a minha base da Zé pequena
eu não quero perder mais dados então o que que eu posso fazer Qual que é a renda média da minha base bom então meu valor ausente ele será substituído pelo valor médio daquela Variável eu posso fazer isso pela média pela mediana pela moda eu posso enfim até tem algumas opções para fazer isso tá nós temos que tomar muito cuidado ao fazer isso que a gente não pode fazer isso de forma indiscriminada quando a gente faz essa substituição as decisões têm que ser bem Claros a minha base de dados é pequena eu poderia substituir por um
valor para fazer análise Então tem um vários pontos para para para para gente considerar tá E esse de baixo né Formato de exibição dos coeficientes então é lá na nossa saída na nossa geração de dados se a gente quiser ordenar a isso ou não então não precisa de ir aí não precisa fazer nada é só lá na nossa saída de dados se se a gente e vai ter a nossa Matriz colocar acionada lá ordenada óculos variável ou para o valor dos coeficientes eu prefiro ordenada pelas variáveis e a gente vai olha o valor do coeficiente
igual tá lá naquela Na saída do primeiro exercício que eu mostrei pra vocês entendeu Entendi e ele também você pode suprimir coeficientes pequenos por exemplo olha coeficiente menor do que 0,3 não serão exibidos lá naquela Matriz que a gente está gerando por exemplo entendeu Você já tem opção de gerar aquela saída já um pouco mais organizado pouco mais limpa caso você queira um Tá certo pode dar o que não pode dar o que e essas variável de seleção aí a Gente não vai tratar disso agora a gente vai tratar disso lá quando a gente for
fazer regressão logística que aí nós temos o conceito de amostra de teste e amostra amostra de treino e amostra de teste que a gente divide a nossa base de dados um pedaço da base a gente treina o nosso modelo nosso algoritmo e na outra base a gente testa é o modelo que a gente fez a gente não vai tratar disso agora então aí você não precisa colocar nada não a gente vai fazer daí Isso lá na regressão logística depois aí eu tive antes de entrar aqui na análise dos dados agora volta na sua base dado
por favor E aí já é o bicho é o bicho não olha passa o mouse em baixo no spss no ícone do spss embaixo e para direita para esquerda Aonde tá esquerdo devagar o ícone Zinho aí no pé da página do spss o é cedo para a esquerda na barrinha Embaixo na barrinha da da esquerda é Tá mas ontem não aí a sua barra de ferramentas de som aqui embaixo em baixo lá no pé da página então aqui embaixo Aqui é aí aí clica nos dados aí move seu cursor para direita né a raça/para direita
e olha lá as variáveis que estão criadas lá no seu no topo da página tá vendo que tem que fac1 efac 21 e faca e um dois e fax 22 aham tá vendo que os valores são Exatamente os mesmos a faca um confac 2141 com faca e um dois e faca e 21 com fax 22 Por que que tem essas variáveis aí porque nós rodamos análise só eu já tinha rodado e tava salvo na base e você rodou de novo então ele criou outras duas variáveis para fatores se você rodar depois com o 05 e
vamos lá vamos rodar com 05 agora que tá agora que a minha dúvida como que eu volto naquela primeira telinha é Volta lá e analisar analisar ataque continua aqui é classifica redução de dimensão fator Aí você voltou nela de novo tá vendo e agora vai lá em extração e agora andrezi cinco você coloca de uma você coloca 0,5 a gente vai rodar de novo análise fatorial e tá tudo salvo aí para você não fechou o seu spss se você clicar nesse botão redefinir embaixo vocês era tudo Você limpa tudo então não faz isso não se
você ficar redefinir Tudo aquilo que você selecionou marcou que você configurou limpa então se você precisar tem hora que a gente quer isso mesmo você quer limpar tudo não é o caso agora executa então ok em volta no seus dados de novo vai no pé da página SPS isso a mostra direita tá vendo que agora você tem pac 33 34 35 36 essas três variáveis foram as três variáveis que você criou na sua segunda Execução agora quando você rodou com alto valor igual a 1 ele só ri teve dois fatores o fakie dois três e
o fato desculpa eu faço um três e o fakie dois três agora ele re teve fac3 3435 três só para te mostrar isso tá clica essas três variáveis aí deleta elas agora por favor é isso agora para simplificar sua vida também deleta essas duas variáveis aí faca e 1/3 e faca e dois três elas são as mesmas que a gente já criou tá A hora que então a hora que você rodou se não tiver Ah desculpa tem também a faca e um dois e a faca dois dores pode deletar também a 12 qualquer pode ser
Essas duas últimas pronto então agora imagina que você tenha rodado o seu o seu spss e a gente salvou essas duas variáveis na sua base clica no menu salvar Olá Nuno muitos quietinho ele também pode ser 17 mesmo pode cancelar pode Cancelar por favor pode ficar só não diz Quietinho eu salvar aqui isso pronto tá salva sua base de dados aí tá agora vamos lá no out de novo vai no pé da página embaixo a e agora clica no out ali foi gerado clica agora ali olha do lado esquerdo onde está escrito análise fatorial de
barra para baixo fica aí e agora deleta apaga isso tudo aí A beleza nós apagamos o out daquela execução que nós fizemos com 05 Ok eu só apaguei aquele altitude para não confundir entendi agora Zé deixa eu te fazer uma pergunta aí aqui eu vou fazer as análises aí eu vou te perguntar é de maneira geral e eu queria que você me ajudasse Quando eu for analisar e a parte de O desvio padrão essas coisas aqui para mim Fazer vou te dar uma outra dica Olha se você ficar do lado esquerdo por exemplo onde está
a estatística descritiva e para baixo um pouquinho seu mal já estatística descritiva ele posiciona na estatística estatística descritiva tá vendo do lado direito olha aqui um jeito fácil de você navegar aí clicando na nos nomes do lado esquerdo ele vai te posicionando do lado direito entendeu Deixa eu te perguntar da Mata é porque esse aqui depois é matéria anterior que Tem que rever algumas coisas e eu vou te perguntar por exemplo se eu for analisar o Cayenne ó o km ó ele é de 0 e 1 ele varia de 0 e 1 não é ver
passou um carro aqui eu não te ouvi dizer varia entre 0 e 1 isso mesmo varia de 01 deixa eu ver onde que eu anotei aqui também ó E aí o km o que que eu anotei que menor do que meio não é uma coisa boa eu não é adequado não é dental morde meio quanto mais próximo do um também é Melhor isso que eu fiquei tipo mais próximo de 1 melhor se for abaixo 05 é só análise fatorial não vale nada pode rasgar joga fora aí nesse caso aqui ele me deu essa e 0,833
olha kaiser-meyer-olkin km O kaiser-meyer-olkin tá um km hora de 0,83 é um valor muito bom não é excelente então quanto mais próximo de 1 melhor melhor NSA o MS a e também varia de 0 e 1 né Zé o MS a varia entre 0 e mim aí o que onde você olha o MS a Quando eu olho e eu tô fazendo quando eu estou analisando o km eu estou analisando todas as variáveis em conjuntos Qual que é o indicador o ajuste estatístico Quando eu olho todas as variáveis em conjunto Então eu tenho valor do Km
ó né que é o caso é mais ou que então quanto mais próximo de 1 melhor quanto mais próximo de meio pior abaixo de meio o senhor tá é no trabalho de vocês se no Trabalho final ele 77 Se vocês fizerem as intervenções e ele ainda assim continuar abaixo de meio vocês vão fazer análise até o final Para efeito de aprendizagem da técnica mas na prática na vida real se o km ó for abaixo de meio a nossa análise fatorial menos essa nada tá entendi esse barra aí que você falou que é o teste né
esse até sete dias é de marketing o que que esse teste faz Olha só não é aquele lugar que tava lá aquela opção para para para marcar Não e essa opção que ele vai lá em de novo clica no botão analisar e eu no menu lá em cima analisar a lá na opção de melão onde você rodar Nossa teoria ó no menu lá em cima analisar a analisar redução de dimensão fator clica em descritivos E aí e ali olha só onde que tá a níveis de significância é de ao teste de esfericidade de bartlett e
cá é melhor olha essa opção que a gente marcou que Gerou o teste de km ó e a sua cidade de marketing não é aquela opção lá que você tava não entendeu Entendi clique em cancelar você de rodar de novo e clique em cancelar Beleza Lá tá OK agora Zé deixa eu te fazer uma pergunta para mim analisar esse teste esse teste é eu tenho ele vou la marcar de novo para ficar fa ele deu aqui que ele deu um pique quadrado 748, 159 o DF é a o grau de liberdade de glicídios verdade E
o debaixo seria a significância significância do teste Deixa eu explicar isso aí para você e para todos os outros que isso é muito importante nunca levante Deixa eu ver se eu compartilhar minha tela aqui te perguntar uma coisa Zé vou sair daqui é aula na cabe é 6 horas aula acaba 6:30 a 6:30 acidente eu tô pensando que essa não o Cíntia Olha eu acho que a sua dúvida deve ser dúvida De todos os outros porque isso que a gente tá vendo no spss eu tô aproveitando para falar dos conceitos vale para toda para toda
né Tá todo mundo tá então vale e vale para todas as ferramentas tá então sem problemas você perguntar mas eu vou ir na quarta-feira a gente continua aí na segunda-feira a gente continua então é essa semana semana que vem a para gente esgotar o assunto análise fatorial Tá bom mas por isso que eu te falei a pregar mais para Frente sabe mas o que que é legal da gente fazer por exemplo eu acho que hoje a gente já conseguiu sanar muitas dúvidas e na quarta-feira para buscar um tanto de outras dúvidas e outra coisa o
seguinte caso necessário a gente pode marcar aula extra também tá então eu me disponho a fazer isso também dependendo da agenda de vocês quando tiver a gente pode marcar algumas aulas extras também caso seja necessário tá bom aham Então vamos lá então eu só quero te explicar é Então beleza Cintia finaliza aí por favor para de compartilhar que eu vou compartilhar a minha fé o quê é só um instantinho E aí E aí E é porque eu pergunto é eu fico com medo ciência preocupada com os colegas sabe que essa eu seja o espaço tá
sendo aberto a todos eles hoje várias vezes Assim primeiro que as suas dúvidas eu acho que elas são Gerais ela ajuda todo mundo e eu reforça o tempo inteiro né Igual quando o João Paulo interrompeu perguntou como você vai perguntando a hora que os outros perguntaram eles têm preferência mas caso não perguntem é que bom que você tá perguntando está participando entendeu eu estou entendendo o que eles não tem dúvida ou que a sua dúvida é comum a ele está ajudando eles entendeu Bom então de novo cara o espaço tá dado espaço tá aberto aí
em qualquer momento em qualquer instante caso tenham dúvidas diferentes das que a Cíntia nos apresenta tá pergunta não deixa passar não tá o espaço é de todos mas se não fizerem Pergunta a Cíntia vai ficar à vontade para fazer quantas ela quiser e o que ela quiser comentar Tá mas eu aproveito as dúvidas dela para explicar várias outras coisas também tá eu vou abrir Aqui né meu arquivo de dados i o show achar aqui espera aí vou rodar uma análise fatorial que bem rapidinho para aproveitar explicar algumas coisas aqui tá E aí E aí E
aí E aí E aí E aí E aí E aí já estão vendo a minha tela que o agarbatti observa em que aqui olha eu já tenho os fatores todos gerado aqui que eu já tinha executado isso eu vou excluir Aqui tá eliminei o Na verdade uma inveja eliminar inserir e eliminar então eu vou rodar aqui em Manaus arterial analisar redução dimensão fator no caso aqui eu vou usar as variáveis aqui da X6 até ax18 igual Tá lá com os slides tudo direitinho tá desculpa aí como é que você vai ficou tudo e passou tudo
assim olha eu cliquei na primeira pequeno 16 pressionei o shift e clique em na x18 Isso serve para aqui para qualquer lugar que você tiver trabalhando com esse tipo de seleção planilha Excel Se eu quisesse selecionar aleatório tá eu pressionei eu marquei uma ou com outro tal então no caso aqui eu marquei a primeira e a última impressionei shift Aí eu selecionei todo mundo de uma vez excelente então é igual o Excel Quando vai ser em cima na loja tá então marquei aqui as opções extração matrícula o Marcia componentes rotação varimax ar e o eu
queria fazer isso não O mal está doido finalizar a rotação continuar [Música] o outro ação celular continuar Ok Então Cíntia aqui olha o que que a gente tem aqui tá vou pegar eu estou E aí E aí E aí G1 e eu peguei aqui olha o que que a gente tem aqui eu tenho nesse caso aqui dessa minha base de dados tá então a gente tem aqui Que o Caio é melhor ao cá é melhor vale 0,61 é um km ó baixo ruim tá não é lá nenhuma maravilha não e eu tenho o teste de
esfericidade de bartlett eu tenho que quadrado eu tenho grau de liberdade dele Freedom e eu tenho a significância o que que esse teste então isso aqui é uma coisa e isso aqui é outra coisa esse teste de esfericidade de bartlett ele testa se a nossa Matriz de correlação é uma matriz identidade então né a nossa a nossa o h0 h0 é que a nossa Matriz qual Relação é igual uma matriz identidade a nossa a hipótese alternativa que a nossa Matriz correlação é diferente é de uma matriz identidade O que que é uma matriz identidade bom
é quando a eu não quero que eu não vejo mas é quando a principal lá é igual um resto é zero é exatamente então é a matriz a diagonal principal vale um e os elementos fora da Diagonal principal da vale zero né então nós estamos trabalhando aqui com agarbatti não sei Se vocês lembram nós temos avariada X6 X7 X8 X9 até ax18 que são as variáveis que eu selecionei aqui aqui eu tenho X6 X7 X8 então nós temos o que a nós temos a matriz de correlação o que que acontece se a nossa Matriz de
correlação for igual a matriz identidade e quanto que é a correlação linear entre uma variável e ela mesmo Então o que que significa isso olha só significa que a correlação entre X6 e X6 é igual algo beleza e a diagonal principal entre x77 igual a 1 entre X8 x8i igual a um mais fora desta na diagonal os valores valem 10 então se a nossa Matriz de correlação o r for igual a uma matriz identidade significa o que significa que não existe correlação entre as nossas variáveis e portanto a gente não pode aplicar a Análise fatorial
O que é um dos pressupostos para nós aplicarmos análise fatorial é que exista correlação entre as variáveis ok não faz sentido mas aí Zé Deixa eu te perguntar esse zero aí que você fala aí porque eu vi lá na hora da aula lá eu até anotei no lugar aqui que o teste de como é que ele fala barco é isso ele tem que ser igual a zero é esse nem com a 0 aí o que que eu vou te falar então a gente está testando Essa é a nossa hipótese nula Tá certo que a nossa
Matriz de correlação é igual a matriz identidade e a nossa importa se ela for ferrou Então os meus dados não são adequados para análise fatorial e então o que que eu quero eu quero refutar a hipótese nula eu quero aceitar a hipótese alternativa Então a gente tem um teste de hipótese aqui ó Então como que a gente faz o teste de hipótese né Essa é a nossa o nosso teste de hipótese na verdade aqui ele não faz um teste e Ele faz um teste qui-quadrado tá então vocês lembra lá da distribuição qui-quadrado e você bonitinho
a distribuição qui-quadrado é alguma coisa parecido com isso aqui né então é essa área inteirinha e ela vale um né Nós estamos fazendo um teste de hipótese a noventa e cinco porcento significância intervalo de confiança e noventa e cinco porcento então quando a gente faz isso esta áreas Vim aqui Vale 0,05 e essa área que vale 0,95 essa aqui Esta área é a região de aceitação de hz essa aqui é a região de rejeição de h0 Então como que a gente Analisa isso tá eu se nós se nós não estivéssemos utilizando software Cintia e demais
a gente teria que pegar esse que quadrado esse valor do que quadrado nós teremos que pegar o e nós teremos que lá numa tabela do que quadrado para nós acharmos o alfa a Gente iria lá com o valor do que quadrado t0que a 148 e o 78 de graus de Liberdade nós íamos lá e eu procurar o alfa então só que o alfa já é dado para gente aqui ó o alfa é zero então o que que significa esse Alpha Zé tá nós vamos olhar nessa área e nós começamos observar essa área da direita para
esquerda então nós observamos essas duas linhas e elas quando ela sobrepõe o valor da área vale zero aí nós começamos a andar da direita para esquerda então Tem 0000010 então nós achamos que o nosso Alpha é zero então né ele está onde tá eu tô olhando isso da direita para esquerda e o meu alfa = 0 então 10 é menor bom né é menor do que 0,05 Então se é menor do que 0,05 é até aqui nessa linha Vale 0,05 então se eu achei um Alfa uma significância um p valor né esse pesebe aqui menor
do que 0,05 significa que eu estou o que rejeitando a região de rejeição de h0 eu Estou rejeitando h0 estou aceitando então h0 rejeitada refutada estou aceitando a hipótese alternativo eu estou falando então que a minha Matriz de correlação ela é diferente da Matriz identidade e se ela é diferente da Matriz identidade significa que os meus dados tem correlação e portanto eles são adequados à aplicação da análise fatorial então Cíntia nesse teste esse e basta eu ver essa significância SP valor O spss chama isso de SIG em vários outros softwares nós vamos ver isso como
P valor e dello tá então o que que nós temos o senhor tem né valor P então o valor p é menor do que 0,05 ele não precisaria ser exatamente zero não poderia ser zero, zero, zero 23 0,038 ainda sim seria menor do que o 0,05 como ele é zero então o que que eu estou fazendo eu estou rejeitando a hipótese nula estou Aceitando a hipótese alternativa rejeitar a hipótese nula significa seguinte eu estou refutando eu estou recusando que a minha Matriz de correlação seja igual a matriz identidade estou aceita a minha hipótese alternativa que
a minha Matriz de correlação é diferente da Matriz identidade e olha que a gente quando a gente observa a nossa Matriz de correlação aquele gerado aqui olha só Matriz de correlação Então vou copiar Isso aqui também tá bom então o que que a gente tem aqui agora olha só essa aqui é a nossa Matriz coração tá o spss nesse out aqui ele gera essa Matriz de correlação para gente seguinte aqui em cima eu tenho a correlação aqui em cima tem a correlação aqui eu tenho p-valor tá então ele não gerou junto olha só tem uma
outra opção no spss que eu consigo gerar estudo junto Olha só se eu vier aqui Analisar o relacionar bivariável eu vou pegar aqui as variáveis X6 até x18 e eu tô gerando a correlação de piercings on-up ções média de Zico a variância não só a média ali tá bom continuar Ok eu gerei agora aqui olha só a correlação tá vendo Então aqui na correlação Olha só nessa Matriz que foi gerado aqui eu tenho o valor da correlação aqui olha menos 0,137 e tem embaixo p-valor essa tabela é exatamente Igual Essa de cima aqui olha Matriz
coração só que aqui eu tenho olha só a correlação na parte superior da tabela correlação e o p-valor na parte inferior da tabela Então olha só a correlação entre x 76 é menos 0,137 com p-valor 0,087 então o que que eu estou falando aqui né minha hipótese nula aqui que é que essas correlações e elas são é que essa correlação - 0 137 era igual a zero e a hipótese alternativa é que essa correlação de Farinha de zero aqui eu estou aceitando a hipótese nula para esta correlação né ou seja não há uma correlação estatisticamente
significante entre a variável x 7 a variável X6 então é a mesma coisa que olha só tá então aqui o que que tá diferente porque aqui ó eu considerei duas extremidades tá então é o fato de ser diferente nesse teste aqui de cima só tá uma extremidade por isso que o valor aqui é diferente tá mas então o que que nós temos então quando Nós aceitamos quando eu refutei a hipótese nula lá no teste esses dá esse felicidade baixas olha só a diagonal principal da Matriz vale um não é isso aqui que nós a nossa
Matriz identidade é diagonal Se esse fosse a se fosse né se a nossa Matriz de correlação fosse igual uma matriz identidade todos esses valores todos esses valores que estão fora da Diagonal principal a todos eles Seriam iguais a zero ou seja não teríamos coração mas isso não é verdade olha só aqui a gente tem uma correlação estatisticamente significante aqui a gente tem outra aqui a gente tem Olha só tudo isso aqui é estatisticamente significante Ó essas correlações estatisticamente significantes então o que que eu estou falando que os valores fora da Diagonal principal não são iguais
a zero são diferentes de Zero Então eu estou falando o quê que existe correlação entre vários pares de variáveis tá vendo quanto a correlação existe Olha só então deixa eu te perguntar a Zé na correlação na primeira coluna e do x15 que Deus era 1,27 ele já não deu do X 1500. Zero 27 porque ele é do que 0,05 Olha aí a 002 não é aqui em cima é o Valor da correlação aí o p-valor você tem que olhar aqui em baixo tá vendo Então entre x-11 e x 6 Ok olha só porque o p-valor
é zero o p-valor de zero o p-valor é zero então o p-valor é zero para esse aqui para esse aqui e para esse aqui então a X6 ela tem correlação com a X11 e com ax13 e com a x17 uma x17 entendeu Cíntia Entendi então o que a gente está fazendo mas eu não tenho né com as demais não porque é tudo na hora que Quiser 05 o p-valor Otto mano que reserva 05 maior maior maior maior maior acho que sete eu já devo ter a correlação com o X10 já vou direto lá embaixo tá
Zé 10xx 12xx 10 ex12 ifix 17 também olha aqui a 0,03 0,003 e com 18 Olha Zé Considerando o intervalo de confiança 95% 0,028 o menor que 0,05 Ah tá certo tá certo tá certo então a o Teste de a felicidade Barclays sem eu precisar de ver as correlações ele testa para mim isso essa Matriz é igual a matriz identidade ou não então se eu aceitar a hipótese nula no teste de esfericidade de bartlett significa que os meus dados não tem correlação e portanto eles não são adequados para utilização da análise fatorial então então deixa
eu te perguntar no teste lá que é naquela primeiro tabela que você deu ele deu o que R é diferente de ir Então é se o r é diferente de ir tem correlação não é tem correlação É isso aí e aí as correlações estão aí eu vou falar x 1 x na x64 X6 X3 X6 e não precisa nem de falar qual não vende detalhar isso é só falava que existe correlação entre alguns países Vale é importante não tá o quê que é o olho km ó o MS a e o barco os meus dados
são adequados à utilização da análise fatorial aí vem o outro detalhe tá Cíntia quando a gente o km ó ele se ele For ruim Observe aqui no nosso na nossa MS a quando a gente gerou aqui olha o matriz Ant imagem a nossa Matriz Ant margem a gente tem alguns valores por exemplo a variável X a 15 Novos Produtos o MS a vale 0,314 é menor do que meio então se eu tirar essa variável da análise ela vai melhorar o meu resultado só m o melhor hora então quando alguma o meu km ó for muito
baixo eu posso optar por tirar Essas variáveis que tem baixo MS a porque o km ó pode melhorar com essa variado tá só que eu não olho sol e nesse Ah eu olho também a comunalidade então a comunalidade da x15 era 0,968 é alto para caramba então o que que provavelmente vai acontecer se eu não tirar essa variável X 15 ela sozinha irá formar um fator depois lá no final ela não irá se juntar com outras variáveis Ela irá ficar sozinho e eu terei um componente com uma única variável Normalmente não é o que a
gente quer Oi gente a uma única variável mas aí a comunalidade dela é alto a 0,9 7878 Florenço a anti-imagem lá ela me deu 0,314 se eu fosse tirar ela não é bom né aí depende tem Tem lugares que por exemplo se eu estou desenrolar e o aplicado lá em marketing psicologia em outros lugares quando eu tô desenvolvendo escala para menstruação de alguma coisa se isso acontece lá a gente elimina variável porque eu não quero Mais nunca variável para medir comportamento Então a gente vai menina mas em algumas aplicações por exemplo né nesse caso da
análise fatorial indicadores financeiros normalmente a gente deixa a gente se você a comunalidade for alta a gente deixa essa variável a menos que o km-11 seja muito baixo aí a gente precisa fazer alguma intervenção para eliminar se não dependendo do contexto a gente tira tá dependendo do contexto a gente pode Deixar aí né a gente vai me conte a próxima aula que a gente fala sobre o MS a olha na questão da lista veja o que que tem tem esta tabela de comunalidade tá vendo Então naquela primeira questão tenha comunalidade tem isso aqui olha a
variância Total explicada Tá vendo só que você fez resumido só que eu fiz resumido na tabela só e tem essa Matriz componentes rotativo olha só só que elas são só dois fatores então juntei essas três saídas e montei aquela tabela só da Questão número 1 Ah entendi certo pessoa e aí a gente tem que fazer isso para isso para não tem que resumir desse jeito não mas você vai analisar cada uma das saídas que você for gerar né a gente vai analisar o km de sua cidade de embarque anti-imagem comunalidade variância Total explicada e depois
a matriz de componentes rotativos Moisés na próxima aula a gente continua e talvez na mas deixa mais para frente Zé para a gente ter mais mas vamos acelerando para gente fazer isso conseguir Cumprir o que a gente tem que cumprir tá bom e se for preciso entrar Marcar aula esse depois também pra gente dar andamento à pergunta de hoje então né falar para para para o para o o Beto o Google forms considerando a análise fatorial Hotel utilizando agarbatti o que nós Executamos qual que foi o percentual a variância Total explicada pelos componentes retidos e
considerando a análise fatorial que nós executamos e com arquivo agarbatti e qual foi a variância Total explicada pelos fatores retidos Observe que não sei tivemos cinco componentes EA variância Total explicada e 81 e meio E aí eu parei de compartilhar nasceu Compartilhar de novo só para mostrar para você espera aí ó e eu tinha parado de compartilhar depois que eu ver e olha só a minha pergunta foi considerando ou aplicação agarbatti que nós fizemos Qual foi o valor da variância Total explicada pelos componentes retidos então nós que tivemos cinco componentes olha aqui cinco componentes sentidos
EA variância Total explicada 81,5 fatores também né pode foram cinco fatores retidos com a variância Total explicada 81 e meio tá bom Isso é uma pergunta que tá em todos os exercícios aqueles lá que a gente tá executando é só para gente praticar isso mas a gente respondeu ele lá mas isto onde que ele tá aí os cinco fatores aqui ó um dois três quatro cinco aqui Olha tá vendo e aqui olha aí a gente vê na matriz de componentes também O que re re teve Olha só e o alto valor aqui ó valor próprio
Inicial alto valor maior do que um olha essa coluna do total de Deus era Olha então aqui o 5 é o maior do que um olha um vírgula e assim os seis já é 0,600 e 15 aquele Exercício se você se a gente tivesse pregado para meio ao invés de reter cinco componentes e derreter 7 tá vendo hahaha porque eu tava aceitando lá uma regra do negócio aí seria 0,5 mas nesse caso aí é um nós fizemos com um Ah entendi certo duas juntas neste Carneiro chefe por favor Tá deixa o momento certo para eu
me manda aí o nome por favor ok pessoal mais alguma dúvida além da ciência podemos parar por aqui nos vemos na quarta-feira tá certinho um grande abraço a todos então até quarta-feira encerrando ser transforma