É sobre um trabalho Ah eu não sei se ficou Claro a gente tem que usar o Júpiter é Júpiter lá Leve só que a gente poderia também usar o sspsps na verdade pode tá Eu recomendo muito utilizar o o o pai então por uma questão de aprendizado mesmo para a gente fixar tá mas se você quiser aí uma das Diferenças é o seguinte para quem for utilizar o spss é terá que produzir um arquivo do Word e fazendo um relatório levando os Conteúdos para lá né de montar um relatório e conteúdo lá no no Word
para me entregar um documento depois de PDF né Ele é fazer algo mas enxergar em PDF quem for fazer no Júpiter notebook né utilizando o pai quando Júpiter notebook basta me entregar o HTML Por exemplo quando consegui converter ou senão Se não conseguir converter ou o notebook mesmo então não precisa de tirar conteúdo de lá e montar o em paralelo a única coisa que eu sugiro É que para apresentação final que vocês vão ter que fazer quer ir na apresentação final vocês montem apresentação para não se perderem nos notebooks para não se perderem no isso
para carreira de vocês também para o trabalho Se vocês forem apresentar né para quem for trabalhar com isso uma coisa é quando a gente está desenvolvendo está produzindo a hora que você tiver que apresentar isso para alguém é melhor você fazer uma síntese De isso montar sua apresentação e conduzir a apresentação da forma mais segura e mais tranquila para vocês entendeu E esse apresentação a gente pode usar o esse ou é melhor continuar no Júpiter a apresentação você pode usar o PowerPoint você pode usar o prezi Como é que é o nome do bagulho lá
não é seu nome é mas você pode usar clientes peresi você pode usar qualquer Campo que você fazer apresentação tá beleza tem um lugar que é compartilhado O jogo terá que a gente ele tava também fazem pai tu só que é e como um grupo tal não é seria bem mais fácil Se fosse um grupo com baseado né que cada um poderia tem como existe essa possibilidade na verdade você pode colocar o seu arquivo numa nuvem qualquer né compartilhado E aí quem for fazer tem que tomar cuidado para não atualizar em todos ao mesmo tempo
mas você pode ler um arquivo que é compartilhado na nuvem quem vai Atualizando e replicado nos outros lugares entendeu É você tem uma nuvem um diretório sim no Google Drive o qual o seu papel no Andrade vi aí você Compartilha esse arquivo com a sua equipe e eles todos apontam para ler esse arquivo sim mas eu tava pensando em mais na questão de programar mesmo o que eu usei Eu uso o Google colégio Colégio você consegue compartilhar programa junto e se consegue é lá na você consegue se tiver lá nas duas vezes aí Você consegue
sem problemas bom então com qual era mesmo a tem os prós e contras presa Igual eu falei o principal contra que é que você toda vez tem que ficar configurando ambiente mas é muito rápido e não tem maiores problemas não é rápido não tem maiores problemas você deixa o inscritos lá pronto e tá tudo certo é e o grande benefício é que aí todo mundo acessa compartilha usa Então tá lá compartilhado né sim eu não gostei tanto Do colégio por causa de disso que você falou mas tem prós e contras mas é legal você já
se acostumaram com isso porque se vocês forem trabalhar em qualquer grande empresa aí tá que usa ambiente Google os ambiente a WS usa ambiente Microsoft é assim para quem tem espaço para quem trabalha como processamento em nuvem É isso aí a grande sacada é você deixar escrito pronto que hora que você for carregar você só roda algum script já automático já faz todos conf E aí vocês vão aprendendo aí não no decorrer da vida da carreira de vocês né mas quem quando a gente está nessas empresas para instalar na Algar Tech Algar Tech usa o
ambiente a WS da Amazon então quando toda vez que vai fazer processamento é isso tem que rodar as pontinhas configurar ambiente de não sei o que é do negócio é do negócio as parte do professor inclusive vendo vocês tem problema eu mandei para ele atividade já né mas é tentar primeira parte primeiros Códigos que tem lá é para configurar a biblioteca do panda tem problema deixar lá não tem não tem não isso na verdade eu até valorizo o Felipe porque eu tô vendo o aprendizado O que que você tá fazendo para além da do conteúdo
e análise dados Entendeu Tá além do conteúdo análise das quatro isso é digamos assim é bom não é esse não tem problema não e não gatinho eu pensei que você falou tá toda hora que eu tinha que abrir aqui A gente vai configurando eu desejo a o comando para um sol executar aqui tá pronto açaí tava HTML acabou ficando aqui como na beleza vamos lá como nós vamos Pode falar não eu tô achando o máximo tá pela primeira vez nessa disciplina eu tô tendo bastante perguntas bastante Douglas bastante comentários fico empolgado é pode fazer a
vontade o trabalho que a gente vai começar a desenvolver agora que mudar de vida começaram né É pode misturar por Exemplo spss com o pai então eu gosto muito dos gráficos que já no Excel eu vou utilizar como se fosse imagens pode pode fazer isso jeito se quiser aí se você for usar por exemplo gráficos do Excel mas for utilizar o notebook para entrega aí você carrega as imagens lá beleza entendeu sem problema não tem problema não processa fazer geral tudo certinho assim e na nossa vida na nossa vida para quem vai trabalhar com análise
de dados o Tempo inteiro a gente tá usando mais de uma ferramenta tá a gente não é escravo de uma ferramenta muito pelo contrário a gente usa mais adequada para aquilo que a gente é mais precisa determinados momentos então sem problema alguém o que vocês precisam de me entregar depois né e faz parte do aprendizado de vocês e de onde vocês forem atuário trabalharem é de e mantendo as coisas mais ou menos organizadas né então não dá para entregar um pedaço de uma coisa outro Pedaço no outro pedaço do outro e professor se vira para
avaliar que tá aí mas se vocês tomarem cuidado com a consolidação depois em uma coisa única ela quer seja no notebook deve seja no Word depois convertendo e em PDF sem problema algum sem próprio 0 problema o nosso conto não é a ferramenta aqui em análise das quatro a ferramenta para a gente é o é a Cerejinha tá e a gente eu faço muita questão de vocês aprenderem mas a ferramenta é o menos Importante para analisar de fato analisar as quatro é muito importante quanto eu uso então podem brincar à vontade com as ferramentas que
vocês quiserem dia que vocês quiserem tá bom hein Obrigada imagina E é pessoal para quem for trabalhar nossa como que nós vamos fazer né a gente tá entrando agora no assunto análise fatorial exploratória a esse já disponibilizei o material não mudam né Tem lá o PowerPoint tem o notebook e tem Também a lista de exercícios já para as entregas tem três entregas relacionados a nossa tutorial então a gente já tá acelerando e tem lá também as duas aulas do semestre passado né mas passado um pouco diferente né então foi o primeiro semestre já com 16
semanas e a gente tava ainda daquele modelinho de 9 Semanas então eu acabou que algumas Alguns Momentos Assim mês passado eu acelerei muito e não precisava ter acelerado tanto então com vocês a gente Está indo em um ritmo Mas mais cadenciado mais Ameno Tá mas tá lá disponível no mudo a aula da nossa material em e as ipss EA aula da Equatorial é hein pai tô então o de hoje né e o que a gente for caminhando aqui se quiserem né antecipada e já ver algumas coisas tem lá as aulas do período passado já que
dá para vocês assistirem entenderem bem previamente do que a gente tá falando tá deixa eu compartilhar essa tela aqui com Vocês e eu vou abrir aqui o material e o E aí E aí E aí e para quem quiser tá quem for trabalhar para quem for Reproduzir agora que a gente vai comentando se quiser aí reproduzir se quiser fazendo nós vamos trabalhar com a base de dados que tá lá também disponível no mudo para vocês ela Tá ela está disponível no formato xlsx Excel e também no formato é essa é a ver é o arquivo
agarbatti esse arquivo agarbatti vou abrir aqui tá no material Tem o quê que esse arquivo Fala direitinho para aplicação de code e para tomada gostosuras você fez critérios para mim necessário fosse seus dados crescendo sim G1 G1 E aí Oi oi oi eu não posso fazer que não mudou E aí belê E aí E aí E aí e tem assuntos gerais se for acabar isso aqui olha ele Excel tá vendo arquivo de dados utilizado na disciplina não achei eu tô procurando na base de dados o link para download na essa aqui é mais para trabalho
que o trabalho da A press opções de trabalho aqui embaixo lá embaixo o mesmo perto das letras que a gente vai ter que fazer esse script a gente vai utilizar muito né esse aqui é esse aqui é o da análise fatorial então quando a gente quiser fazer análise fatorial utilizando o pai foi esse escrito aqui que nós vamos utilizar ele tem algumas coisas que tem nesse primeiro né que a gente que vocês praticaram desenvolveram e tem outras coisas que já são específicas da análise Fatorial xingar você vai explicar a matéria matéria e fosse ficar primeiro
e depois a gente executa isso utilizando o pai também e a bagagem de vocês em paz então agora ela vai ser incremental porque a gente teve aquela aquela pela parte introdutória algumas formas de nós explorarmos os dados e algumas delas nós vamos repetindo nos conteúdo só nos acrescentando outras então agora né É expandindo aí as fronteiras do conhecimento tá bom Tá certo então vamos lá o que que a gente tem olha só que eu sou um instantinho e a gente tem um arquivo é esse arquivo agarbatti que vocês estão vendo agora e esse arquivo ele
tem a seguinte estrutura E aí e eu tô maximizando a tela aqui tá paro de ver vocês qualquer coisa abra o microfone enxame Então esse arquivo pessoal é um arquivo que ele vem na ele É um arquivo do livro do Fávaro do Fábio não desculpa do Hair que é da nome do livro análise multivariada de dados tá aí na nossa na nossa bibliografia é um dos livros referência na nossa área tá na área de análise de dados principalmente aplicado à gestão de uma forma geral e bem bacana E esse arquivo de dados a gente utiliza
eu utilizo ele em todo uma Praticamente todo modo em todo o conteúdo que o ministro de estatística mas esse arquivo é aquele Arquivo Benvindo que é preparado para as coisas darem certo que é o que a gente não encontra na vida real então né nas disciplinas aqui nos desenhos o arquivo funciona ele já era as coisas como deveriam ser porque ele é um arquivo preparado para dar certo não é o que a gente vai encontrar na vida real eu queria esse arquivo que nós temos nesse arquivo tá agarbatti isso aqui eu tô explicando hoje vai
valer para todo o conteúdo que a gente foi trabalhando Aqui em analisar os quatro tá então a gente tem né agarbatti A é uma empresa e essa empresa né esse arquivo aqui o quê que agarbatti fez ela fez uma pesquisa com 100 clientes dela então tem do cliente um até o cliente sem ela fez uma pesquisa uma pesquisa de mercado uma pesquisa de marketing né ela coletou uma série de informações cada variável no nosso banco de dados né o cliente ele tem um código dele lá tá como ID identificador a ID identificador e a Empresa
gabassi ela tem alguns extratos de clientes que ela que ela pesquisou e ela queria saber o seguinte qual era a percepção dos clientes dela em relação alguns atributos dessa empresa então ela queria né a empresa agarbatti queria a ciência avaliasse a empresa gabate queria que seus clientes avaliassem a qualidade do produto é o comércio eletrônico da empresa agarbatti o suporte técnico da empresa agarbatti oferece aos seus clientes como que Agarbatti soluciona reclamações os anúncios da empresa gabate as linhas de produtos da empresa agarbatti a imagem da equipe de vendas os preços com PS são competitivos
ou não garantias e reclamações Novos Produtos encomenda e cobranças flexibilidade é de preço e velocidade de entrega Então são esses nessas essas 13 características esses 13 atributos que a empresa agarbatti pediu para que e sem clientes avaliasse a as características desses atributos descem Preso então as notas variam entre 0 e ideia então por exemplo qualidade E se eu sou cliente da empresa gabate eu participei da pesquisa e eu dei a nota zero para a qualidade do produto significa que eu estou extremamente insatisfeito Neto terrivelmente insatisfeito com a qualidade dos produtos da empresa agarbatti por outro
lado se eu dei uma nota 10 Eu estou absolutamente satisfeito com a qualidade dos produtos da empresa agarbatti Então Essa é nossa base de dados e que a gente trabalha aqui né nesses exemplos para análise fatorial depois para cluster e depois para a regressão logística também a gente trabalha com o mesmo arquivo exatamente com o mesmo arquivo o arquivo não tem só essas colunas ele tem outras colunas tá então o arquivo nós temos lá o abate esse ativo aquilo que ele tá em inglês aqui mas sem maiores problemas tá então o que que a gente
tem aqui olha só o de novo Olha só então nós temos a Nossa base da nós temos em casos em observações Olha que tem até ao cliente número sem então nós temos algumas variáveis aqui na nossa base de dados então o que que nós temos aqui olha só a variável x 1 é o X1 é o tipo de né o chama aqui de câncer mais Type mas na verdade é o tempo de relacionamento do cliente com a empresa se ele tem menos de um ano de relacionamento com a empresa se ele tem entre 1 e
5 se ele tem acima de 5 anos Então esse sem clientes da empresa gabate tem uma quantidade deles que são clientes novos tem menos de um ano outra quantidade de clientes que tem entre 1 e 5 anos e outra quantidade que tem acima de 5 anos não é o tipo de indústria que esse cliente é né então eu Zé Eduardo eu sou de revistas ou do jornal né então é o tipo de indústria que eu clientes ou o tamanho da minha empresa a mesa classificada como pequena né que tem entre 0 e 499 funcionários ou
se é Uma empresa grande acima de 500 funcionários de qual região que esse cliente é ele é um cliente da América do Norte eu levo um cliente de fora da América do Norte o sistema de distribuição e o cliente Zé Eduardo é agarbatti me entrega de forma direta ou ela entrega através do terceiro ela tem um terceiro para me atender né um broker para me atender então são essas né essas características da variável X6 até a variável x 18 é a avaliação que cada um Dos clientes faz duas né desses atributos das características da empresa
gabate e no final das contas aqui então ainda tem uma nota relacionada a satisfação Geral do ele avalia cada um dos itens então ele é o cliente entrevistado pesquisado ele dá uma nota para cada um dos itens dos atributos das a avaliados e ele dá uma nota para a satisfação geral também então a variável x 20 qual que é a probabilidade de Eduardo recomendar a empresa agarbatti Para alguém e qual que é a probabilidade de eu cliente José Eduardo comprar de novo da empresa gabate Qual que é o meu nível de compra da empresa agarbatti
esse eu consideraria fazer aliança estratégica com a empresa agarbatti ou não então são vários né várias informações aqui dá para nessa base da lindamente preparado dá para gente aplicar uma série de técnicas estatísticas utilizando a mesma base de dados é provável que algumas Bases dados que vocês vão trabalhar aí elas não sejam adequadas para aplicar todas as técnicas estatísticas que a gente pretende utilizar então às vezes vocês vão perceber que lá na frente na hora que eu for rodar regressão logística por exemplo a talvez eu tenho que utilizar uma outra base que essa base aqui
não foi a base que eu estou trabalhando no trabalho final Natividade sinal não foi adequado mas a gente vai vendo Então essa é a nossa base da diz Que a gente tem tá E aí e o que que a gente tem né a gente tem quando a gente está utilizando estatística para analisar dados de uma forma geral aí a gente tem algumas situações tá a gente tem a o que a gente chama de estatística tem algumas classificações né a gente tem estatística univariada a estatística 1 e variada estatística bi ou multivariada bom então o que
que acontece quando a Gente está fazendo a estatística que a gente está aplicando a estatística univariada lá naquele arquivo nosso por exemplo nós falamos nós temos da variável X6 qualidade dos produtos até ax18 e são notas de 0 a 10 que os clientes do 1 até o 100 eles deram para a empresa H bate aqui né então foram avaliações notas de 1 a 10 então quando eu pego a variável X6 eu estou analisando a variável X6 Aí eu pego e faço aqui qual que é a Média né Qual que é o X6 médio qualquer desvio
padrão da X6 Então olha o que que eu tô fazendo né Qual que é a variância da X6 Então o que a gente tá olhando aqui né é uma variável única uma Uni então quando eu estou fazendo analisando mesmo que o análise todas de uma vez eu estou analisando né eu Gero uma saída um bloco de saída mas eu estou analisando uma única variável por mês mesmo que as análises estejam sendo feitas todas ao mesmo tempo mas eu estou analisando uma Variável de cada vez Então nós estamos aplicando estatísticas univariadas né Nós estamos analisando uma
variável por vez Então tem momentos que nós fazemos análises univariadas né e tem momentos que nós vamos precisar fazer análises bivariadas e multivariadas a e do trabalho de vocês principalmente não limitado a né mas principalmente nós estamos falando de análises univariadas mas não limitado ar porque tem algumas coisas aqui que dá pra gente fazer Algumas análises bivariadas multivariada AB variada né quando estou utilizando duas variáveis então eu tenho aqui por exemplo né eu tenho gênero lembra-la da nossa base de clientes com o cartão e a gente tem que estar de civil bom Então olha o
que que eu tô fazendo quantas pessoas do gênero masculino e feminino solteiro é casado divorciado viúvo Então olha o que que eu estou fazendo né a hora que que nós fazemos aqui eu quero saber a quantidade de Clientes em cada uma dessas situações tá então o que que a gente tem eu tenho duas variáveis eu tô fazendo uma análise bivariada eu tô fazendo uma tabela cruzada uma tabela de dupla entrada utilizando a variável gênero EA variável estado civil Então eu estou fazendo uma análise bivariada então no trabalho nessa primeira etapa de vocês né Eu espero
muito análises univariadas e principalmente Mas também de novo não limitado a gente viu lá em análise de Dados um e dentro do possível análises bivariadas o até multivariada se for o caso é nessa primeira parte do trabalho de vocês como vocês viram muito em análise de dados três né já a ideia de análise de dados multivariados então quê que é análise dados multivariados nós estamos analisando várias variáveis ao mesmo tempo então nós estamos utilizando várias variáveis ao mesmo tempo Aí quando a gente tá falando dessa análise Multivariada né Fabi também algumas situações Tá mas só
nós estamos falando da análise multivariada aí nós falamos né as grandes grupos técnicas tá ele se dividem principalmente aqui em dois grandes grupos as técnicas de dependência a dependência o e técnicas de interdependência Oi e aí tem né as histórias agora de interdependência de algoritmos é é é se os algarismos são monitorados se não são Monitorados ele tem outras começa a Rigor a Igor e se resume a essas duas coisas o que que são essas técnicas de dependência e as técnicas de interdependência na técnica de dependência eu tenho uma ou mais variáveis dependentes e uma
ou mais variáveis Independentes vocês viram lá regressão linear multivariada né que eu tenho uma variável Y que a minha variável dependente que ela Depende de que ela depende É de uma variável independente x 1 mais uma variável independente x 2 mais uma variável independente X N então é estas aqui em São variáveis dadas são variáveis Independentes são variáveis dadas né são variáveis que eu de alguma forma conheço a priori então elas são variáveis Independentes que a gente já conhece essas variáveis a priori e no outro lado aqui a gente tem a nossa variável dependente Então
a nossa variável dependente Ela depende disso Aqui né Então essa conjunto de técnicas é chamado de técnicas de dependência exemplo disso né É cada um de vocês tem um cartão de crédito alguns vocês deve ter o nubank e o nubank ele pede algumas informações e ele vai dar para vocês um limite então o nosso limite no cartão nubank e ele é igual a um beta 0 mais um beta um às vezes aquele pergunta sua data de nascimento edad é mais um beta 2 aqui às vezes vezes Renda comprovada às vezes tenda mais sei lá um
beta 3 aqui beta 3 vezes é Patrimônio valor do património que você tem Então olha o que que acontece hoje eu Zé Eduardo eu vou pedir um cartão de crédito né nubank Por exemplo eu não sei qual limite eu tenho né o meu limite ele depende né É esse aqui é hipotético um exemplo tá ele Depende de qual é a minha idade a minha idade é nada eu tenho né Eu tenho 49 anos a minha renda é nada né eu ganho r$ 1500 o meu patrimônio é dado eu tenho patrimônio de 10 mil reais então
baseado na idade baseado na renda e baseado no meu patrimônio essas coisas são dadas a gente já conhece a priori por isso que elas são chamadas de variáveis Independentes o que já dá Eu sei né A partir dessas variáveis a gente vai determinar definir o valor da nossa variável dependente Então a nossa variável dependente Ela depende das nossas variáveis Independentes tá então Isso é o conceito a ideia de técnicas de dependência então é muito utilizado em vários vários Compensa em várias situações né e né não também não limitado mas os dois principais né os dois
Talvez né é o principal grupo de técnica de Independência Que nós conhecemos são os modelos de regressão agora a gente tem uma infinidade de regressão né ele tem regressão linear linear binária a linear multivariada em regressão logística tem uma variar tem Uma grande variedade de regressão Logística em análise de dados em painel Então a gente tem uma série e de técnicas estatísticas que nós tratamos essa relação de dependência tá então nós queremos definir o valor de uma variável baseado em outras variáveis Então existe uma relação de dependência no caso da interdependência né Desse conjunto de
técnicas de Nat que a gente chama de técnicas que tratam os dados as variáveis uma relação de Interdependência nós não temos a variável Y dependente e as variáveis x como como Independentes na verdade nós temos o que que é o que a gente vai ver da análise fatorial né Nós temos as variáveis T6 X7 X8 até ax18 no nosso caso aqui e nós queremos ver o seguinte como que essas variáveis elas se combinam ela se relaciona uma com as outras como que ela se Inter e dependem tá então tem as técnicas de interdependência então A
análise Fatorial que nós vamos tratar né é esse primeiro conteúdo que a gente vai tratar e análise de cluster segmentação são duas técnicas de interdependência nós não temos a variável dependente e variáveis Independentes né as variáveis interdependentes inter-relacionam Então esse é o conjunto esse grupo de técnicas nessa Edson esse esse amontoado aí só chamados de técnicas de interdependência de dados e é isso que a gente vai trabalhar com análise fatorial e a gente Vai explicar melhor agora Como que você gosta funcionar tá essa primeira visão dúvidas perguntas sim sim não não tá tudo tranquilo por
enquanto então vamos lá eu tô explicando isso aqui e a gente vai rodar uma análise fatorial Hoje completa no Excel no spss para gente ver do começo ao fim e aí na próxima aula a gente vai voltar a explicando mais detalhes aprofundando mais explicando mais detalhes tá Então olha o que que nós temos a nossa base de Dados tá no nosso pagar bate lá e você quer uma foto lá no abate Então a gente tem o que olha só dá variado X6 até a nossa variável x 18 da X6 até a variável x 18 são
aqueles né as 13 os três atributos 13 atributos da empresa agarbatti Oi tá agarbatti bom então é o que é que nós queremos pessoal análise fatorial exploratória né o que nós queremos no final das contas análise fatorial exploratória que é isso Que a gente tá vendo aqui que a gente está tratando Nós queremos ver o seguinte olha só a gente tem 13 atributos a gente tem 13 variáveis então tem a variável um dois três quatro cinco seis sete oito nove dez onze doze treze então análise fatorial um dos objetivos da análise fatorial Talvez o principal
Esse é o objetivo dessa técnica de aplicar essa técnica é reduzir a reduzir dimensionalidade um dos dados E o que que significa isso nós temos 13 variáveis às vezes analisar essas três variáveis controlar essas três variáveis às vezes né Aqui tem 13 poderiam ser 30 40 50 100 200 500 então o como que eu Qual o objetivo que nós aplicamos análise fatorial exploratória para que para ver se nós conseguimos agrupar juntar criar os fatores os componentes né baseado nessas variáveis O quê que significa isso né pode Será que hipoteticamente também tá e a variável x
6 x 9 EA x18 elas vão se juntar e formar o componente e ela se juntariam e formaria um por exemplo componente O componente um o fator um componente um AX7 não seria aqui por exemplo de 6 x 9 e x 18 não há como assim como que ela se junto né a uma das daí já respondendo tá Alexandre é a Uma das uma das formas de nós vermos como que essas como que essas variáveis podem se agrupar ou não como Que elas podem se juntaram não é baseado na análise dos componentes principais é uma
das principais técnicas de extração desses fatores extração dos componentes análise dos componentes principais ACP análise de componentes principais é uma das principais técnicas de não as observar mousse as variáveis como que as variáveis se agrupam se é possível ela se agruparem ou não análise de componentes principais é baseado em é em correlação em correlação linear de Pearson a correlação linear de piercing é baseado em média e dizer bom né E covariância então a gente está vendo né a gente vai explorar isso eu vou explorar assim como vocês ele depois desse mestre que as principais coisas
da estatísticas são os fundamentos básicos se a gente entende bem conhece domina sabe o mecanismo funcionamento de média e desvio padrão a gente vai saber quase tudo em estatística a partir daí a gente precisa de entender muito bem esses Conceitos nos conceitos básicos porque o resto depois tudo é derivado de isso é consequência disso tá então respondendo à pergunta qual é a pergunta de hoje né Qual é o principal método utilizado para a extração dos componentes para citação dos fatores em análise fatorial exploratória o principal método é análise dos componentes principais ou ACP Então essa
é a pergunta e essa é a resposta e aí então agora o que a gente vai fazer a gente vai rodar não é spss A análise fatorial para vocês entenderem ver em funcionamento como um todo EA gente explicando alguns conceitos hoje alguns fundamentos e obviamente amanhã a gente retoma em volta nisso pra gente sedimentares ou digitar isso Março tá Então olha o que que nós temos né então nós queremos nós temos 13 variáveis nós temos 13 variáveis e nós queremos ver se é possível agrupar essas variáveis em né Em menor número e o menor número
que nós chamamos de fator por isso que a análise Fatorial exploratória se ache 6x 9x 18 se juntaram né Nós vamos chamar isso ou de componente um ou de fator bom então por isso que análise fatorial que nós vamos ver como que as variáveis se agrupam e vão se juntar para formar o fator tá então por isso análise fatorial já para facilitar para não haver dúvida ou para não pairar a gente está falando de agrupamento de variáveis agrupamento de variáveis porque o próximo assunto que a gente vai tratar em análise de Cluster nós vamos tratar
de um agrupamento de casos Então como que nós agrupamos os casos nesse caso aqui como nós agrupamos clientes então quando a gente for agrupar clientes análise que nós vamos aqui a gente tá fazendo análise fatorial para agrupar variaveis depois a gente vai fazer análise de cluster e o cluster eu vou segmentação e o Agro conglomerados né conglomerados Oi gente vai vai ser o próximo conteúdo que a gente vai ver e quando a gente tiver falando disso aqui nós estaremos falando de como que nós agrupamos os clientes né Então a nossa base lá tem essa base
dados nossa tem sem clientes né então nós vamos ver nós vamos rodar e vamos ter aqui um grupinho de cliente um grupinho de cliente e o outro grupinho de cliente aqui em um outro grupinho de cliente aqui então nós vamos ver como que nós agrupamos e Formamos os melhores agrupamentos possível né Então a hora que ele for tratar disso de 100 clientes que nós temos Então como que nós dividimos esse sem clientes em grupos menores e homogêneos né que sejam iguais o que seja muito parecido tá isso vai ser assunto do Nossa do nosso próximo
tópico aí que análise torcer depois o análise e segmentação Ok eu uso das perguntas tá tranquilo você então com spss aberto a hora que vocês forem ver tá eu não Atualizei não é o PowerPoint tá ele não está atualizado mas lá no a tela está em inglês mas é muito parecida tá então eu tenho inclusive já todas né opção de menu então a las analisar a redução de dados fator então eu tenho lá no material no PowerPoint tá inclusive com a opção que entra o como que nós Quais quais opções que nós selecionamos que nós
escolhemos Então está bem detalhado do material EA gente vai ter oportunidade de fazer isso aqui tal de Vocês verem aula desse período aula no período passado e tem bastante material aí para gente fazer isso tá aqui utilizando o spss e depois também utilizando o pai tão conforme nosso combinado então aqui eu já importei e ele só tem um arquivo aqui o h bate lá no mudo eu acho que time que céu mas vocês agora já sabem como que importa o Excel para o spss e esse arquivo meu está a salvo em SS a extensão dele
aqui é essa é a vi então eu tenho agarbatti. É se a ver então nós queremos fazer o que nós queremos ver né se é possível e em sendo possível Qual que é a configuração final dos nossos das nossas dos nossos fatores que serão formados Então como que a gente vai fazer isso não é spss Tá e por isso agora a minha opção de fazer isso primeiro no spss para vocês entenderem entender e visualmente entender EA mecânica e depois fica muito tranquilo da gente rodar e replicar isso lá no quarto tá se A gente vai
direto para o quarto talvez fique mais difícil de nós vemos nós observar então aqui no spss com onde qual opção de menu que a gente o material então a gente vai analisar a redução de dimensão eu falei para vocês que a técnica de análise fatorial né o principal objetivo dela é reduzir dimensionalidade nós queremos analisar algumas variáveis e deixa essas variáveis se agrupam se ela se organizam se ela se forma em grupos menores Então Nós vamos fazer análise fatorial fator tá então é essa que opção não é espécie S para a gente rodar análise fatorial
selecionei aqui nós queremos analisar quais variáveis aquela que a gente já começa né eu vou falando algumas coisas tá esta até tem outras técnicas de agrupamento de variáveis que as variáveis podem ser ordinais podem ser nominais análise fatorial utilizando principalmente né os componentes principais é requer que as nossas Variáveis sejam métricas sejam numéricas Então no spss lembrem-se que a variável precisa ter uma né uma regrinha 1,5 bom a gente saber que essa variável uma variável métrica e quais variáveis que nós queremos agrupar é necessário ter uma certa lógica né Eu quero agrupar qualquer coisa às
vezes não faz sentido então aqui nós queremos tentar agrupar das variadas X6 até a variável x 18 que são aquelas variáveis que avaliam características da empresa gabarito Essas três e variadas elas medem características de produto características de preço características de força de vendas características dos processos de de entrega distribuição de cobrança de resolução de reclamação então nós queremos ver se essas variáveis se ela se a grupo e se agrupam agrupam como né então eu estou escolhendo aqui essas variáveis e prestem atenção por favor tá não é porque uma variável ela é armazenada Como o número
que ela tem características propriedades métricas a variável x 1 ela está armazenada como é zero 12 né então clientes com menos de um ano de um ano assim que é acima de cinco anos né a variável x 4 é zero é o cliente a da América do Norte e um o cliente é de fora da América do Norte Então tá armazenada como o número mas não tem propriedades numéricas propriedades métricas ou seja não faz sentido eu fazer a média de uma variável Dessa por exemplo né Porque Posso até fazer mas não achar a proporção né
quando eu passo a média entre 0 e 1 na verdade eu acaba achando a proporção de 1 mas para a média como média não faz sentido eu fazer a médica uma variada dessa não faz sentido fazer desse padrão então a hora que vocês Principalmente nos trabalhos que vocês forem fazer no trabalho disciplinas fiquem atentos se as variáveis se você está utilizando elas são realmente variáveis com Propriedades métricas Ah tá então é preciso tomar esse cuidado é preciso ficar atento então nós queremos ver essas variáveis da X6 até ax18 e aqui na opção do spss né
eu tenho alguns eu posso já aqui analisar várias coisas então aqui olha só nós temos opção de estatística descritiva as então nós clicamos em descritivos e eu quero olha só descritiva univariada o que que essa descritiva univariada né eu vou para cada uma das variáveis que eu tô Utilizando eu vou gerar média o gerador de padrão eu vou gerar a quantidade de casa porque ela variável para cada uma delas individualmente então eu tô gerando estatística descritiva univariada é eu vou gerar também uma análise bivariada tá então eu vou gerar a matriz de correlação na duas
com esse aí com coeficientes o nível de significância eu quero gerar e essa Matriz determinante o teste de esfericidade de bartlett e o km ó e eu Vou gerar também a matriz Ant imagem parece aqui amanhã a gente vai entrar em mais detalhes nisso mas o que que acontece análise fatorial ela é baseada na qual relação na correlação linear de piercing então eu quero saber o seguinte olha Matriz de correlação se eu gerar uma matriz de coração dos meus dados e não houver com relação suficiente entre alguns pares variáveis significa que me a base de
dados não é adequada para aplicação da técnica de análise fatorial Então é necessário que existe algum nível de correlação entre as variáveis né E a gente tem é o teste eles felicidade barca que o km são estatísticas para gente ver o ajuste do nosso modelo estatístico que a gente tá fazendo da nossa análise sobre aula se os resultados gerados eles são adequados ou não são adequados e o exame de imagem ela gera também uma uma estatística para a gente analisar variável o variável que está presente na Minha análise fatorial que eu estou né que eu
estou analisando então a gente está pedindo para gerar essas estatísticas né Essas análises e aqui vem o seguinte já qual o método de extração dos fatores que você vai utilizar então né Tem vários métodos o mais utilizado é componentes principais mas a gente tem quadrado os mínimos não poderá dos quadrados mínimos generalizados máxima verossimilhança faturação pelo isso principal faturação Alpha contração da imagem então mais comumente utilizado né E tem outros não não se limita a esses aqui também não tá o que nós mais utilizamos é o método dos componentes principais tá então é o mais
utilizado bom E nós queremos analisar pela Matriz de correlação a gente Poderia gerar um gráfico aqui também é isso aqui depois vocês vão entender né então o nossa base de dados tem 13 variáveis tá então cada variável baseado no método do componente Principal cada variável gera um componente eu tenho 13 variáveis de entrada eu vou ter 13 componentes de saída mas nem todos esses componentes nós iremos utilizar Nossa solução final porque que nós não iremos utilizar porque a ideia é reduzir a dimensão se eu tenho 13 variáveis de entrada e eu vou usar os 13
componentes que foram gerados para quê que eu gerei análise fatorial se eu estou utilizando as mesmas né gerei de 13 variáveis 13 Componente então A ideia é nós retermos utilizarmos um número menor de componentes e um e a gente tem os critérios né Tem alguns critérios que a gente e já para determinar no nosso caso aqui das 13 variadas de entrada quantos componentes nós iremos e ter um desses critérios é baseado em Alto valores então nós só iremos reter na lista de exercício de vocês têm um exercício para fazer com alto valor igual a 1
e depois Tem para trocar esse alto valor para meio para vocês verem o que que acontece tá ou eu Poderia gerar um número fixo de fator eu tenho 13 variáveis eu quero gerar cinco fatores cinco componentes tá então isso aqui a gente usa muito às vezes quando a gente tem algum estudo prévio quando eu estou reproduzir indo alguma pesquisa algum trabalho eu já tenho alguma informação o mais normal é a gente né é extrair baseado em alto valor e também uma unidade padrão é um O Que que significa esse Hum que cada componente retido com
alto valor maior t1se O componente ele é capaz de explicar pelo menos o equivalente a variabilidade de uma variável né então maior que um significa isso que eles né esse esse componente que a gente vai reter ele tem capacidade de explicar pelo menos uma variado se ele não é capaz de explicar nenhuma variável ele é de menor utilidade para nossa análise fatorial tá Continuando então uma outra coisa que a gente faz né é um grande medida né o que nós fazemos de estatística de análise estatística é baseado em álgebra matricial em cálculos matriciais né então
por isso né Vocês viram lá álgebra linear Porque grande medida o que nós fazemos na na estatística é baseado em Matriz a baseado em álgebra então o que que acontece quando a gente já era o os fatores daqui a pouco a gente vai entender para vocês às vezes nós temos Que definir e ao componente a variável irá ser grupar E aí às vezes é difícil porque o valor a carga fatorial da variável né para o componente um e para o componente dois às vezes é muito próxima então o que que a gente faz a gente
usa um artifício né de fazer uma rotação uma operação matricial e a gente faz esse método de rotação o o mais utilizado também ao varimax tá então a gente faz essa rotação varimax tem outros depois Eu explico para você está então para gente faz para facilitar a visualização de Qual componente cada uma das variáveis irá pertencer continuar eu vou salvar na nossa base de dados tá o score o valor para cada um dos fatores que nós utilizarmos a gente tem alguns métodos para isso o que a gente mais utiliza também ah ah é o método
de regressão e nós vamos criar outras variáveis na nossa base de dados a partir dos fatores que a gente for gerar E qual o valor nós vamos aqui como que nós vamos atribuir valor para essa variável para gerar a gente vai utilizar né o método de regressão mas poderia utilizar outro valor Aqui também tá continuar opções aqui não vou marcar nenhuma dessas opções continuar então viram que a gente fez né eu selecionei as variáveis as variáveis que eu quero analisar se elas são capazes de se agruparem um conjunto menor de variáveis observa em que o
meu arquivo tem várias Outras variáveis Mas deliberadamente eu não quero agrupar as outras variáveis porque elas não fazem parte do meu estudo o coração naquilo tem outros interesses e outras necessidades mas elas não são parte da minha análise fatorial então parte da minha nossa tutorial são essas variáveis que aqui nós trazemos e vou aí se eu poderia clicar em qual lá para jogar sim taxi lá para o arquivo de script ou clicar em Ok e gerar aqui a Saída né as nossas saídas de dados então geramos rodamos aqui a nossa análise fatorial tá então o
que que a gente tem aqui é a gente tem aqui o seguinte a gente pediu né então nós temos aqui algumas informações do lado esquerdo aqui que nos mostra o título observações o conjunto de dados etc etc aqui que a gente tem mesmo análise fatorial Então olha só nós temos aqui o primeiro bloco né eu posso clicar aqui desse nesse lado esquerdo olha só eu estou clicando aqui Em cima de estatística descritiva ele me mostra a caixinha de estatística descritiva aqui do Ah tá se eu clicar do lado esquerdo ele posiciona né naquele conjunto de
dados que eu tenho do lado direito então cada vez que eu clico aqui do lado esquerdo eu posiciono conjunto de dados que eu tenho do lado direito então aqui o que eu havia comentado com vocês olha só a gente tem estatística descritiva então o que que eu tenho univariada que foi o Que a gente havia pedido lá do outro lado então o que que a gente tem o X6 qualidade do produto XS atividade de comércio eletrônico X8 suporte técnico resolução de reclamações propaganda linha de produtos imagem da força de venda preço competitivo garantias na em
reclamações Novos Produtos é pedidos e faturamento flexibilidade de preço e velocidade de entrega então quando a gente olha aqui olha só são 100 clientes que responderam né Então a hora que a Gente tem aqui ó O que que a gente tem que olha só é então que a gente tem aqui o seguinte olha só e a gente tem ao nosso n Olha só análise ele então eu não tenho dado faltante para nenhum dos das observações para nenhuma das variáveis todas elas né tem sem observações então eu tenho 100 clientes que responderam qualidade do produto sem
clientes que garante que responderam né é atividades e Comece Então a gente tem seguinte olha só que eu é o que a gente tem aqui o seguinte olha só a nós temos sem clientes e sem clientes um para cada uma dessas opções o indivíduo ele poderia dar uma nota que variava de 0 até dessas então é só a nota média que os clientes deram para qualidade do produto uma nota entre 0 e ideias eles deram uma nota 7,8 Ah tá então mano a tem 30 ideias né se Eu somar a nota que cada um dos
100 clientes deram para qualidade dos produtos e / sem então nós chegamos a uma nota média para a variável X6 qualidade o produto igual a 7,8 e o desvio padrão aqui né o erro desvio de 1.39 tá então o Wii tem melhor avaliado pelos clientes da empresa agarbatti né que tem a maior média é a qualidade dos produtos e o item com pior avaliação é o item pior avaliado é atividade de comércio eletrônico né então a variável O X7 também uma nota entre 0 e 10 a variável x Sérgio recebeu Nota três. a 67 então
aqui né olha só isso que eu falei o que que ela estatística univariada porque a gente está analisando ax6 AX7 esses oito uma de cada vez uma independente da outra né então nós temos a situação aqui da dos vários atributos que foram avaliados tá então nós temos aqui a estatística descritiva a nota média para cada uma dessas dessas dessas dessas variáveis Ele que nós estamos analisando tá então a base para a análise fatorial eu falei para vocês né é que exista correlação entre os dados então o que que nós temos que observar nessa aqui é
uma matriz de correlação linear de pearson então o que que a gente tem aqui olha só a matriz de correlação né então o que que nós temos nessa nessa Matriz de correlação Observe que aqui do lado seu aumentasse também o assassino também a vida de vocês né Então observa o seguinte olha só aqui o Que que a gente tem E aí e aqui gente é o seguinte Olha só na coluna aqui olha só nas linhas né a gente tem X6 X7 X8 9 10 até ax18 e na coluna também olha só X6 X7 X8 então
o que que nós temos aqui olha só essa aqui a correlação linear de piercing a correlação linear de piercing são ela pode assumir quais valores varia de quanto a quanto e enxuta que ainda mais É um homem um azul muito bem quem falou o Otávio muito bem Otávio então a correlação linear de piercing ela pode variar de menos um até mais um passando por zero essa correlação linear de pearson então quando a gente está analisando né ela representa né Ela é representada pelo R Zinho né a correlação linear de piercing então o r Zinha pode
variar de menos um até mais um ok então quanto mais próximo dos extremos O quanto mais próximo dos extremos mais forte a nossa correlação linear quanto mais próximo do centro do zero mais fraca é a nossa correlação linear Então a gente tem né A gente pode ter Ir Além de ser forte você fraca nós precisamos saber se a nossa correlação estatisticamente significante ou não então nós poderíamos ter a nossa com relação à Alta e o baixa é insignificante É ou não significante é só nós temos essa situação tá a gente vai entender agora normalmente né
a gente está procurando a correlação quando a gente tá estudando a gente quer com relação tá então nós precisamos ver né Nós queremos saber se ela é alta insignificante espetáculo não é porque a gente precisa se ela é baixa e não significante senhor tá então alta insignificante legal baixo aí não significante da nó alta e não Significante mais ou menos né É também é de pouca utilidade se a gente olhar a não significância e na verdade o mais ou menos ela pode ser estatisticamente significante mas ela ser baixa tá então esse aqui também é uma
situação mais ou menos que a gente deve analisar com parcimônia Como que eu posso ter uma correlação alta ela pode ser alta e não o quanto que isso acontece né quando as vezes nós temos o desvio padrão muito grande E o nós temos uma amostra muito pequena e a combinação dessas duas coisas então pode dar uma correlação né Por exemplo tem uma coração de 0,85 a gente considerar que varia de menos 1 quanto mais próximo de dos extremos mais forte para oração eu posso ter uma relação às vezes de 0.75 que é considerada alta mas
ela pode ser não significante pode ser tão significante porque né a correlação ela é baseada na média ela é baseada no desvio padrão e ela é baseado na matriz De covariância né a covariância é baseada em média de padrão então é se o desvio padrão for alto quando comparado com a média por exemplo esse o tamanho da moça tamanho que tamanho da amostra tonalizando aqui tem a minha mostra o n = 10.000 desvio padrão obviamente né a média vai depender da escala que nós fizemos utilizando e para uma amostra pequena e por um desvio padrão
muito grande em relação à média Pode ser que nós encontramos um Valor que seja alto e não seja estatisticamente significante Então essas duas coisas são relevantes né a gente tem que olhar a significância Ea gente tem que olhar a amplitude né o valor tá da da correlação que nós estamos trabalhando então quando a gente está utilizando aqui nossa Matriz de correlação a gente tem numa mesma Matriz né a gente está analisando pares de variáveis Então qual que é a ideia da correlação linear de piercing né eu Tenho aqui por exemplo a variável X6 e a
variável x 11 X6 e a variável x 11 Tá eu vou fazer diferente vou nem falar das seis da X11 né e como que a gente tem quando o que que acontece eu tenho uma variável aqui uma variável a e tem uma variável a e uma variável B quando que essa correlação vai ser próxima de um né quando eu tenho uma variável baixa a outra é baixa uma aumenta a outra aumenta uma aumenta a Outra aumenta então eu tenho uma reta Mais ou menos nesse sentido então eu terei uma correlação linear entre a e b
próxima de uma e quando que ela vai ser próximo de menos um eu tenho a variável ai a variável ver então uma é alta a outra é baixa uma diminui a outra aumenta uma diminui a outra aumenta Então nós vamos ter uma reta assim tá então as variáveis ela se movimentam em sentido contrário uma aumenta ou diminui Mas elas têm uma forte Associação Então Nesse caso aqui né a nossa correlação aqui ela vai ser o próxima Oi é de tu caneta próximo ao menos um aqui aqui próximo a mais um e eu posso ter situações
do tipo né que eu tenho b i a e eu não tenho inclinação dessa reta né eu posso ter assim também bem aí a que os valores estão aqui por exemplo né então é por exemplo aqui eu tenho o valor da conta de energia é o valor da conta em reais o valor do Imposto então A conta aumenta o imposto aumenta a conta aumento imposto aumenta né bandeira vermelha e o consumo né Ah eu tenho aqui por exemplo né o preço da picanha e o consumo da Picanha então o preço é alto consumo é baixo
o preço vai caindo o consumo vai aumentando aqui eu tenho por exemplo né o preço o consumo de sal Oi e o preço de sal né ninguém vai consumir mais ou menos sal de cozinha porque tá em promoção preço aumentou o Preço subiu né é uma coisa que não varia é o consumo a quantidade consumida com preço então a gente entender né Essas essas relações é muito elevado então na nossa Matriz aqui né o princípio para gente rodar análise fatorial exploratória é que tenha que existir com relação entre os nossos dados tá então tem que
existir é necessária fundamental então quando a gente olha para nossa Matriz de correlação O que que a gente vê a nossa diagonal a diagonal principal Da nossa Matriz olha só essa diagonal é a cor da ação da variável X6 com a variável X6 uma aumenta outra aumenta né então tem uma correlação perfeita tá a correlação de uma variável com ela mesma é um então na nossa diagonal principal o valor da correlação é um tá porque eu tenho a variável com ela mesmo os valores fora da Diagonal principal Então qual que é a correlação existir 6
e 7 e qualidade do produto e atividade de comércio Eletrônico é e é menos 0,137 entre qualidade do produto e suporte técnico é menos 0,2 culpa é 0,0 96 é quase Zero Isso aqui entre qualidade do produto resolução de reclamação 0,106 entre qualidade do produto e propaganda 0,053 quase zero e entre qualidade do produto e linha de produtos Opa aqui já é bem maior tá vendo aqui já é 047 então nós estamos olhando aqui a nossa Matriz de correlação e um dos pressupostos então é Que a gente tenha com relação entre algumas variáveis né E
aí nesta sair daqui do spss quando a gente está analisando lá em análise fatorial ele gera nessa parte superior da planilha ele gera o valor da correlação e nessa parte inferior da e ele gera para gente A significância tá então ele gera aqui para gente em cada um desses valores da linha inferior ele gera para a gente a significância estatística daquela correlação então Qualquer hipótese nula para cada um desses casos tá aí o h0 para cada um desses casos é o seguinte h0 é que o r é com relação a igual a zero e a
hipótese alternativa H é que as correlações são diferentes de zero né Se for igual a zero não tem utilidade para nós fatorial se a gente igual olhar para matrizes e nós vemos todas as correlações né a significância estatística for igual a zero se nós aceitarmos a hipótese nula essa Matriz não tem utilidade para gente Então a gente precisa de ter né alguns pelo menos alguns pares de variáveis que tenha correlação estatisticamente significante de zero então quando a gente olha isso aqui olha só e é isso aqui para gente então é um teste de hipótese né
aqui em cima a gente tem a correlação e aqui embaixo a gente tem P valor né Então como que a gente olha esse ter valor então a gente tem lá né é um teste bi-caudal é essa aqui é a nossa área nossa curva De probabilidade né bom então essa área toda vale Vale Um nessa área que toda vale um essa que a nossa região de aceitação de h0 e considerando o intervalo de confiança de noventa e cinco porcento essa área de aceitação dh0 vários 0,95 e como o teste bi-caudal porque o r né pode ser
próximo de menos um o próximo de mais um ele é diferente de zero essa área Zinha que vale 0,0 25 Esta área Zinho aqui vai ali 0,025 e essas duas regiões são regiões De a região de rejeição de h0 região de rejeição de h0 Então como que nós olhamos ceça ciência se Sr essa correlação que nós achamos aqui na parte superior da planilha né se essas correlações aqui elas são estatisticamente significantes ou não então para isso né basta a gente olhar tá então a gente tem né Essa área nossa que é 002 500 25 a
gente vai olhar nessa parte inferior da planilha a gente tem Aqui ó a significância ou P valor bom então o que que nós queremos ver né se esse p-valor aqui na matriz de baixo tá se ele for é Se eles forem menor do que zero, zero 25 é o nosso valor de referência o nosso alta de referência se forem menor do que 0,025 a correlação que eu encontrei aqui em cima ela é estatisticamente significante se eu encontrei um R maior do que 0,025 ou seja né Nós encontramos valores né maiores que 0 025 para lá
e para cá a Gente cai onde a gente cai na região de aceitação dh0 o que que aceitar h0 é falar que aquela com relação Nossa esse valor aqui ele pode ser igual a zero então você pode ser igual a zero significa aqui a correlação Nesse caso a letra variável X6 ste7 ela é estatisticamente insignificante né ela pode ser igual a zero e como que a gente lê se ter valor é na verdade é a forma mais fácil a gente ler isso tá lá no infinito aqui tá Considerando infinito esse a área que vale zero
Então se a gente começa a ler isso lá da direita para esquerda ou da esquerda para direita aqui também lá no infinito mari0 Então se o p-valor ele não é começou 00001 00002 então se o p-valor ele ficou menor do que o 0,0 25 é porque caiu na região de rejeição de h0 região de rejeição de h0 se o p-valor que nós encontramos aqui ele for maior do que o 0,0 25 significa que nós caímos na região de aceitação dh0 O que que Significa aceitar a galera falar que a nossa com relação que nós encontramos
aqui em cima é igual a zero olha que o resultado que a gente tem agora olha só e olhando se mais detalhes aqui agora tá bom então o que a gente tem olha só nós temos em cima né mostrei para vocês na parte de cima da planilha nós temos as correlações na parte inferior da planilha nós temos os p-valores Então olha o p-valor dx6 com este set é 0,087 é maior do que o 0110 25 então região de Aceitação dh0 eu estou falando que esse menos 0,137 né Ele é estatisticamente igual a zero Então significa
que que não tem uma correlação linear de pearson entre qualidade do produto que a variável X6 e atividade de comércio eletrônico assim como não tem entre qualidade do produto suporte técnico qualidade do produto resolução de reclamação a qualidade do produto e a qualidade do produto e propaganda né Propaganda Mas entre qualidade do produto variável X6 e linha de produto o p-valor vale zero é menor do que o 0,025 então o que que nós estamos falando olha só e essa correlação de menos 0,400 e um tava entre qualidade do produto e preços competitivos existe uma correlação
estatisticamente significante ela é moderada não é muito forte mas ela estatisticamente significantes né então é quando os clientes percebem o deram nota para qualidade do produto alta ao Mesmo tempo ele só a qualidade é boa mas o preço não é competitivo então a nota para qualidade do produto aumenta a nossa para competitividade em preço Jimmy E ai então é esta correlação né de menos 0,400 e um entre qualidade do produto e competitividade em preço eu posso falar aqui ela é estatisticamente significante ou seja existe uma correlação linear de pearson entre a qualidade do produto e
entre linhas de produto então nós Olhamos né para análise pressa matriz de uma forma geral e a gente faz essa primeira inspeção visual então quando a gente olha para o p-valor aqui olha só essa Matriz ela é simétrica né o lado de baixo da Diagonal principal exatamente igual o lado superior da Diagonal principal então quando a gente faça uma inspeção visual nós observamos vários P valores iguais a zero então o que que significa isso sim nós temos vários pares de variáveis que tem correlação Linear de pearson portanto ao considerar a correlação linear de pearson o
nível a gente observar que nós podemos né a partir desse primeiro. A gente passa na primeira condição para aplicar análise fatorial nessa base de dados Nossa que a ter correlação linear de pearson entre os dados tá Então essa é uma inspeção visual aí a gente pode ir lá para o teste de km ó e felicidade de baratas então o que que o teste km o nos fala tem uma não é uma tabelinha que lá No material de vocês tem os lados tem no lá no notebook tem que é uma tabelinha para gente analisar esse km
o né essa medida medida kaiser-meyer-olkin daqui é o km ó Então esse km oque quer dizer 1,609 é uma estatística que varia de 0 até 1 quanto mais próximo de zero pior é o ajuste para thoreau Bela nos nossos dados quanto mais próximo de 1 melhor é o ajuste E se for abaixo de zero cinco né se eu encontrar um km abaixo de zero cinco Significa que a minha meu ajuste a minha análise fatorial não é adequada os resultados que obtiver da minha análise fatorial eles não podem ser considerados não são dignos de serem considerados
porque o ajuste do da nossa análise fatorial é muito pobre muito ruim então moderna entre 05 e 06 é ruim mas é aceitável abaixo de zero cinco é não aceitar durante 06 07 já melhora 07 08 08 09 acima de Zero Nove então o ajuste é excelente o ajuste fatorial tá é Difícil mente a gente encontra valores acima de Zero Nove Tá mas enfim normalmente é entre né a gente encontra os valores aceitáveis muitas na maioria das vezes das experiências que a gente tem valores entre 06 e 07 A gente só fica bem feliz quando
a gente acha um não consegue encontrar um km o nesse valor então essa é uma medida que avalia adequação de todas as variáveis né em conjunto quando análise todas as variáveis juntas para análise fatorial e Depois a hora que a gente for ver essa Matriz antimary que a gente tem aqui uma estatística que tamanho M S A que a gente pode avaliar cada uma das variáveis individualmente e às vezes é uma variável ela está comprometendo o agrupamento né a formação dos fatores então às vezes quando nós excluímos uma variável da análise às vezes nós obtemos
um resultado na melhoria do nosso km ó Então a gente vai ter fazer mais de uma análise para gente chegar à conclusão né Se esse modelo nosso tá adequado ou não às vezes nós teremos que excluir variáveis da nossa análise e o teste de esfericidade de bartlett ele faz o quê né então a gente achou que um teste a estatística qui-quadrado e 48 e ele já deu um p valor para gente aqui menor que 0,001 então o que que esse teste é esse felicidade debaixo desse ele faz e esse teste e esse teste faz o
seguinte Olha só né Então a gente está testando aqui alguma coisa que que nós estamos testando o que que a gente testa com esse teste e sua cidade de Barras ele testa se a nossa Matriz de correlação nosso R é igual a matriz identidade tá então ele testa se a nossa Matriz de correlação é igual uma matriz identidade a nossa hipótese nula h0 a nossa Matriz de correlação é igual a matriz identidade a nossa hipótese alternativa e a matriz de correlação ela é diferente de uma matriz identidade Quem lembra o que que é uma atriz
identidade e me lembra É sim não O que é a matriz da Diagonal aquela aquela Matriz que acho que eu falei errado aqui mais Matriz identidade é aquela é aí diagonal mesmo que fica aqui o número 1 não é isso mesmo e isso e fora da Diagonal a e agora diagonal o número zero Beleza então é isso mesmo é isso mesmo a matriz identidade é isso Então a gente tem lá X6 X7 X8 então o que que a matriz identidade aqui é um aqui é um aqui é um então a diagonal principal Vale 1 equivale
e 000 000 então o que que em termos de análise fatorial lembro o que que a nossa Matriz de correlação os nozinhos ainda farinha e a nossa Matriz de correlação a gente está analisando né Então a nossa diagonal vale um porque é a correlação da variável com ela mesmo e o que que Nós queremos fora da Diagonal principal para que nós podemos usar a análise aplicar a nas fatorial nesses dados o que que é necessário ter e o que que é necessário ter os dados os valores próximos aos extremos não necessariamente próximas os extremos mas
que a gente tenha com relação entendeu não precisa necessariamente se você próximo aos extremos não então é a gente precisa de ter correlação estatisticamente significativo tá Não Precisa de ser próximo dos extremos aí o que que acontece se aquela Matriz com relação Nossa for igual a identidade significa dizer o quê O que significa dizer que não existe correlação entre as variáveis não é isso então por quê Porque a diagonal vale um porque a correlação da variável com ela mesma mais fora da Diagonal e os valores declarações seriam muito baixos Tá então não não teríamos com
relação e se não tem correlação não é Possível aplicar a nossa tutorial nos dados Então quando você a gente aceitar a hipótese nula do teste de esfericidade de bartlett a gente tá falando o seguinte que não existe correlação nos dados tá então a gente não quer aceitar a hipótese nula a gente quer rejeitar a hipótese nula a gente quer aceitar a hipótese alternativa que se a gente aceita hipótese nula não conseguimos aplicar análise fatorial nessa base de dados Nossa Então olha o que que a gente Tem aqui de novo né então a gente tem P
valor menor do que 0,001 de novo né quando a gente tem a nossa o nosso teste de hipótese Considerando o intervalo de confiança de zero 95% Então essa aqui é a região de aceitação dh0 região de rejeição de h0 região de rejeição de h0 né então esse Limiar aqui vários 0,025 isso aqui Vale 0,025 nós encontramos um p-valor Olha só menor do que 0,001 ou seja quase zero então onde que tá esse valor né Se fosse maior do Que 0 20 25 estaria na região de aceitação DH zero como é menor do que 0,0025 está
na região de rejeição de h0 portanto nós estamos rejeitando a hipótese nula estamos aceitando a hipótese alternativa estamos falando que a em relação não é igual a matriz identidade ou seja existe correlação entre as nossas variáveis e é possível nós utilizarmos nós rodarmos análise fatorial Então esse aqui são dois testes É importante relevante necessários quando nós estamos fazendo análise sobre aula né o km o qual que é o valor do Km ó e tira né Nós aceitamos ou rejeitamos o nosso teste de esfericidade de bartlett tá se é aceitamos né que a matriz identidade que
a matriz de correlação igual a matriz identidade parou por aqui a nossa brincadeira se nós rejeitamos né a hipótese nula e aceitamos a hipótese alternativa então ok nós podemos continuar Porque existe Correlação entre os nossos dados então a gente vê o km ó e a gente deu P valor né tem valor menor que 0,05 normalmente né então ok nós podemos continuar com a nossa análise fatorial ok Ah pois bem eu vou só para não ficar extremamente no ar então nós rodamos isso aqui tudo mas não vai adiantar se não vai ficar muito corrido e amanhã
a gente amanhã não né quarta-feira a gente vai rodar de novo eu vou explicar de novo a gente vai continuar as análises Aqui tá é para gente então a gente falou que hoje né nós falamos O que que a técnica já um pouquinho como que ela funciona e nós começamos a falar dos pressupostos para aplicação da técnica então principal ponto que nós batemos aqui hoje na tecla é da necessidade dos dados seguirem uma distribuição normal a gente tem outras questões também né como a gente falou que da necessidade de existir a correlação entre os dados
a gente tem a necessidade da normalidade Dos dados a gente tem tamanho da mostra a gente tem outras coisas que a gente precisa de focar mas na quarta-feira nós é cobriremos o resto aqui não adianta tá corrido e não valer a pena a gente perder Ah tá mas é o que que eu gostaria que vocês fizessem para aula de quarta-feira e para coisa ficar mais clara é a Siri são por favor a aula do semestre passado tá essa aula do spss lá desse mês passado é possível ver achando que não esteja muito claros vídeos que
Agora que a gente melhorou um pouquinho mas pelo menos o conteúdo vocês viram aí dá um já tem o primeiro contato EA nossa aula quarta-feira será mais produtiva tá bom E aí beleza o ok pessoal dúvida pergunta e nem eu mas é show de bola quero ver a quarta feira de Python deve acabar ficando para segunda-feira porque a gente vai acabar É sobre o conteúdo da geral na quarta-feira EA de pai tem Provavelmente ficará para segunda-feira já está a doce mês passado está no mudo Se já quiser adiantar e assistir lá tá ligado e fecha
beleza é um comentário semana passada eu fiz um apresentação de um artigo de pesquisa bibliométrica sabe-se outra matéria é a metodologia usada era justamente essa Matriz de correlação não é depressão é essa análise fatorial exploratória e a gente falou sobre assim time outras Teste do baile lá e mostra essa aula de hoje não fez ver apresentação com o fim de semana passada de um jeito totalmente diferente Ai que bom feliz e assim aí na continuação da semana que da da quarta-feira você vai ficar mais claro para você ir mas olha que legal Ana Lívia porque
você apresentou uma coisa que você De certa forma não dominava mas a aula agora faz fez muito sentido para você não tem assim é totalmente Eu entendi agora o propósito da pesquisa do Artigo né que eu apresentei semana passada que legal mas desculpa e É engraçado porque a matéria que eu tô fazendo o comportamento organizacional né Teoricamente não tem nada a ver com a nalidade só que conseguimos causar duas coisas aqui mas tem muita filha Aí eu quando eu entrei com meu projeto de doutorado em Ribeirão Preto na USP eu entrei eu fiz outra coisa
depois eu mudei Tá mas eu entrei com projeto para Estudar comportamento organizacional é analisar nessa felicidade no ambiente de trabalho e desempenho organizacional então era para utilizar estatística análise das até as tampas tá então a gente precisa mesmo comportamento organizacional né a gente tem avaliar quando está falando de análises cultura de satisfação no trabalho de de valores de Marcelo de coisas né por trás disso a gente faz muitos modelo estatístico não tá na cidade então análise fatorial Exploratória é uma delas e tenho outra que a gente não vai tratar aqui né que eu trato no
doutorado tem umas aulas aí depois quem quiser assistir também mas aí análise de dados análise fatorial confirmatória que é o outro né Outra vertente da análise fato é mas também extremamente interessante e útil mas que legal que faz sentido para você que bom vai dar muito bem nos vemos na quarta 1650 e Fique atento lá no muro aqui agora já Tem atividade já dá para começar a fazer a lista já dá para começar a trabalhar já tem as aulas esse mês passado já acelera em aí agora porque nós estendemos um bom tempo eu achei extremamente
necessário Eu espero que você tenha um machado hoje também mas é assunto que não era exatamente a análise das quatro mas eu acho que que eu Henrique essa que ajuda né e agora a gente precisa de dar um gás em para a gente cobrir o nosso conteúdo e análise De dados quatro mesmo tá bom Já fechou usar Deixa eu te perguntar se eu tinha falado na última aula sobre as notas dos alunos só os o Otávio Altamira e outra pessoa que tirou dois e meio é o resto tirou dois ou teve menor de 2 não
aí todo mundo tirou dois aí as músicas que entregou tudo foi dois eu eu havia comentado que né é nosso primeiro contato é nosso meio experiência vocês entendendo a forma como eu imagino como eu penso e a gente e ter oportunidade de Te ajudar de orientar então é uma atividade né para uma pontuação menor tem exatamente esses objetivos também da gente combinando o jogo e ajustando o jogo tá bom tá bom essa também vai valer três dar de hoje acho que é três também tá bom vou te mandar em HTML então Obrigado grande abraço gente
nos vemos na para nós a próxima quarta até mais obrigado pastor por semana que vem o que quer dizer até quarta e quarta até 40 Valeu um abraço tchau