Olá pessoal Bom dia espero que estejam todos bem eh Chegamos em nossa penúltima aula do curso um né veja só fomos eh seleção natural é sempre dura com todo mundo mas e pelo menos uma fração das pessoas chegam ao final do curso e essa é a penúltima aula tá E nessa penúltima aula a gente vai ter um tópico novo na verdade que eu não falei nenum nenhum curso anteriormente que é a regressão logística original né achei Recebi sugestões achei de bom Tom falá vamos vamos falar dessa regressão também né E ela é interessante é útil
e ela não é tão usada né mas e vale a pena né comentar um pouquinho sobre ela e então e vamos falar depois disso sobre a curva rock tá então a aula a aula de hoje tem duas eh são duas aulas juntas né uma aula sobre regressão logística ordinal regressão ordinal na verdade né E a outra sobre curba Roque tá então sem mais delongas Eh vamos começar Então regressão ordinal tá tem gente que chama de regressão logística original tá tem gente que chama só de regressão orinal é o nome mais comum tá regressão orinal eh
o que a gente já viu de regressões pelo menos no curso um e a o que a gente vai ver e a gente viu a regressão linear que é quando o y é contínuo né a gente viu a regressão eh a Regressão logística binária né que é quando o y é categórico 0 né duas categorias só tá a gente viu a regressão logística multinomial multinomial quando o y é uma variável nominal né variável nominal e aí pode ter várias categorias mais de duas categorias Tá e agora a gente vai ver a regressão ordinal Que o
y também é uma variável categórica Mas ela é uma categórica ordinal Então seria eh pouco médio e muito será algo assim tá eh então a regressão original ela tem assim não é que ela tem usos mas ela tem duas indicações eu teria dois usos principais uma primeira dica para você usar regressão original ela é é quando por Exemplo o seu Y é contínuo né Você tem o y contínuo você poderia fazer uma regressão linear mas a distribuição do y a distribuição do Y não é boa não éo não é simétrica né Então imagina por exemplo
uma uma uma variável dependente né uma variável Y tá qualquer você você vai ver a distribuição dela ela é toda esquisita assim ó sabe ela é toda estranha né Eh Às vezes tem variável que tem uma tem Uma grande quantidade aqui aqui não tem nada depois tem uma outra é tipo bimodal sabe então quando quando a sua variável dependente você faz o histograma dela né você vai fazer uma regressão linear você tá pensando regressão linear aí você vê a distribuição tem muitas pontas ou ela é toda esquisita né O que que eu podia fazer para
para deixar essa distribuição o o a qualidade do modelo melhor né eu posso pegar por exemplo essa variável e dividir em tercis eu eu divido em três Ter por exemplo eu pego 1/3 aqui 1/3 aqui e 1/3 aqui aí eu faço o grupo A B e C por exemplo e esses grupos naturalmente vão ter uma ordem né o grupo A é menor que o B que é menor que o c tá esses grupos naturalmente vão ter uma ordem se você vai criar uma variável original e daí pode ser uma indicação para fazer uma regressão original
por exemplo Então você tem uma regressão linear com uma em que a variável Dependente o Y tem uma distribuição esquisita né E aí eu eu categorizo eu crio e categorias três grupos quatro grupos quantos grupos eu quiser e e coloco ela tá não fica muito legal fazer muitos grupos a gente vai ver né regressão ardinal com muitos grupos é melhor ficar na linear mesmo tá então muita gente pensar Ah vou fazer regressão eh ordinal com variável lickert né Eh escala Lickert então se eu imaginar que o meu Y é um resultado de um questionário é
uma escala lickert né que é uma escala em 0 1 2 3 4 5 por exemplo né é uma ordem né então a escala l são questões que tem ordem né E são categorias não tem não tem não dá para responder meio 1 e meio né é 0 1 2 e tal né Eh dá para usar a regressão original aqui até dá né só que a gente vai ver um requisito importante da regressão original quando tem muitas categorias né A variável ordinal em geral não não atende esse requisito que eu vou explicar tá da regressão
ordinal então o ideal assim a regressão original tem que ter três quatro níveis aí você consegue garantir a propor alidade né Isso chama proporcionalidade das chances eu vou explicar isso tá então muita gente pensa um uso óbvio né da regressão original que é quando a variável dependente é uma escala li muitas vezes você não consegue manter isso aqui tá então cuidado tá Então esse seria um uso né regressão orinal o outro uso né o outro uso da regressão original então a Patrícia eu já vou chegar aí tá então o o primeiro uso seria quando o
y é contínuo mas a distribuição do Y não é muito simétrica né então vou deixar o desenhinho aqui né Você tem uma distribuição lá toda esquisita né E aí você pode pegar essa Distribuição e transformar ela por exemplo Numa numa distribuição em partes né a b c aqui Aí você coloca lá sua distribuição esquisita e quebra em pedaços né E aí essa variável a BC vai ser iginal tá o segundo uso o segundo uso é uma alternativa então a ordinal como alternativa alternativa mais parcimoniosa Parcimoniosa a regressão logística multinomial tá então assim a regressão logística
ordinal e a multinomial uma pode ser alternativa da outra né porque uma variável uma variável categórica ordinal que tem ordem né E aí tem que ter mais que duas categorias né duas categorias aí não dá né Não dá para fazer ordinal com duas categorias tem que ter pelo menos três né E também dá para fazer a multinomial quando tem mais de duas categorias né a ideia dessa da Explicação aqui dessa dois é quando usar cada uma delas Quando que você usa original e quando você usa multinomial né porque dá para usar as duas né pra
mesma pro mesmo banco de dados pra mesma variável dá para usar as duas quando que eu uso cada uma essa a ideia tá E aí por que que a ordinal ela é mais parcimoniosa né eu tenho que explicar aqui o que quer dizer parcimônia né para na análise de dados Parsim parcimônia né parmon é o seguinte se tenho dois ou mais jeitos de fazer algo opto pelo mais simples e aí o que que eu tô definindo aqui como mais simples é aquele que usa menos equações tá menos equações tá bom eh e aí a gente
vai ver a diferença fundamental entre a multinomial e a Ordinal é que o seguinte por exemplo vamos imaginar que eu tenho um Y que são três categorias tá meu Y é a b c como a gente fez aula aula passada né lembra que na aula passada na na regressão multinomial a gente fez um modelo lá para eu acho a vida exitante rotineira ou besta né são três categorias eu tenho três categorias na multinomial como é que é feito você vai selecionar uma das categorias como Referência né E aí ele vai te dar duas tabelas né
ele vai te dar a tabela do B versus a E aí aqui você vai ter lá o o estimate você vai ter lá o o p né o AD r e o intervalo de confiança od R né Então você vai ter uma tabela aqui assim né aqui e depois vai ter uma outra tabela do C versus a né vai ter duas tabelas tá é isso que a gente viu aula passada né Lembrando que cada tabela é uma equação né Cada tabela Vai ser uma equação tá então aqui eu eu tô fazendo aqui uma uma logística
binária né aqui vai ter uma equação da logística binária 1 e aqui vai ter outra equação da logís de uma logística binária 2 né então eu vou ter sempre na quando eu faço a a multinomial né na regressão multinomial eu vou ter sempre n Men número de Grupos número de grupos menos umaa né porque eu pego uma categoria de referência e comparo todo mundo com ela tá então sempre vou ter o número de grupos menos uma equações eu vou ter várias equações né isso necessita de um tamanho de amostra maior né então aqui eu preciso
de mais amostra e a gente vai ver no exemplo que eu vou fazer preciso de mais amostra né para poder montar várias equações na ordinal não é assim na ordinal não é assim eu vou ter O mesmo Y que é a b c né Eh eu não vou ter Não vou não vou precisar estabelecer uma categoria de referência mas eu vou ter um modelo só né Eu só vou ter um modelo só vai ter o estimate o p ods ratio e o intervalo de confiança do ods rti só só uma só um modelo sempre não
importa quantos níveis tenha a variável dependente Não importa quantas categorias eu tenha eu sempre vou ter uma equação só né a a dificuldade da Regressão ordinal é assim mas como é que eu interpreto o estimate de uma categoria só né de uma porque aqui eu sei eu sei quem eu tô comparando né eu tô comparando cada grupo com a referência beleza mas aqui quem que eu tô comparando né Essa é a dificuldade da regressão original como é que eu interpreto Tá mas a gente vai ver vamos ver tá mas eu tenho na verdade só só
uma equação né então é um modelo mais parcimonioso assim nesse sentido de ser Mais simples né ele ele é mais o aqui tem que deixar claro a regressão ordinal ela é mais simples do ponto de vista da fazed dura matemática porque é só uma equação em vez de várias tá eh mas a interpretação do estimate que é o desafio como é que a gente interpreta né muita gente tem dificuldade de fazer regressão ordinal na verdade a dificuldade é na no programa é zero é só apertar o botão mas a a dificuldade é como interpreta tá
E é isso que a gente Vai ver então eu tenho só sempre uma equação só só uma tá então o jogo aqui a dificuldade é tudo bem então se eu tenho um Y contínuo regressão linear Sempre beleza né se eu tenho Y categórico eu posso fazer regressão logística ou regressão original né se o meu Y categórico tem duas categorias né só duas é a binária aí não não dá para fazer ordem com duas categorias tá então é sempre a binária Beleza então esses Dois casos aqui são bem definidos tá linear e a logística binária é
bem definido a multinomial e a ordinal é é que é o você pode jogar com uma ou com a outra né aí assim se o y for nominal né se o y for uma variável nominal Eh sei lá eu quero eu quero fazer uma regressão logística para ver o tipo de doença que você tem né então não tem ordem entre a BC tipo de de doença né ou a aula passada lá o que eu acho da vida né o que eu acho da vida rotineira eh eh Excitante ou besta né ão é uma variável ordinal
não tem ordem Então o a aula passada é um caso típico de regressão logística multinomial não tem como fazer ordinal porque não tem ordem das categorias mas se eu tiver por exemplo gravidade de uma doença né Eu quero ver os fatores Associados com a gravidade de uma doença aí eh pode ser baixa média alta né aí tem uma ordem né aí vale a pena usar ordinal né só que a ordinal tem um requisito muito forte né que essa Variável ordinal ela tem que ser ordinal de verdade né E aí eu vou mostrar como como faz
para ver isso né se essa variável for ordinal de verdade né ou seja se os o as chances eu vou explicar o que que é isso se as chances são proporcionais né se a gente identificar que as chances são proporcionais você usa a regressão ardinal Beleza se as chances não são proporcionais Aí você fica na multinomial faz a multinomial mesmo tá então é é basicamente o jogo é Esse tá o jeito de interpretar é parecido é ods rti a chance a mesma coisa tá é tudo igual quantas vezes toda interpretação da logística é igual mas
tem esse esse essa questão tá mesmo que você ache que seu Y é ordinal você tem que verificar se é ordinal mesmo tá ou seja se as chances são proporcionais né é se não for fica na multinomial se for fique na ordinal porque só uma equação é mais fácil tá o exemplo que eu vou fazer um banco de dados com n pequeno né você Vai ver que com n pequeno a regressão logística roda a a multinomial às vezes ela fica dá problema quando o n é pequeno fica fica um pouco esquisito tá então e Eh
vamos ver isso então beleza acho que eu consegui explicar acho que eu consegui explicar a lógica básica né E aí a minha minha primeira pergunta esses tipos de regressão aqui tipo a a está agora no final do do curso um está claro para vocês ver isso que dependendo da sua variável dependente Você vai escolher um tipo de regressão né tá claro isso para vocês gente que o que importa na regressão é o y é a variável dependente tá quando você for montar sua pergunta de pesquisa você começa pela variável dependente pelo Y tá tá sabendo
o tipo de y você já vai saber o tipo de regressão tá então isso tem que ser um ponto Pacífico assim todo mundo tem que entender isso aqui né E aí a próxima fase é escolhendo o tipo de regressão aí como interpretar os Coeficientes tá então basicamente pro curso um o esperado é isso Você tem essas duas habilidades tá porque com essas duas habilidades você vai conseguir fazer sua regressão e também vai conseguir ler os artigos que é o que é mais importante tá sempre começa pela variável dependente sempre tá então sempre tá bom para
cont então Simone colocou uma boa pergunta né porque aqui eu ataquei o y contínuo o y categórico binário o y nominal o Y Original beleza né E aí vem a pergunta né e o y discreto aqui né e o y discreto que seria a variável de Contagem né aí a resposta que eu tenho para você é curso dois no curso eu vou ficar devendo essa tá essa isso aqui a gente vai atacar no curso dois tá o y discreto então assim não só po ação pode ser po ação pode ser binomial negativa tem tem vários
tá então assim por enquanto no curso um por enquanto se a Variável é discreta coloca na caixinha da linear coloca na caixinha da linear não fica errado Só Só que você usar outros modelos para variável discreta Você erra menos tá Você erra menos Tá bom então esse esse Y discreta eu vou deixar vou deixar mesmo é intencional tá aí tem que ver o curso dois se você quiser ver as aulas do do ano passado ou acompanhe o curso dois do segundo semestre tá E então beleza Tá bom então respondido tá só vai faltar esse detalhe
Né mas mas vamos chegar lá tá então muito bem então acho que consegui justificar aqui a importância da regress ordinal ela tem uma tem um uso né ela tem um valor em si né então agora o o desafio aqui é saber quando usar eh regressão logística multinomial multinomial ou eh regressão original né quando usar um e Outro a questão é a seguinte tem um um requisito na verdade não é nemum requisito é uma condição aqui tem uma condição importante importante para a regressão ordinal tá E essa condição importante dito que o o as chances devem
ser Proporcionais proporcionais ao longo dos níveis as chances devem ser proporcionais ao longo dos níveis da variável dependente ordinal Tá o que que isso quer dizer que que isso quer dizer Eh vamos imaginar que eu tenho um Y que é a gravidade de uma doença então leve moderado e grave tá aqui minha doença beleza aí eu vou ter lá o meu modelo 0 mais Beta 1 Lembrando que isso aqui é como logística Tá então não vai ser leve moderado e grave a chance log da chance aquela coisa toda tá vezes grupo mais beta 2 vezes
idade mais o erro tá por exemplo então primeiro aqui né o modelo não é exatamente esse isso aqui é um modelo teórico Tá o que que acontece aqui né como eu mostrei anteriormente na regressão logística multinomial o que que ele vai fazer você escolhe uma Categoria aí você compara leve com moderado leve com grave então você não vai ter uma equação você vai ter duas né duas logísticas binárias tudo certo a gente já viu tá na ordinal tem um negócio que é o seguinte se eu vou ter uma equação só né esse Beta 1 aqui
E esse beta2 Como como que eles são interpretados né Eh a a suposição essa suposição aqui das chances serem proporcionais é o seguinte se eu tenho leve moderado e grave né Eh Para eu como é uma ordem né como é uma ordem então assim se eu tenho a doença leve e por exemplo imaginar que o grupo tem dois dois grupos A e B tá e a idade é contínua Tá bom então como que é interpretação tá ó se eu sou vou colocar um grupo aqui como referência que é o grupo A tá não pisc agora
ó se eu sou do grupo a se eu sou do grupo A eu tenho uma chance Beta uma vezes maior de aumentar um nível na variável dependente vamos vamos interpretar ó deixa eu Escrever a interpretação interpretação do grupo grupo a interpretação é a seguinte então ó eh se sou do grupo A então coloco aqui o a como um B como zer então B é a referência tá se eu sou do grupo A tenho Beta uma vezes mais chance de subir um Nível de subir um nível na variável dependente de subir um nível na variável dependente
em relação ao ao grupo A ao grupo A tá não é o grupo B Desculpa se eu sou do grupo A né é a chance em relação ao grupo B desculpa tá então assim se eu sou do grupo A eu ten uma chance de Beta uma vezes a mais de subir um nível na variável dependente o que que isso quer Dizer se eu tiver no leve eu tenho Beta uma ve Beta uma se eu sou do grupo A tá então assim imagina que eu sou uma pessoa e eu sou do grupo A aqui tá eu
sou do grupo a se eu se eu tiver a doença leve eu tenho Beta uma vezes mais chance de subir do leve pro moderado e eu também tenho Beta uma vezes mais chance de subido moderado pro grave é isso que quer dizer por isso que só precisa de um beta1 porque o o a chance de passar de um nível mais baixo Qualquer ele que se seja para um nível mais alto é a mesma tá isso que quer dizer chance proporcional tá se isso acontece se isso acontece as chances são proporcionais pode usar regressão original beleza
tá você tem que garantir que em cada para cada nível que você pula né você tem que aumentar beta1 né Eh eh dá para garantir isso não em todos os casos e isso a inclinação das retas é a mesma eu eu tenho que ver se é né assim a regressão logística original ela Supõe que seja tá então o o boa observação então aqui né a inclinação a inclinação da reta de L para m e de m para G é a mesma tá do leve pro moderado e do moderado pro grave a inclinação das retas é
a mesma isso é a suposição do modelo tá Não tô dizendo que que dá para ver aqui desse jeito não dá para ver ainda eu estou supondo tá se existe proporcionalidade da chance beleza usar A ordinal tranquilo mas fácil né uma uma equação só tranquilo mas a gente tem que ver como que faz isso aqui tá então é como é como se né é isso a a a ideia a Patrícia né A ideia é você rodar a regressão ordinal aí tem um diagnóstico dentro da regressão ardinal que você olha se der certo beleza continua com
a ardinal se não der certo vai para multinomial é isso tá é básico então é é eh é é tranquilo mesmo de ver tá então assim eu Tenho que fazer um diagn eu faço a ordinal faço um diagnóstico da ordinal aqui se eh Se atender o diagnóstico de chances proporcionais vou para eh fico na ordinal senão vou paraa multinomial é é isso tá então a a É como se eu tivesse aqui uma uma curva assim né então eu tenho a curva logística né porque é um modelo Logístico É como se eu tivesse a logística aqui
do L do leve para o moderado né e eu tenho que ter uma outra Logística que é do moderado para o grave e ela tem ela não pode cruzar ela tem que tá bonitinha assim ó bem paralela tá aqui do moderado para o grave tá aqui é a probabilidade de eu pertencer a um certo grupo né no no eixo Y tá eh então assim tem que ter uma proporcionalidade dos das chances aqui é quando as chances são proporcionais proporcionais tá então de novo se isso Acontece beleza ótimo a questão tem que ver se isso acontece
então a variável a variável grupo se eu sou do grupo A tenho Beta uma beta uma vezes mais chance de subir um nível na variável dependente qual queer nível esse que seja tá se eu parto do L tenho Beta 1 vezes mais chance de ir pro M se eu parto do M tenho Beta 1 vezes mais chance de pro G é isso e agora eu consigo justificar Porque que quando a variável dependente tem muitos níveis Fica difícil fazer a ordinal né porque quando tem muitos níveis tem que garantir que é beta1 em todos né então
por exemplo imagina uma escala Li com 10 níveis né eu tenho que garantir que é b em todos é difícil tá então você já viu né então a regressão original por isso que ela é pouco falada né Ela é pouco falada porque em geral ela é pouco usada por causa da proporcionalidade das chances Tá mas é isso a questão é essa é muito Legal a regressão é legal mas ela tem uma questão difícil tá é um beta é um beta só para todas as passagens tá então aqui né observação a gente consegue ver que quando
o Y tem muitos níveis muitos níveis eh fica difícil fica difícil usar a ordinal tá porque você geralmente quebra o o a chance o requisito da chance proporcional tá é não é comum de Acontecer mas mas acontece tá acontece por isso que tem nos programas dá para usar enfim acontece tá acontece em geral quando você tem três quatro níveis dá certo se tiver muitos níveis não não rola tá então beleza então ó a gente interpretou o o mais importante aqui er você entender a interpretação tá do Beta é isso que come uma galera come bola
é interpretação do Beta Tá então vamos interpretar aqui agora a idade Interpretação da idade né na na na idade é o seguinte como é que a gente interpreta o beta 2 né A idade é contínua então a interpretação é assim a cada 1 ano de idade a mais a cada um ano de idade a mais aumenta Beta duas vezes a aumenta Beta uma beta duas vezes a chance de subir uma unidade da variável dependente tá uma unidade ou uma o nome que eles colocam Em vez de uma unidade é uma classe uma classe da variável
dependente né porque leva moderado e grave né então é uma classe tá E aí a mesma coisa é o beta2 né então do leve por moderado é beta2 e do moderado pro grave também é beta2 tá eh tudo bem gente pegar aqui a interpretação legal vai né É É honesto sabe regressão ordinal é honesta em geral pessoa o pessoal come muita bola eh pela dificuldade de interpretar mesmo A regressão original Mas é isso tá ela é honesta daí de novo eu volto a importância da primeira aula de regressão logística tá se você pega a definição
do que que é o y de verdade fica muito mais fácil de entender a a os outros tipos de regressão então né É isso aí o nosso último desafio agora é como como que a gente a gente vê se os se as chances são proporcionais ou não né Aí tem um detalhe né nunca é perfeito né Aqui tem um detalhe que é o seguinte Eh eh tem Existe teste de proporcionalidade da chance Existe existe o teste né Tem mais de um até eu coloquei na referência um teste que é o teste eh vald alguma coisa
vald eu eu nunca lembro todos os nomes é tanta gente eh libert vald alguma coisa assim tem o nome no teste tá e e tem um teste que chama inclinação das retas mesmo teste de inclinação das retas teste de paralelismo das retas na verdade tá tem tudo a ver né faz tudo sentido então só Que o que acontece quando eu vou fazer nos dois programas tá quando você faz no spss né você faz lá regressão original beleza e dentro da regressão original tem uma opção tem um botão lá que é o paralel paralel Lines Lines
test né E aí é de boa é de boa tá então o o aí ó uma pergunta para vocês é um teste de linhas paralelas né O que que eu quero que eu que o que a o para para eu saber se se duas linhas são Paralelas o que que eu tenho que testar o coeficiente angular de cada uma né Então esse teste daqui das linhas paralelas a hipótese nula é que o Beta da do LM né do leve pro moderado é igual ao Beta do moderado pro grave é bem direta a comparação tá Então
esse teste de Lin linhas paralelas ele testa se o coeficiente angular do da primeira classe aqui né do leve pro moderado é igual a do moderado por grave né e o que que eu quero eu quero que as que os meus Os meus coeficientes angulares sejam iguais ou diferentes que que eu quero que o Beta seja igual ou diferente Hein gente pergunta eu quero que seja igual né se eu quero que seja igual o o esse teste aqui você tem uma hipótese nula vai ter um p né esse P aqui ele tem que ser maior
ou menor que 5% eu quero a hipótese nula Então esse P tem que ser maior ou menor que 5% quando você olha o resultado do Teste responde para mim tem que ser maior tá então o p tem que ser maior que 5% tá Então é isso então você bate o olho lá no teste paralelo no das linhas paralelas se o p for maior que 5% beleza né P maior que 5% então as retas são os coeficientes angulares são similares o é paralelo posso usar ordinal beleza né então aqui c p maior 5% uso regressão original
ótimo bem fácil né tranquilo direto a Conta inclusive não é difícil é só pegar é que eu não expliquei isso vou explicar no curso dois o o tem o índice de aderência da regressão logística que é o -2 LL né ele pega o -2 LL do modelo só com a constante do modelo completo subtraio Não não é difícil de fazer a conta né Eh então esse PCs implementou tranquilo de fazer né quando você vai ver isso no jamovi falar Beleza agora né só né só alegria Quando você vai ver isso no Jovi Não tem o
teste não tem o teste não o teste da linha paralela não botaram e é um teste fácil eu tô quase programando eu mesmo para colocar né no fazer o pacote eu mesmo né e mas como assim não colocaram velho aí eu entrei lá no fórum perguntei pra galera ô vocês não estão pensando em colocar não porque aí fica mais fácil ajuda os irmão né Vai falar não tá não tá na ordem de prioridades agora falou Mas tudo bem mas eu vou mostrar um jeito tá esse jeito é indireto então a nesse nesse detalhe o spss
tá ganhando por enquanto por enquanto por enquanto tá ganhando tá vamos ver ano que vem se melhora né se tem o teste de linhas paralelas porque aí é fácil né mas como não tem o teste aí eu vou fazer nos dois programas você vai ver que dá igualzinho né dá tudo igual mas tem esse Inconveniente né Eh aí como é que a gente vai com um jeito de fazer né Eu Não odeio o IBM O problema é que o o programa de graça você tem que valorizar né colaborativamente o programa de graça né para ter
uma uma um acesso maior né Eh objetivo da empresa objetivo de toda qualquer empresa de mercado não é não é gerar um mundo melhor é ter lucro empresa coerente né quando você faz um serviço de graça e você quer ganhar a ganhar espaço né você tem que colaborar com que é de graça Então tem que defender mesmo MOV e tal tá então Beleza então não Ten o teste Então a gente tem que fazer uma coisa meio artesanal né O que que seria fazer a coisa a coisa artesanal é comparar comparar a aderência dos dois modelos
tá então a gente vai fazer a a vai fazer pro mesmo conjunto de dados a gente faz a ordinal faz a multinomial e compara a aderência dos dois modelos o modelo que tiver uma melhor aderência tiver uma melhor qualidade é o modelo Que a gente vai ficar tá esse critério da aderência ele não é tão bom quanto das linhas paralelas confesso não é tão bom tá mas ele dá certo tá ele ajuda ele é melhor que nada tá bom e para comparar a aderência dos dois modelos eh você vai usar um valor depois eu mostro
no programa vou mostrar no Programa Qual é o valor eu anoto aqui tá então beleza é isso então nosso nosso desafio é e fazer a regressão original agora para ver se dá Certo tá então eu vou vou apagar só essa linha aqui de cima eu vou colocar um modelo aqui baseado num num banco de dados que você já usou né e mas ele não apareceu aqui na aula ainda pera aí cadê meu meu negócio aqui aqui então Ó eu quero fazer um modelo que é o seguinte e cadê Aqui eu quero comparar um grupo chamado
Dose tá dose dose de um remédio é é o banco Viagra então eu tenho uma variável dependente que é a dose E aí a dose tem três grupos que é o ou seja não recebeu nada da droga né zero e a dose e o low dose dose baixa e o High dose que é dose alta tá tenho três grupos eu vou supor eu acho que tem e tem ordem Tá bom eu acho que tem ordem tá E aí eu quero eu quero saber eu Acredito né mas ter que testar eu acho que tem ordem Então
essa é minha variável dependente tá eh Aí Eu quero ver aqui Beta 0 mais Beta 1 vezes um score de libido né Tem um score Isso aqui é uma variável vou considerá-la contínua e ela é uma variável que vai de um até sete pontos tá o score de libido lá mais 1 beta2 vezes e se a pessoa está num relacionamento relacionamento tá que aí é uma variável Zer e 1 Tá sim ou não né então o aqui sim ou não Tá bom sim ou não esse é o meu modelo tá eu quero saber se libido
e estar num relacionamento é associado com você estar no grupo de Placebo dos ou High dose eu quero ver se eu consigo identificar as pessoas que tomaram uma dose alta média ou de viag tá em relação a essas características tá tudo bem gente Vocês entenderam o modelo n entenderam o modelo que eu que eu montei Eu eu posso fazer aqui tanto a logística multinomial quanto a ordinal posso fazer qualquer uma das duas tá mas aí quero saber qual delas fica melhor tá e o interessante desse banco de dados é que ele só El ele é
pequeno então o banco Viagra aqui ó ele tem 15 pessoas tá ele é um banco pequeno né então você vai ver né é é que às vezes a ordinal fica melhor num banco pequeno né Por quê Porque ela usa ela só faz uma equação tá então primeiro Eu vou rodar aqui no jamovi ó você entra regressão original Original outcomes né regressão original beleza minha variável dependente vai ser a dose né Placebo média ou alta e aí eu vou colocar a idade a idade idade tá ã Ah tem três variáveis Ô desculpa esqueci a idade pera
aí tem a idade da pessoa também então + beta3 vez idade mais o erro Agora sim tá tinha tinha outra variável Desculpa então entra aqui né coloca a idade como uma covariante se tem o Relacionamento ou não como um fator E alibido como covariante que é um score né Beleza ó ó ele fez uma tabelinha só tá vendo Então você olha assim a primeira vista regressão logística ordinal apece bem de boa né tem só um negócio aí eu coloquei aqui como referência solteiro né então aqui é o o estar no relacionamento a variável que eu
tô olhando se eu estou no relacionamento tem 1.4 só que esse estimate aqui ele tá em log da chance né Ele não tá na chance ele tá em log da chance aí ó veja aqui que ele coloca uma informação que é importante aumentar um pouco mais ele coloca uma informação aqui ó a variável dependente dose está seguindo a seguinte ordem Placebo low e High ou seja o menor é o Placebo o low é o intermediário e o High é o alto tá há dificuldade de interpretar esses coeficientes então primeira coisa que a gente tem que
fazer é colocar aqui Model coefficients pedir od ratio primeira Coisa e o intervalo de confiança tá bom então a gente interpreta esses rapazes aqui tá a gente vai interpretar esses caras Beleza então vamos copiar essa tabela né copar Essa tabela para olhar não eu que coloquei essa ordem tá oer né eu coloquei Tá então você tem que colocar o Placebo como número menor o low dose como intermediário High doose como maior tá então aqui tem que ser 1 2 3 você tem que colocar nessa ordem tá se você colocar em outra ordem ele vai Identificar
errado tá E então deixa eu só copiar aqui vamos copiar essa tabela para interpretar né assim primeiro desafio é interpretar a tabela tá para treinar né vamos interpretar aqui a logística né eh a a ordinal né a logística ordinal depois a gente eh eh treina mais tá então vamos abrir outro aqui depois a gente vê se vale a pena fazer a multinomial ou não Tá então colar aqui minha minha Tabelinha aqui ô fazer grande aqui colocar aqui beleza aí ó tá vamos interpretar Nossa logística ordinal né Eh Beleza então ó olhando a idade não dá
significativo o estar no relacionamento ou não não dá significativo S significativo libido tá então parece que o único fator associado com eu estar eu saber que você tá tomando viag ou não é o seu grau de libido Lembrando que é uma Escala de 1 a se tá a única única coisa Tá bom mas vamos interpretar as outras só para treino tá então treino treino seguinte não vale não itivo vamos interpretar a idade ó a Interpretação da idade é a seguinte aqui né a od deu 1.01 1,04 tá o que que isso quer dizer a cada
a cada um ano de vida a cada um ano de idade a mais um ano de idade a cada um ano de idade a Mais tenho posso falar 1,04 ou 4% 1,04 vezes ou 4% tenho 1,7 1,04 vezes de eh de chance a mais de subir um nível da variável dose tá de do leve pro moderado do do Placebo pro leve ou do ou do do low dose Pro High dose tá tudo bem interpretação aqui gente entenderam a interpretação aqui da idade então a cada um ano de idade tenho 1,04 vezes mais chance chance a
mais de subir um nível da variável dose tá é isso a Interpretação da do relacionamento Ele não localiza a classe não importa onde eu estou daí que vem o negócio do Risco da chance proporcional né isso que torna difícil aí o relacionamento relacionamento Então veja Que a referência é estar no relacionamento tá referência é aqui ó tá estar no relacionamento então eu coloco assim se eu estou em um relacionament se eu estou em um relacionamento tenho 4,3 vezes que é esse aqui ó tá você estou é É 4% mesmo 1.04 1.04 é 4% tá então
se eu estou em um relacionamento tenho 4,3 vezes mais Chance de subir um nível da variável dose tá eh isso a o comentário da Malu é muito importante é sempre é sempre na hora que você montar a variável dependente monta do menor pro maior tá porque aí é sempre aqui ele sempre coloca a chance de subir né então coloca sempre o número menor pra categoria Menor da ordem e o número Maior pra categoria maior da ordem tá você tem que ter esse cuidado também com a regressão se você mudar a variável dependente o número estraga
toda a interpretação aqui tá então aqui é uma observação importante cuidado com a ordenação ordenação no banco de dados né da variável da Variável dependente ordinal dependente ordinal tá então o número menor pra categoria menor e vai subindo tá então se eu estou no relacionamento tenho 4,3 vezes mais chance de subir um nível da variável dose não importa qual nível seja Tá beleza então isso aqui era só para treino né e não 33% não aqui 4,3 eu tenho 1 né mais 3,3 né Ou seja eu tenho 3 30% a mais né 33% a mais tá
acho que faltou o zero aí né Mirela Mas tudo bem Tá Vocês entenderam a interpretação então isso aqui não não vale tá esses dois não valem porque eles não dera o significante é só para treinar o que importa aqui é libido aí o O importante aqui o resultado mesmo resultado é o seguinte é para variável libido que de novo é uma variável que Vai de uma escala de 1 a 7 tá então a interpretação é a seguinte a cada um nível a mais na escala na escala de libido né aumenta aumenta 3,1 vezes 3,1 vezes
a chance de subir subir um nível da Variável dependente dependente dose tá da variável dependente dose Então eu tenho lá o Placebo eu tenho o low dose e o High dose Então se se eu se eu estou no grupo Placebo e E se eu a cada um ponto a mais de libido aumenta 3,1 vezes a chance de eu ir do Placebo pro low dose se eu tiver do Placebo ou aumenta a chance de ir do low dose pro High dose 3,1 vezes também tá é a mesma coisa tudo bem interpretação gente tudo Bem isso 21%
tá ou 210 por. tá bom pegaram o resultado que a gente achou aqui tá então assim o o desafio da regressão original é como interpreta coeficiente mas se você interpreta e entende beleza né Eh o a pergunta do Helder se o resultado do relacionamento vers solteiro daria para dizer que provavelmente se o estudo fosse replicado a gente não dá para saber é que esse intervalo aqui de Confiança é muito grande né não é que esse intervalo é muito grande provavelmente é porque o n é pequeno o n da amostra é pequeno tá o o intervalo
de confiança muito grande em geral é um problema de poder do teste tá ou esse ou essa amostra tem muito dado perdido ou o n geral da pesquisa é pequeno tá quando você vê eh Quando você vê assim intervalos de confiança muito grandes ou o problema é o problema é da variável ou o problema é Do n geral da amostra tá Ah ele é muito maior pro o lado positivo Mas isso não ajuda em nada não não não é uma questão tá eh quando o intervalo da de confiança da do ods d meio bizarro é
provavelmente ou é a variável tem muito Missing ou o modelo inteiro tem n pequeno tá aí é é um diagnóstico geral assim para identificar mas como essa variável não foi significante tudo bem também tá eh então o o Bruno né parece um modelo mais fácil de interpretar quando você Entende mas a questão é que você tem que garantir que esse risco é proporcional né Eh então a a a comentar da Natalia é importante eu tenho aqui a libido né e a dose o que eu tô testando aqui né é a relação de que se eu
tenho mais se eu tenho mais libido aumenta a chance da minha dose ser maior eu tô indo nesse sentido tá isso aqui é regressão ardinal né se eu for fazer o contrário eu posso fazer o contrário também né será que Quando eu tenho mais dose e aumenta minha libido que é o que faz mais sentido né só que libido é uma variável ordinal também né Eh eu poderia fazer uma outra regressão original só que tem sete níveis né a variável libido eu podia colocar libido como dependente como Y né então aqui é o x e
aqui é o Y né se eu invertesse aqui colocasse y e x invertido daria para fazer outro ordinal só que eu tenho sete níveis é muito mais difícil de garantir a proporcionalidade Dos eh da a proporcionalidade das chances tá aí o que que valeria a pena fazer uma linear então se eu colocar aqui eh o y o o x aqui vai ser a dose mesmo né E aqui o y libido vale a pena fazer uma linear uma regressão linear para ver vai ficar como tarefa par ular tá o banco de dados está na descrição fica
como tarefa par l fazer a variável dependente libido né e e colocar as outras Inclusive a dose Como dependente ver que modelo fica melhor tá eh fica como tarefa par ular e é porque isso foi o exercício que eu passei para vocês antes né então tudo bem isso isso e na multinomial daria seis regressões com aquele n pequeno não tem como né Eh colocar libido como variável dependente fazer uma regressão multinomial dá erro porque tem vai vai fazer e seis regressões tá vocês estão percebendo agora né estão pegando a a manha tá então beleza ó
parece mais Fácil de interpretar Mas você tem que garantir essa passagem né então Eh beleza aí aqui O o tudo bem mostrei como é que faz né regressão original pá tá vendo ele não tem muitas opções aqui no teste né acaba aqui tá não tem muitas opções É isso aí tá bom Deixa eu fazer no spss agora só para mostrar ó aqui o mesmo banco tá vendo mesmo banco mesma coisa eu entro aqui analy regression ordinal tá anal regression orinal aí ele vai abrir aqui para mim ó A variável dependente eu vou a dose aí
eu vou colocar libido como covariante idade Como o relacionamento como categórico e a idade como covariante também beleza aí nas opções nas opções é não não é a opção é o output o cavalo na opção é outra coisa Eh pera aí cadê o bagulho Ah aqui não não é esse é o output isso no output aqui eu tenho que clicar aqui ó teste de linhas paralelas tá vendo teste de Linhas paralelas é isso que eu tenho que marcar é isso tá teste de linhas paralelas É só isso que eu preciso aí marca continui e dá
ok ele faz o o o teste né aí vamos ver o resultado aqui né Eh veja veja o que ele vai me dar né ó ele me dá a tabela dos estimates do parâmetro é estimates lá tudo tudo certinho pá né Eh e aqui ó teste de linhas paralelas tá vendo aí ele compara aqui o gên ó tá vendo que o significância deu 0,90 o que que isso Quer dizer se Vocês entenderam O que quer dizer esse teste de linhas paralelas deu 09 as linhas são paralelas ou não dos grupos olhando esse teste aqui ó
0,90 o p as linhas são paralelas E aí dá para usar a regressão original eu posso usar essa regressão aqui ela é válida deu bom né deu bom né então eu posso usar a regressão original falei beleza né ótimo Tá vendo Por que Que não colocaram isso no jamovi não sei porque acho que o cara não teve tempo tava fazendo 20 coisas ao mesmo tempo né vida de proletário é difícil né não não foi porque não pagaram cara porque não pagaram mesmo né para fazer né então coitado então não dá para culpar né mas podia
pôr esse teste que aí é muito mais fácil para lá não tem o botão né então a gente vai ter que fazer um artifício então ó só para mostrar aqui só para dar um bizu Pera aí deixa Só deixa eu só copiar aqui um detalhe deixa eu ver aqui se tá 004 1.38 1.13 deixa só 1.40 deixa eu só trocar aqui a referência que é de inteo pro relacionamento só para inverter aqui só para ficar igualzinho 1.13 Beleza agora acho que dá deu certo então deixa eu copiar isso aqui só para colocar uma só para
mostrar mesmo né Aí eu coloco uma tabela embaixo da Outra aqui eh V aqui aqui ó só para dar só para vocês darem o bizu tá aqui beleza aí ó coloca aqui né então você vê os estiment o eu vou explicar o que que é esse threshold eu não expliquei ainda o libido ó libido deu 1.13 Aqui ó e aqui deu 1.13 também tá vendo só só tem mais cas depois da vírgula né não tem a mesma coisa 1.38 a idade 004 ó aqui e o Relacionamento né 1.47 aqui 1.479 né 1 só tá negativ
aqui aqui positivo por causa da referência né aqui tá como referência ser solteiro e aqui não aqui é ter o relacionamento tá por isso que muda o sinal mas veja que é tranquilo tá então bate a mesma análise D tudo certo e tal o que que é esse thr esse D para pedir aqui noov também ele tá tá aqui ó tem um um botão ó Model trashs Tá ele dá esse esses dois números aqui copiar eles também só para mostrar isso aqui eu vou esgotar mesmo a regressor original PR aí já fica como referência todo
mundo que achar esse vídeo já vai saber tudo a regressor original que é eu eu fico vendo os vídeos no YouTube emal eles são todos meio incompletos então aqui alguma hora eles vão fazer o teste de linhas paralelas dentro da dentro do jamovi então né então Ó o Thrash ó 3.44 Bate aqui e 5.7 bate aqui tá então dá igualzinho nos dois modelos dá igual não tem desculpa ai eu não gosto de usar o jamovi porque ele é um programa de graça pode ser que tenha erros Você tá vendo que dá igual tá deixa de
ser besta né e deixa de ser bocó então dá igualzinho e o que que é esse threshold eu a minha variável dependente dose ela não tem o Placebo o low dose e o High do né esse threshold seria meio que uma Nota de corte da onde de qual comparação eu tô olhando então é o seguinte ó a minha escala Ah a minha escala aqui de aqui no caso ele tá avaliando pela libido né que é a variável que deu significante a libido a libido é uma escala que vai de 1 a sete tá Minha Escala
então assim ó se eu tiver o o aqui né TR ponto 44 isso então ó 3.44 é o limite entre o Placebo e o low dose então quando eu tô fazendo essa comparação aqui eu vou est aqui 3. 3.4 Né se o o o grau de libido do Maluco do do velinho se o grau de libido do velinho tiver nessa faixa entre 1 e 3,4 a comparação que eu devo observar a comparação que eu tenho que olhar é entre o Placebo versus o low dose tá se eu tiver entre 3.4 e 5.7 aí o 5.7
vai est para cá 5.7 se eu tiver entre 3.4 e 5.7 aqui ó a comparação que eu estou olhando é entre o low do versus o High Do tá e se eu tiver entre 5.7 e 7 eu já tô tomando R doose eu tô dentro do grupo R doose sempre então ele coloca esses limites aqui tá ele coloca esses limites aqui tá bom só para você saber aonde que você tá e e porque assim por exemplo a libido né a cada um ponto a mais de libido aumenta aumenta três vezes a chance de eu subir
um nível né Mas qual o nível aí você tem que olhar o grau de libido da pessoa se a pessoa tiver entre 1 e 3,4 a compar entre o Placebo e o low dose se ele tiver entre 3.4 5.7 é entre o low dose e o High dose e se tiver mais que 5.7 é o High dose é isso tá e tudo bem gente pegaram pegaram o que quer dizer isso aqui tá a última coisa é assim no no spss vê se o se as retas são paralelas é bem fácil no gmov não dá para
ver porque não tem o botão né E aí como é que a gente faz última dica é isso em relação não em relação ao estimate tá então aqui em Relação relação ao estimate não ao ods tá o trold é sempre em relação ao estimate aqui e aqui ó tá não é em relação a ods tá bom porque isso aqui é só nota de corte né quando para ver qual a comparação não importa o número muito tá tudo bem tudo bem gente estão comigo tão comigo gente estão vivos vivas entenderam aqui o que quer dizer essa
parte tá isso então então Helder Por que Que a gente não tem a comparação do Placebo com High doose porque a variável ordinal Eu Não Posso pular pedaços você não pode pular degrau né é ordinal tá então assim se eu tenho aqui deu três né a libido então assim qual que seria a interpretação se eu tenho para passar do eh eh se a cada nível de libido a cada grau de libido eu eu aumento um grau na variável dependente eh para passar do do se eu tenho um um ponto de libido a mais eu tenho
três vezes mais chance de Passar do do Placebo pro low dose e tenho três vezes mais chance de passar do low dose pro High dose Quantas vezes eu vou ter para passar do Placebo pro Rose se isso aqui é verdade ó para passar do placebo pro low dose três vezes para passar do low dose pro High dose três vezes quantas vezes é do Placebo pro High doose que é do menor para maior quantas vezes é hein Gente lembre que regressão logística é um processo multiplicativo tá não é seis não são seis vezes é isso que
confunde você não soma é vezes 3 x 3 é nove vezes tá é um e o outro lembra probabilidade probabilidade você multiplica né para sair do Placebo pro low doose é um e o outro então é nove vezes tá você multiplica regresso logística é um processo multiplicativo tá então beleza Tá aqui é é como fazer Test teste entre aspas teste de eh proporcionalidade proporcionalidade de chances no J movi né Eh não é um teste entre aspas porque não é um teste tá não não não não é o melhor jeito mas é melhor que nada tá
é aqui é utilizar a aderência do modelo aderência do modelo e o tipo de aderência que a gente vai usar é um Valor que tá aqui ó deixa eu ver ele aparece aqui é o deviance tá o Devi o deviance é um indicador de aderência específico para regressões logísticas tá todo caso de regressão logística que usa você usa função de ligação logística na verdade tem esse Devi tá E então aqui a gente vai comparar pelo deviens esse Dev deviance é um indicador de Qualidade para modelos logísticos tá em geral e aí a a a dica
é assim quanto menor menor melhor quanto menor melhor então quanto mais perto de zero mais aderido eu estou aos dados ao modelo Tá quanto quanto mais perto de zero mais aderente os dados estão no modelo isso é o Dev tá então beleza então o que que eu vou fazer né é fácil eu vou entrar aqui ó o Valor deu 23 Beleza guarda esse valor aí o que que eu vou fazer agora vou fazer a a logística multinomial então ó entro aqui regressão multinomial e monto aqui a mesma a mesma coisa então aqui a variável dependente
a dose libido entra como covariante idade Como covariante o relacionamento como fator né Beleza aí ó veja que ele fez dois modelos né ele colocou o Placebo como referência colocou low dose com Placebo High doose com Placebo ó tá ele Fez dois modelos aqui ó o devance deu 22 né E aqui o devance deu 23 tá vendo o que que a gente olha você vê que é um problema do gemovi né e o a multinomial parece melhor tá vendo a multinomial parece melhor mas é muito pouco né mas aí o que que acontece quando você
vai ver aqui na multinomial colocar o aqui também né olha o que acontece quando eu vou ver os PS né ó veja que interessante a libido D Tipo na trave ó da 0051 né a libido d na trave aqui ó e não tem diferença no low dos entre o Placebo do low dos do Placebo não dá diferença né do High dos do Placebo dá uma só a diferença na libido né E quando eu mudo a referência para pegar o intermediário né que é o low dose com High doose low doose com dose ó não dá
diferença também tá vendo Então o Então na verdade a única diferença que existe quando eu faço a multinomial é entre o o o a menor categoria E a maior E aí se você olhar os intervalos de confiança que é bem notado pelo Elder eles dão muito grandes ó tá vendo eles dão bizarros né Por que que tá acontecendo esses intervalos bizarros por causa do tamanho de amostra eu só tenho 15 pessoas e eu tô fazendo dois modelos né Então esse é o diagnóstico que você tem que fazer tá então assim se a o ideal por
enquanto por enquanto o ideal é fazer no spcs teste da linha paralela acabou né no R também tem o Teste da linha paralela e tal que é que é o teste de valde e alguma coisa né e é de boa de fazer tá hoje movi Fica devendo isso o J movi Fica devendo isso tá vale a pena usar o AIC também né aí o a ele ele concorda aqui com a com a logística né aqui ele é menor do que aqui tá mas em geral que a literatura mostra que o Devan é um pouco melhor
né mas aqui claramente a gente vê que é um problema de poder do teste tá então assim por que vou justificar Por que que A decisão é melhor ficar na ordinal por quê Porque quando você faz a multinomial os intervalos de confiança ficam bizarros né e claramente mostra que é um problema de poder do teste para esse banco de dados lembrando ó que meu banco de dados é pequenininho Ó tem 15 pessoas tá fazer uma uma logística multinomial para 15 pessoas é meio ruim então uma uma outra opção aqui além do Devi uma outra opção
é observar observar o intervalo de Confiança do ods na multinomial tá se o intervalo de confiança aumentar muito isso quer dizer que o modelo tá com poder baixo aí talvez compense ficar na aí compensa mais ficar na na iginal mesmo tá mas o ideal o ideal Esperamos que aconteça pro ano que vem vamos ver vou continuar enchendo o saco é ter o teste das linhas paralelas no no Jovi aí Resolve o problema v o test da linha paralela aperta viu não é significante acabou tá então esse é o único Inconveniente assim doov que ele não
tem o teste de proporci dos das chances tá eh Natalia a regressão logística orinal é mais efetiva quando o modelo tem grupo controle não não não tem nada a ver com isso tá tem a ver mesmo quando a variável dependente é ordinal ou não não não tem a ver com nesse caso aconteceu isso né que nesse caso do Placebo pro Low dos e o High dose a a ordem parece que é proporcional então beleza Tá eh então assim fica meio estranho esse final assim no já movi mesmo tá você não consegue saber né na verdade
tá eh tudo bem gente beleza então se você conseguir fazer o teste das linhas paralelas por fora eu coloquei uma referência tem uma referência aí de como fazer o teste da linha Paralela no R tá é questão de tempo até isso ser implementado nas próximas versões do Jamovi tá é questão de tempo tá bom eh porque a conta não é difícil se encher o saco eu mesmo faço tá eh mas é isso aí tudo bem gente regressão iginal sobrevivemos tá entendeu um modelo legal né para acabar o curso como uma última regressão legal interessante né
Espero que vocês tenham gostado tanto quanto eu tá então fechamos primeira parte do curso agora fecha aí o caderno abra uma outra folha né Vamos agora começar com a curva rock Então assim a gente eh eh do ponto de vista formal encerramos as regressões né encerramos o nosso curso a parte de regressão agora vamos falar sobre outro tema que é a curva rock curva rock conversa com regressão logística mas mas é outro teste tá então outro tema outra parada pá n dá respirada aí né Bora outra coisa curva rock O que quer dizer rock né
primeira coisa e e aqui é uma coisa importante curva rock as pessoas acham que é veio Da Medicina né todo médico acha que médico é tipo inglês né na no período colonial né que chega lá no no no no outro lugar pisou lá na terra do outro é meu né tipo né é igual criança pequena né chegou lá é meu então e eh eh medicina tem isso também né todo mundo acha da área biométrica que a curva rock surgu na medicina claro não tá curva rock surgiu no exército né então a Rock quer dizer eh
Receiver receiver operator caracterítica istic caracteristic isso tá então é a curva do a curva característica do operador de receiver isso que é o isso que é o negócio tá curva característica do operador de receiver né isso surgiu nos anos 1940 na época da segunda guerra mundial na época da guerra né então surgiu num exército tá então o surgimento da curva rock foi eh no no Dent da área de Engenharia né área de engenharia do exército tá então aqui é engenharia então muita gente acha que curva rock é coisa da medicina para quar diagnóstico não eu
vou explicar o original tá Depois você vai ver que serve para curva diagnóstica mas eu vou explicar e eh é que boa parte de nós aqui que tá na área biomédica a gente não conhece engenharia mas curva rock na engenharia principalmente engenharia de produção é o teste mais usado é o feijão Com arroz do do engenheiro tá é é pesquisa operacional Essa parte aí de de engenharia Nossa usa muito tá por isso que também é muito usado em Inteligência Artificial inteligência né artificial tá é muito usado em modelo preditivo curva rock por isso que a
gente vê lá na regressão logística porque regressão logística é um modelo de classificação né Então usa bastante curva rock a ideia do da curva rock surgiu assim eh imagina que tem o operador do radar né aí o o Operador a máquina o receiver né é tipo o radar Então imagina guerra submarino os Car lá né tal e essas coisas aí aí tem tem um negócio assim né que era o radar lá né aí o o operador ficava aqui sentado olhando né ficava aqui sentado olhando lá o o o negócio né E aí ele tinha que
ele tinha ele ficava lá um tempão olhando e vinha uma bolinha né aí essa bolinha ela podia ser um avião podia ser um pássaro Ou uma nuvem mais carregada ou podia não ser nada né E e aí o o soldado né ele tinha que dar um aviso tipo e nada né ou ele tinha que avisar ataque né ele tinha que dar oe Tinha que avisar né então ele ficava ali olhando o dia inteiro né claro que você vai ficar cansado Óbvio vai ficar cansado com tempo né E aí começou a surgir um problema o que
acontece quando você faz aí s a base da neuropsicologia né vai passando tempo né E aí vai dando Problema aqui tem o o a característica atencional né que é medido pelo número de erros os erros que o que o cara comete né o o soldado então no começo era zero Mas aí o conforme o tempo vai passando a quantidade de erros I aumentando I aumentando né então quando o cara tava muito cansado ele errava muito né E e aí ele tinha que ver um ponto aqui né um ponto ideal aqui né na na na curva
de erros né Em que ele via que era bom trocar trocas né tinha que trocar o soldado de um parao outro então para para eles fazerem uma troca de turno troca de turno tá é isso né então motivo né E aí como como que você faz para descobrir essa nota de corte aqui ah você só pode ficar sei lá 4 horas depois de 4 horas a a em média o número de erros é muito grande então é melhor trocar então a cada 4 horas você troca o soldado né E tá bom como é que a
gente descobre Isso primeiro tem que coletar os dados tem que ter dados de observação de várias pessoas né E para poder fazer isso tá E então o o contexto da curva ro surgiu aí tá nessa coisa de guerra e aí tem uma coisa interessante também que é a classificação dos erros né Não não é Que tipo de erro surgiu do tem dois tipos de erro né o primeiro erro ele é chamado falso alarme falso alarme né O que que é o falso alarme o falso alarme é eu dizer Ataque quando não é né então dizer
ataque quando não é né ou dizer e dizer que o resultado é positivo quando na verdade não é né então o falso na verdade o nome sensibilidade surgiu a partir do nome falso alarme tá não é o contrário né começou aqui então falso alarme eu dizer ataque na verdade olhar é um pássaro Não é porque eu tô cansado né e tem outro que é a Omissão omissão né é outro tipo de erro omissão é o deixar de ver o ataque né deixar de ver o ataque né eu com bola né então e aí o é
interessante porque esses essas curvas de erro na verdade tem duas curvas tem a curva dos falsos alarmes e tem a curva da omissão e não necessariamente Elas têm a mesma forma né pode ser assim quando eu pego o falso alarme Eu eu pode ser que a curva do falso alarme o número de falsos alarmes cresça mais rápido e a Curva de omissões cresça mais devagar aqui o falso alarme e aqui por exemplo a omissão né então É legal saber É legal saber isso ó para cada ponto no tempo você sabe o quanto de falso alarme
e o quanto de omissão é esperado em média vai ter uma certa quantia né não é interessante gente não é legal eu achoo legal mai legal né de identificar o longo do tempo tal uma nota de corte bacana mesmo né E aí essa área do conhecimento né teve dois dois dois Filhotes né nasceu na engenharia tá isso aqui nasceu na engenharia e aí gerou duas coisas uma é uma uma área que chama muito muito própria hoje tá agora que o povo biomédico tá pegando isso daqui a uns 10 anos ele V vão falar que é
deles quando não é já temas 100 anos já em outras áreas que é chamado teoria de detecção de sinal teoria de detecção de sinais né foi uma né e outro outro filho Dessa discussão é uma parte da neuropsicologia neuropsicologia sobretudo os estudos de atenção muita gente diz que os estudos de atenção começaram na área médica estudando criança que tinha problema de atenção adulto demência bobagem começou aonde no exército tá estudo de atenção mesmo os primeiro cara que começaram a ver teste de atenção volta no século XIX donders né o donders lá que estudava o primeiro
cara que estudou tempo de Reação e tal o eraa optometrista né ele era um oculista que não era médico mas um dos primeiros usos dos trabalhos de ders foi no exército tá então véi a engenharia é que a engenharia não liga né mas ela boa parte dessas coisas de diagnóstico de nota de corte de métrica de de avaliação de eh score de eh previsão isso vem tudo da engenharia tem nada a ver com a medicina nada tá a medicina chupin e não dá o [Música] Crédito beleza gente tá então é nessa discussão que nasceu a
curva rock tá bom aí assim pulando já né um um tempo eh depois uma aplicação disso óbvia né uma aplicação óbvia dessa dessa discussão começou lá no exército e tal então nos anos 70 isso começou a ir pra área médica por quê Porque entre falso alarme e omissão né Eh existe um paralelismo de termos então quando eu penso falso Alarme e omissão isso é paralelo né com outros dois contextos eh que é a sensibilidade e a especificidade que eu já vou explicar o que que é isso mas existe Total paralelismo né desses desses termos e
existe paralelismo também com a estatística porque nada disso é estatística tá isso aqui é só contar isso aqui é Contagem não é não é Estatística tá nenhuma dessas duas coisas são estatísticas mas aí entra em erros de julgamento vai entrar no erro tipo um e o erro Tipo dois É que na verdade aqui ó o erro tipo um e o erro Tipo dois tem mais a ver com falso alarme eou omissão porque isso aqui são erros né isso aqui é um erro né isso também é um erro tá sensibilidade especificidade não é erro é o
quanto acerta né Então na Verdade a a o que o que teria o paralelismo total é um menos a sensibilidade e aqui um menos a especificidade tá para para transformar porque sensibilidade é o quanto o modelo acerta especificidade também é o quanto ele acerta para para ficar aqui paralelo com os erros teria que ser o contrário né um menos sensibilidade um menos especificidade que aí é é a sensibilidade seria a taxa a taxa de falso negativo né aqui seria taxa de Falso negativo taxa de falso positivo Tá mas a gente vai ver daqui a pouco
então existe uma um paralelismo entre a engenharia a estatística E aí depois a medicina entrou né a a a área biomédica tá então né aí muito legal só que aí a curva rock Cresceu mesmo depois na área biomédica Tá mas o engenheiro aprende isso aqui como Na graduação na graduação você aprende curva rock e usa tipo não tem nada de especial né ou o o o povo que usa curva rock assim eu sei tudo de Curva rock sei fazer na mão né Como usa isso aqui estratégia de pequeno poder para gerar assédio moral nos alunos
é povo da biomédica tá porque o engenheiro Olha lá para curva rock Qual o problema né não tem nada demais né eh então assim isso que é importante né Tem tem diminuído ao longo dos anos tá essa coisa do assédio moral pela essa essa síndrome idiota de pequeno poder né eu sei uma coisa que você não sabe então sou melhor cambada de cabaços né mas Enfim tá eh Então o que falta agora então agora agora eu vou focar na questão biomédica mesmo tá então eh faz todo sentido usar uma curva rock para diagnóstico né então
Vamos aos usos o usos da curva rock o grande uso da curva rock é criar notas de corte né criar notas de corte mesmo eh então o o assim um uso específico mas pode ser muito útil e a curva rock acompanha Vários testes né e não não vou explicar isso aí ainda Patrícia então o uso principal uso da curva rock né é estabelecimento criação de notas de corte diagnósticas H [Música] criação criação de notas de corte Diagnósticas tá tem várias utilidades né Eh criação de nota de corte diagnóstico beleza né aí tem uma tabelinha mágica
assim ainda não é exatamente a curva rock mas ela vai aparecer com base nessa tabela tá ã então aqui ó eh vamos imaginar é porque assim quando quando notas de corte diagnóstica você sempre vai ter duas coisas você vai ter um teste um teste e você vai ter a realidade o que acontece no ambiente Realidade tá eu quero relacionar o que que meu teste dá com que existe na realidade tá aí eu faço uma tabela que é a tabela clássica eu tenho o resultado do meu teste tá o resultado do teste ele pode dar positivo
pode dar negativo resultado do meu teste e existe o dado na realidade existe assim o o o não é porque o teste Deu positivo que eu tô doente depois que o teste Deu positivo eu tô doente não eu tô doente por isso o Teste Deu positivo Então aqui tem o o mundo né a realidade na realidade no mundo mesmo ou eu estou doente doente positivo ou doente negativo não estou doente tá e a ideia é estabelecer a relação dessas coisas aqui né estabelecer essa relação aqui tá bom né e a aqui um detalhe importante uma
observação importante que a nossa nossa última aula é sobre inferência Beana vai entrar isso isso é um erro Comum tá uma observação que assim eh eh eu eu o o teste positivo se o meu eu eu faço um exame para uma doença se o teste dar positivo se o teste dar positivo quer dizer que estou doente então eu fiz um teste o teste Deu positivo quer dizer que eu tô doente não essa essa essa direção ela não é válida assim você tem uma maior chance de estar doente mas não quer dizer que você tá doente
tá isso então se o teste da Positivo quer dizer que eu estou doente isso é diferente diferente de dizer estou doente logo o teste Deu positivo tá isso é completamente diferente um uma uma frase não é equivalente à outra não é meu teste dá positivo e eu por isso estar doente é diferente de eu estar doente por isso o teste Deu positivo porque aqui ó o Doente é algo da do mundo real né o teste tá aqui ó então uma coisa no mundo influencia o meu teste Isso é verdade tá o contrário não o meu
teste ele não influencia o mundo isso aqui essa relação não existe tá a menos que o teste seja um oráculo perfeito se o teste é um oráculo perfeito sempre que ele dá positivo você tem de verdade a doença aí tudo bem aí as duas afirmações são equivalentes tá então A ambas afirmações ambas afirmações são entes apenas ambas as afirmações são equivalentes Apenas quando o teste é um oráculo perfeito e quantas vezes acontece isso do Oráculo ser perfeito nunca Então essas afirmações não são equivalentes tá então assim o você faz um exame e o teste dá
positivo para você você fica Assustado né Ai meu Deus vou morrer né na verdade não sei não sei agora se você está doente e depois faz o teste aí ele tem que dar positivo senão o teste é muito ruim tá então assim o o o mundo controla o resultado do teste mas o contrário não o teste não controla o que acontece no mundo é isso que a gente tá comparando aqui o resultado do teste com o mundo tá na na última aula do curso de inferência Beana eu vou mostrar isso tá que isso é bem
diferente tá E aí eu vou Explicar isso em termos de variáveis próximas e distantes a gente vai ver depois mas eu quero deixar essa sensibilidade tá eh aqui então tudo bem Eu tenho o meu teste e eu tenho o mundo tá eh então se você parar para para olhar aqui ó quando o teste dá positivo e no mundo eu estou doente né Isso é um acerto eu acertei né isso isso é é chamado né de verdadeiro positivo VP né Eh sup uma legenda Eh deixa eu apagar aqui então se você olhar a diagonal né Tem
uma diagonal aí que que são os acertos que o modelo tem né que o meu teste faz e tem outra que são os erros então ó se eu colocar aqui VP é o verdadeiro positivo por que que ele é verdadeiro positivo porque o teste Deu positivo a pessoa tá de fato doente né esse outro também é um acerto é o verdadeiro negativo né porque o cara não tinha doença e deu negativo no teste e ele não Tem tem a doença mesmo então aqui verdadeiro negativo beleza né e os outros dois são erros né são erros
então o o o teste dá positivo mas na verdade eu não tô doente né o teste Deu positivo mas na verdade eu não estou doente né então isso aqui é um falso positivo FP FP falso positivo isso seria o falso positivo é o falso alarme né é o falso alarme eu digo ata aqui na verdade não é né eu digo você tá doente mas na verdade Não tá tá isso é um falso positivo e aqui de forma complementar eu digo que você não é não tá doente mas na verdade tá né é o falso negativo
tá é a omissão falso negativo que aqui é a omissão tudo bem gente assim eu digo que você não tem a doença mas na verdade você tem eu omiti né uma coisa tá tudo bem gente pegaram aqui esses quatro tá então o branco eu tô acertando o outro eu tô errando Tá pegaram estão comigo estão vivos Hein gente fala aí comigo vocês estão vivos vivas Hein gente morreram Sim Sim estão comigo tá vivo porque essa parte é importante tá a gente vai vem aí vem com pai né então aqui tá beleza então ol Olha só
e tudo bem então aqui eu tenho os acertos e os erros Beleza agora a gente vai brincar com essa tabela né que é o seguinte o você pode olhar essa tabela de dois jeitos eu posso ter dois Focos né o primeiro foco eu quero focar no no quanto o eu quero no quanto o quanto da realidade o meu teste grava tá então o primeiro foco que eu quero ter né Eu quero saber o quanto da realidade o quanto do mundo quanto da realidade Meu teste capta Esse é um foco é um objetivo tá o quanto
da realidade o meu teste capta então eu vou partir da realidade eu parto da realidade tá o quanto da Realidade o meu teste é capaz de detectar Então são eu vou olhar na coluna eu vou olhar na coluna tá então eu vou olhar esse esse primeiro rapaz aqui ó aqui Vou olhar esse aqui né beleza né E aí ó eu quero saber o quanto da realidade Meu teste capta então eu vou focar por exemplo na relação entre o positivo e o doente Tá então o quanto da realidade Meu teste capta é o quanto dos dos
positivos né quanto do eh eh quanto Meu teste Deu positivo para quem é Doente de verdade então aqui o que o que eu quero saber é dentre dentre todos os doentes dentre todos os doentes de verdade na realidade eu parto da realidade dentre todos os doentes de verdade Quanto quantos Meu teste captou captou quanto Meu teste pegou de verdade quant quant quantos ele pegou né como é que eu faço essa conta você vai fazer assim ó você vai pegar o Verdadeiro Positivo né que é o quanto teste acerta verdadeiro positivo e dividir pela soma de
todos todos que o teste detectou como Positivo né então verdadeiro positivo dividido pelo verdadeiro positivo mais o falso negativo que é a soma da coluna né essa soma da coluna aqui é o d mais tudo bem gente vocês perceberam que essa o VP dividido pelo VP mais fn é o mesmo que dividir pela soma do dema né Perceberam o que eu fiz aqui gente tá então eu quero saber o quanto que meu teste acerta dentre todo mundo que é doente quanto que meu teste acerta dentre todo Tod mundo que é doente pegaram isso gente eu
vou fazer devagar porque isso aqui é importante é o que a Malu colocou isso é fundamental viu isso aí pega no coração da biomedicina tá teste diagnóstico Tá bom então Ó o quanto que o teste acerta dentre todo Mundo que é doente isso tem um nome né Tem um nome sensibilidade sensibilidade sensibilidade né que que é sensibilidade o quanto o teste detecta como doente então deixa eu até explicar melhor sensibilidade D uma definição a isso é a capacidade do teste então sensibilidade é a capacidade do Teste capacidade do teste de dizer que você é doente
tá tá bom não dá para fazer na mão dá para fazer de cabeça se o número é pequeno né claro que dá para fazer na mão Como assim né Eh de novo porqu no poder né que desgraça né então isso aqui sensibilidade sensibilidade capacidade do teste dizer que você é doente né então é a proporção do verdadeiro Positivo dentro de todo mundo que é positivo de verdade beleza né É É e logo eu estou focando do quanto da realidade Meu teste capta isso a sensibilidade é uma metida só que assim por exemplo eu vou aplicar
um teste em você né e eu quero ter certeza de que eu vou pegar todos os doentes então tem uma fração de vocês doentes eu não sei quem são e eu quero fazer um teste que pegue todos os doentes é só o teste dizer que tá todo mundo doente né se eu aplicar um teste Em todos vocês e todos vocês derem positivo Com certeza eu pego todos os doentes né só que o que que vai acontecer eu vou inflar eu vou inflar os falsos positivos né eu vou inflar falso positivo Então vai assim eu vou
pegar todos os doentes Mas vai ter gente que eu vou dizer que é doente e na verdade não é né então assim não adianta ter a sensibilidade apenas é muito pouco né então um teste é bom quando ele tem sensibilidade Mas ele Também tem que ter ele tem que ser bom em detectar O negativo né então o primeiro foco né para eu saber o quanto da real Meu teste capta é focar no quanto ele acerta né e agora eu tenho que focar no quanto ele erra ele tem que errar ele tem que detectar o negativo
pouco também eu tem que detectar o negativo muito desculpa né então eu vou fazer a mesma lógica aqui agora ó né então quão bom é o meu teste para detectar quem não tem a doença não tem Né então é a mesma conta ó é o verdadeiro negativo que é o quanto o teste acerta dividido pelo verdadeiro negativo mais o falso positivo né que isso aqui é o d menos tá então o o eu preciso dessas duas contas né E aí o que que eu vou ter aqui uma uma outra coisa é a especificidade especificidade a
especificidade é a capacidade capacidade do teste eh de dizer Que não sou doente não sou doente tá isso é especificidade é a mesma coisa ao contrário né só que eu vou est focando nos acertos tá então o teste tem que ter alta sensibilidade ele tem que dizer que você tem a doença e ter de verdade ele tem que ter alta especificidade dizer que você não tem a doença e não ter de verdade é coerente vai faz sentido Então essas duas entidades essas duas quantidades se refere ao ao fato de você verificar o Quanto da realidade
o seu teste capta são esses dois tá então eh eh aqui né Eh eh só complementar porque não tem espaço Mas esse Branco né a sensibilidade é dentre todos os doentes quantos meu testes captou na especificidade é dentre todos os não doentes né o d menos quantos Meu teste captou seria a especificidade tá tudo bem gente perceberam esse Foco perceberam isso aqui gente coragem vai me ajuda tá pegaram isso aqui Sensibilidade especificidade de novo é a relação entre o teste e a realidade tá eh e vocês perceberam uma coisa perceberam que eles não são complementares
então se a sensibilidade é 60% a especificidade Nem sempre dá não dá 40 eles não somam 100% é isso que você tem que notar tá sensibilidade especificidade são coisas diferentes não é complementar então aqui é especificidade não soma 100% tá eu posso Ter 90% de sensibilidade e 90% de especificidade até bom isso acontecer tá A ideia é que os dois sejam altos Tá beleza então via o meu primeiro foco né Tem um segundo foco o segundo foco eu eu posso apagar esse lado aqui posso apagar esse lado Tá quanto maior cada um deles melhor tá
eu vou apagar aqui tá esse canto aqui eu vou vou apagar esse foco depois você pausa o vídeo e copia né Essa é a vantagem do do gravado online é isso então agora a gente vai mudar de Foco então sensibilidade especificidade é para o o me ajuda a entender o quanto que o meu teste capta da realidade legal né agora agora eu quero fazer outra coisa o foco dois o foco dois é o seguinte eh e eu quero falar sobre qual o quão bom qual a capacidade preditiva do teste qual a capacidade preditiva do teste
é diferente tá o quanto que o Teste é bom em si né o quanto o quanto que o teste é bom em si mesmo um teste bom em si aí aí a diferença entre o biomédico e o engenheiro o engenheiro ele não foca muito na sensibilidade especificidade ele Foca no quão o teste é bom tá na engenharia de produção no que quer que seja a gente a a o engenheiro ele vai focar na linha o médico biomédico vai focar na coluna tá mas dá para calcular as quatro coisas Então a a ideia aqui né É
é trabalhar agora aqui ó na linha Tá eu vou trabalhar na linha então o que que eu quero saber aqui o primeiro né primeiro foco eh Quanto quanto o teste acerta positivo quanto o teste acerta quanto teste acerta dentre dentre todo mundo que deu positivo no Teste tá então quanto o teste acerta dentre todo mundo que deu positivo no teste então é a linha agora né aí o que que eu vou pegar Ó quanto que o teste Quanto que o modelo acerta de verdade é o verdadeiro positivo em relação a quem em relação ao total
da linha que é o verdadeiro positivo mais o falso positivo tá então agora tô acertando na linha né E esse VP mais FP é o teste Positivo tá eu vou chamar aqui T positivo T negativo é o teste positivo Não é mais o d não é mais quem é doente de verdade aqui eu tô comparando com a capacidade preditiva do teste e não da realidade que é como era aqui embaixo aqui embaixo é realidade o d mais agora o t mais não é o quanto o teste acerta tá então V pegar VP dividido por VP
mais FT tem um nome que é chamado valor preditivo positivo isso aqui é o valor preditivo Positivo tá vpp Positivo tá bom valor preditivo positivo é o quanto O teste acerta tipo o o povo faz machine learning essas coisas usa muito esse valor muito tá o povo biométrico quer saber o quanto da realidade você capta Então usa sensibilidade especificidade tá do mesmo jeito que eu fiz aqui na linha eu posso fazer embaixo eu posso fazer aqui embaixo mesma coisa Quanto que o teste é bom capacidade preditiva do teste do lado negativo né mesma coisa para
ver se vocês estão entendendo como que é a fórmula aqui embaixo então nessa Linha como que é a fórmula faz para mim se aqui é VP dividido por VP + FT FP na linha Quanto que é a fórmula aqui embaixo quem que tem que tá em cima quem que tem que tá embaixo Aqui vai gente faz para mim vê se Vocês entenderam essa parte de baixo isso é é não não é o fn não é o fn quem tem que quem tem que vir em cima e quem eu acerto né O que que eu acerto
é o verdadeiro negativo verdadeiro negativo tá então eu olho aqui ó verdadeiro Negativo Quanto que o teste acerta dividido por todo mundo que dá negativo fn + VN isso é o teste verdadeiro teste negativo Tudo bem então VN divido por fn + VN tá isso aqui é o valor preditivo negativo preditivo negativo VPN negativo tá tudo bem gente é o quanto o teste acerta dividido por todo mundo todo mundo dá condição tá pegaram a ideia então basicamente são esses dois essas quatro medidas que as principais tem um Monte de outras Tá mas são as principais
valor preditivo positivo e negativo isso aqui é muito usado na área de previsão né modelos preditivos modelos preditivos né e a sensibilidade especificidade é muito usada na área diagnóstica a área biométrica né beleza tá legal né legal interessante isso aqui né Eu acho legal tá eh Então essas são as quatro principais medidas aí tem um monte tem o contrário né então Se você pega o contrário eu só vou falar o nome tá só vou falar o nome porque não não importa a sensibilidade é o quanto que o teste acerta né dentre todo mundo que é
doente eu posso porque aqui eu tô focando nos acertos né então sensibilidade especificidade valor preditivo positivo e negativo são relacionados com o acerto do modelo o quanto que o modelo Tá acertando né e não tem nenhum problema eu podia focar no quanto ele tá errando né então ao Invés de colocar por exemplo aqui VP dividido por VP + f n eu podia focar no fn que é o quanto ele erra né então fn dividido por fn + VP eu podia focar nos erros eu podia fazer outro outros quatro valores focados nos erros né aí o
que qual que é o contrário da sensibilidade é a proporção de falso negativo o fn né então a a o contrário da sensibilidade é a proporção de falso negativo né o contrário da especificidade é a proporção de falso positivo ou a taxa de Falso positivo né o contrário do valor preditivo positivo eh é um negócio chamado F que é muito usado tem ficado muito comum que é chamado fdr ou false discovering rate né a a taxa de falsa descoberta que é a taxa de falso alarme né a taxa de falso alarme é o contrário do
valor preditivo positivo e a taxa de omissão é o valor do o contrário do valor preditivo negativo Tá eu já vou explicar o Elder falou da acur Então assim esses qu valores desdobram em mais qu que é quando você Foca no erro mas o importante você saber esses qu o fundamental PR Nossa área E aí falta mais um que é como colocou que é acurácia Nura é o quanto que o modelo acerta em geral n f umur do modelo do teste né taxa Geral de acerto do teste como um todo não importa ser Positivo ou
negativo tá é não é quanto certo em média quant certo em proporção mesmo né porque aqui são proporções então o que que eu vou pegar o verdadeiro positivo mais o verdadeiro negativo que é o quanto eu acerto e divido por todo pelo Total negativo mais falso positivo mais falso negativo tá então aqui é o quanto eu acerto dividido pelo total né é isso é é o mais simples tá eu Pego essa diagonal e divido pela soma de todo mundo é a acurácia né acurácia é o quanto que o modelo acerta em geral tudo bem gente
pegaram aqui isso aqui essa parte tá eu eu sei que para quem é da área biomédica você ouviu isso aqui alguma vez mas Duvido que você tenha ouvido desse jeito porque em geral quando você aprende essas coisas você aprende picado né A brende picado não vê a relação de um com o outro o povo explica muito complicado sabe eu eu Prefiro voltar lá no soldado vendo receiver esperando a guerra ou não sabe é mais fácil tá é mais honesto então o o o fals positivo aqui você pode colocar como eh falso alarme também ó que
é falso alarme e o falso negativo aqui é a omissão tá é a mesma coisa tá eh Então tudo bem Tá pegar esses quatro valores né Eh sensibilidade especificidade valor preditivo positivo e negativo são os principais e a Acurácia já tá bom tá isso a acura é a taxa Geral de acerto do modelo do teste né a taxa Geral de acerto do teste tá eh Beleza agora com isso o que que isso tem a ver com a curva rock né a curva rock é um jeito gráfico de mostrar essa tabela essa tabela aqui eu quero
transformar essa tabela num gráfico isso que a curva rock faz tá só que assim não não dá para ver direto né não é não é tão trivial de ver mas eu eu vou mostrar como é que a gente vê é muito muito legal curva rock É um bagulho bem bem bem bolado quem bolou a curva Rock lá o soldado pena que foi com objetivo ruim mas o cara bem sacado bem bolado né então e eh a curva rock é um gráfico né C rock é um gráfico que agrega os dados da tabela 2 por2 Vista
anteriormente tá é é é isso tá então eh Eh de no frigid dos ovos é isso então agora a gente entra na parte prática como é que você faz a curva rock tá para fazer uma curva rock você precisa de duas variáveis tá o banco de dados né para fazer a curva rock você precisa de uma variável categórica e uma contínua se você tiver duas categóricas não dá para fazer curva rock se tiver duas contínuas não dá para fazer também tá então você sempre tem que ter uma variável Categórica grupo né E tem que ter
uma variável contínua uma variável contínua aqui qualquer aí eu vou mostrar no programa como é que faz Tá mas antes eu quero mostrar a carinha do gráfico então Eh vamos imaginar um exemplo que é o seguinte vamos imaginar o exemplo e vou imaginar que eu tenho uma variável categórica só primeiro tá categórica não desculpa só variável contínua Glicemia glicemia tá temos médicos aqui tem profissional de saúde aqui tem tem alguns né e a Glicemia é uma uma variável uma variável contínua que me leva a dois diagnósticos eu posso usar isso como critério diferencial para ter
dois diagnósticos se você tem diabete ou não diabete eu uso isso né para saber se você tem diabetes ou não tá é um dos critérios possíveis tá bom eh eu tô Simplificando bastante tá só que para eu saber se você tem diabete ou não e a Glicemia é uma variável contínua né eu tenho que ter um corte eu tenho que ter uma nota de corte para a partir de tanto você vai ser diabético a partir de abaixo de tanto não vai ser né para eu conseguir fazer essa divisão clínica Eu preciso de uma nota de
corte Quanto é essa nota um de vocês deve saber quanto que é essa nota pelo menos uma pessoa deve saber quando você Vai fazer o exame tá até escrito no exame também né Quanto que é a nota de corte para dizer básica assim simples tá Não precisa eu sei que tem tem briga tá começando a discutir isso aí mas não importa tá são simples quant a partir de quanto 100 né 100 nota de corte é 100 pontos tá se eu tiver mais que 100 pontos estô na diabetes se eu tiver menos que 100 pontos estô
na não diabetes tá isso eu ten os 90 mas deixa assim tá bom eh sem beleza a pergunta é Como isso foi criado da onde tirou esse essa nota 100 né o cara tirou da cabeça inventou não não não foi inventado né surgiu a partir de uma curva rock tá como que é ó Pense [Música] comigo vamos vamos lá eu tenho aqui ó uma reta E esses são todos os possíveis valores de glicemia tá todos os possíveis Então imagina que eu coloco numa reta todos os Possíveis valores de glicemia numa amostra imagina que eu coletei
uma amostra grande desse lado de cima eu vou ter a diabete positiva né e e do lado de baixo vou ter a diabete negativo tá quem não tem tá bom né eh beleza votei aqui tá aí no no passado longino quando não tinha nota de corte não tinha esse critério não tinha nada mas a gente sabia que a a Glicemia era relacionada com o quadro clínico com consequências se você não tratasse né Já Já você sabia que a Glicemia ajudava a diagnosticar alguma coisa mas a gente não tinha nota de corte né Quem era que
dizia se a pessoa tinha diabete ou não então ó pensa comigo gente ó Décadas atrás a gente não sabia se a nota de CTE era 100 ou não não tinha essa ideia mas a gente já tinha uma fisiologia de que a monitorar a Glicemia era bom para evitar problemas né paraa pessoa era bom né quem era o teste então assim Quem era Quem era o Teste que era aquele que dizia se a Glicemia tava Alta ou baixa ou bastante na ausência do da nota de corte então a aqui É na ausência da nota de corte
né na ausência da nota de corte devo ter um critério um teste que me ajude a discriminar os grupos discriminar os grupos não é o paciente Misericórdia você acha que o paciente sabe quando de G de diabete quanto de glicemia ele tem tem nada senão se o cara soubesse quanto de de glicemia ele tinha não tava comendo doce né não tava lá se matando de comer né O cara não sabe o paciente é o que menos sabe né em geral é o médico o médico que monitora né então antes da nota de corte a a
o padrão ouro né era o médico então a gente tem uma coisa que chama uma padrão ouro o padrão Ouro seria o o teste mais acurado eh o teste mais acurado possível para discriminar grupos discriminar grupos tá o teste mais acurado possível é o médico é a avaliação clínica tá é o teste o melhor teste o padrão ouro para avaliar se você tem diabete ou não é o médico né só que imagina o médico tem Que ser avaliar todas as pessoas para ver se tem glicemia alterada ou não fica impraticável porque é muita gente né
então o que que você faz a partir do padrão ouro você vai construir uma nota de corte uma nota de corte para agilizar o processo de Diagnóstico então ao invés de avaliar toda a pessoa o tempo todo porque é é uma coisa muito muito básica né Eh você Vai criar uma nota de corte para ter já um um diagnóstico decisório mais rápido tá Então imagina que toda vez a pessoa chega com você com valor de glicemia e você não sabe o a nota de corte disso gera um esforço cognitivo grande tá e o paciente não
é um padrão ouro para ele mesmo tá isso é uma base de de pesquisa clínica tá o paciente não é uma base boa base para a avaliação dele mesmo você tem que usar um teste tá então por exemplo o o o relato do Paciente não é uma medida boa da Inteligência dele o que é o padrão ouro pra inteligência dele é o teste o teste a partir da da do comportamento dele você tira uma medida mais acurada tá E aí tem as notas de corte também para esse teste pode fazer depois tá bom então vocês
vocês notaram o problema né então eu tenho uma variável contínua essa variável contínua é associada com uma coisa um desfecho né que eu quero ver mas eu não tenho a nota de corte eu Quero criar tá então tudo bem Como que eu faço para criar essa nota de corte então Ó eu pego a Glicemia que é a variável contínua né e pego aqui imagina que no meu banco de dados o menor valor de glicemia que eu tenho é 30 30 tá a pessoa tá quase morreu aqui né com 30 de glicemia não pode ter muito
pouco também né convenhamos e a a a pessoa com maior grau de glicemia ela tá com 400 tá morrendo pro outro lado né já viu tá morrendo para outro lado então um tá Morrendo para um lado outro tá morrendo para outro lado os extremos nunca é bom né os extremos nunca é bom então Pense comigo ó eh aí em cada nível 30 31 32 33 vai indo até o 400 né eu vou ter pessoas Então imagina que que essa escala é graduada né Tem grauzin e dentro de cada grauzinho tem um grupinho de pessoas tá
então por exemplo se eu pegar aqui pesso o número de pessoas que tem a Glicemia 30 né O que que eu vou ter o meu teste positivo ou negativo e vou ter se a Pessoa é doente ou não positiva ou negativa eu vou ter uma tabelinha 2 por do dentro de cada nível da glicemia tá então dentro de cada nível eu vou ter aquela tabelinha que eu mostrei antes então imagina ao longo de uma variável contínua para cada nível dessa variável contínua eu vou ter essa tabelinha né E aí vai ter também aqui dentro verdadeiro
positivo verdadeiro negativo né o falso positivo o falso negativo eu vou ter aqueles quatro Valores tá só que para cada nível Então veja que é o são várias dessas tabelinhas encadeadas tá então ó vamos vamos começar pelo óbvio então ó se eu pegar todas as pessoas que TM glicemia 30 tá você concorda que não vai ter nenhum diabético aqui dentro Você concorda gente se eu pegar eu tenho imagina que eu tenho um n grande Tá muitas pessoas dentre as pessoas que tem a Glicemia 30 elas podem estar morrendo mas não por causa de Diabete Você
concorda concorda comigo gente vai coragem Burst final vocês concordam comigo que el a pessoa não vai estar morrendo né de de diabete tá então o que que vai acontecer 100% das pessoas aqui ó 100% das pessoas vai ter diabete negativa né E 0% vai ter diabete positiva não tem como né aqui é fácil 0% beleza né quando eu olhar o outro extremo o outro extremo do 400 aqui Você concorda que todo mundo que tá com 400 de glicemia tá com diabete não tem como errar né tá com diabete tá todo mundo aqui ó aqui é
fácil aí é fácil discriminar 100% das pessoas tá positiva e zero negativo beleza né A questão é o meio né A questão é o meio então o que que acontece ah com 30 aqui já tá vendo a luz branca aqui a luz a luz azul né cada um já tá vendo a luz pro lado que importa ali né mas tudo bem então Ó aqui 100% com certeza ninguém tem diabete né com a glicemia tão baixa beleza né aí o que acontece eu vou começar a aumentar o valor de glicemia né então o que que vai
acontecer vai continuar aqui alto bem alto né bem alto vai subindo vai indo não nessa linha torta aqui do cavalo né mas aí vai chegar um ponto quando a Glicemia começar a subir um pouco né o valor aqui da glicemia começar a subir um pouco né vai começar a aparecer tipo um herói aqui ó perdido um com glicemia Do outro lado né começou a aparecer um Mas tudo bem mas estamos ainda tá muito grande ninguém tá vendo né ainda tá muito grande tá indo ó todo mundo aqui sem diabetes né agora tá fácil descriminar mas
vai chegar uma hora que vai aparecer um herói e essa parte de baixo vai ficar menor Então vai chegar uma hora que vai aparecer um tantinho para cá né e um tantinho menor para cá e esse Tantinho para cá vai aumentando vai aumentar também por quê Tá começando a aumentar do outro grupo né Aí vem para cá ó aí eu aumento para cá aí a até a hora que o jogo inverte né quando o jogo inverte é por quê Porque está aumentando do outro lado né com essa linha torta de Parkinson também né então aqui
né parece um uns anelídeos né parece o o aqueles bichinhos do mar aqueles pepinos do mar né que F as anêmona aquelas anêmonas fic andando no meio deles né parece um coral isso aqui aí o que que vai acontecer vai começar a Andar para cá né E vai diminuindo de baixo aí o jogo inverte vai diminuir para cá né Aí vem mais ó vai diminuir menos aí até um ponto que vai chegar todo mundo tá para cá também ó beleza né então vocês perceberam o andamento desse gráfico né que vai diminuindo de começa de uma
ponta 100% vai diminuindo e aumentando a outra né então eu vou ter um gráfico com essa cara assim meio assim né aqui assim para cá e vou ter um outro né ô meu Deus e não dá um outro Misericórdia pera aí aqui agora melhorou para cá né só que repara uma coisa né Agora eu tenho que criar uma nota de corte né quando eu crio uma nota de corte vamos imaginar aqui por exemplo ó aqui é uma nota de corte tá então aqui é um nota de corte vamos imaginar que a nota de corte é
100 tá então esse ponto aqui ó ele é 100 tá quando eu faço essa nota de corte repare que vai ter uma proporção de p Pessoas positivas e uma proporção de pessoas negativas Tá certo vai ter uma proporção de acerto para um lado e uma proporção de acerto por outro lado tá então vai ter uma proporção de pessoas que eu digo que é positivo e tem diabete uma proporção que eu digo que é não tem diabete não tem mesmo tá bom nessa nota de corte 100 tá repara agora e eh daqui para cá ó então
a nota de corte se eu tiver mais que 100 né eu tenho diabete Eu sou de mais né se eu tenho menos que 100 eu não tenho diabete eu sou D menos Tudo bem então ó para cá é todo mundo tem diabete para cá todo mundo não tem diabete repara agora repare por um por um instante essa parte aqui ó ó essa parte do gráfico essa parte do gráfico ó se se eu fiz minha nota de corte aqui né Essa parte do gráfico aqui não é eh Pessoas pessoas e demais né aqui ó tá tá
pro lado de cima tá pessoas com diabete ó pessoas dem mais que eu digo que é d menos você percebeu que essa parte do gráfico aqui em cima é um erro eu errei tá percebeu que essa parte de cima aqui é um é um erro tá então a a porque a a nota de corte coloca todo mundo que tá pra direita tem diabete todo mundo que tá pra esquerda não tem né aqui ó é um é um aqui é um falso positivo na Verdade né aqui é falso positivo eu digo que o cara é é
aqui é um falso positivo eu digo que o cara não tem diabetes mas na verdade ele tem essa parte de cima tá E olha esse essa parte aqui ó essa parte aqui do gráfico essa área do gráfico ó essa área do gráfico é todo mundo que eu digo que tem diabete mas na verdade não tem né então aqui ó eu digo que é demais né que é tem tem diabete mas não tem né É D menos ISO aqui é um falso Negativo tá perceberam que isso aqui são os erros né perceberam que são os erros
e o resto do gráfico é o acerto né falso falso positivo é verdade é verdade ô boa boa Simone obrigado na verdade eu digo que ele é negativo mas na verdade não é falso negativo obrigado obrigado que é falso negativo e o outro é falso positivo eu digo que é positivo mas na verdade negativo Obrigado isso aqui é o Falso positivo desculpa tá obrigado Mas o importante é você ver que essas áreas brancas são os erros do modelo tá é o erro e essas e essa parte aqui ó e essa parte aqui são os acertos
o restante aqui é essa parte né seria vou chamar de parte a né Essa parte a aqui né e e a parte B são os AC aqui ó essa parte a e essa parte B são os acertos né é o quanto modelar certa ó Tá vendo a tabela 2 por2 Você viu que formou uma tabela 2 por2 aqui né só que essa tabela 2 por2 é uma junção de várias tabelinhas várias tabelinhas 2 por2 eu juntei nessa né esse esse Essa é uma das mostes da curva rock a curva Rock quando você vê no no
programa não é assim mas é assim que ela funciona tá essa comparação dessas áreas essa área branca com essa áre amarela tá com essa soma dessas duas áreas amarelas Aqui tudo bem gente pegaram isso aqui conseguiram entender tá E aí agora finalmente a gente chega no gráfico da curva rock mesmo né o gráfico da curva ro parte a partir disso aí o gráfico mesmo quando você vai olhar no programa né gráfico da curva rock ele é assim ó ele é um quadrado né no no nesse eixo aqui no eixo X eu tenho a sensibilidade sensibilidade
né começa no Zero até um então sensibilidade éem porcentagem né vai de zero a 1 em proporção né em proporção tá eh aqui embaixo eu deveria ter especificidade né então Ó aqui embaixo deveria ser a especificidade que também vai de zero a um né então vai até um aqui tá não pisque agora é a último ATP de vocês que eu preciso tá para para Encerrar ó o que o que que é um teste bom um bom teste é um teste que tem eh é sensibilidade alta né próximo de um né e a especificidade alta também
próximo de um certo só que ó olha esse ponto um o ponto ideal né do teste da sensibilidade da especificidade deveria est aqui assim né que é o 1 né fica fica ruim fica ruim de fazer o gráfico assim tá fica ruim de essas Áreas Quando os dois os pontos estão fora do zer zer tá aí o o a curva rock faz um artifício que é o seguinte Toda vez que você for ler a curva rock a o eixo Y é a sensibilidade Beleza o o eixo X Vai ser 1 menos a especificidade Por que
que é 1 Men a especificidade porque aí dá o contrário da especificidade então É como se eu pegasse esse eixo aqui e invertesse ele e aí os dois pontos começam no zer zer Tá então quando eu tenho por exemplo 10% de um menos especificidade na verdade eu tenho 90% de especificidade né E aí o o E aí quando chega no um né no um aqui então quando eu tenho um menos especificidade esse um ele significa o mínimo de especificidade e o máximo de sensibilidade tá então ele faz sempre essa inversão para você inverter esse eixo
porque o ideal é que os dois sejam Altos né só que aí afasta do zer zer então um deles eu inverto eu coloco um menos cidade tá bom tudo bem gente vocês estão comigo essa parte complicada para quem nunca viu curva rock porque tem essa inversão aqui tá então quando dá zero zero né o zero aqui quer dizer que a especificidade É máxima e a sensibilidade é zero quando dá um aqui né quando dá um aqui quer dizer que a especificidade é é zero e a sensibilidade É máxima tá E e aí a curva que
ela tem essa cara em geral ó ela tem essa cara ela tem não não não tão assim deixa eu fazer mais isso eu tenho uma cara de uma curva tá E essa essa curva é essa curva aqui ó essa curva que aparece aqui seria essa curva aqui deixa eu ver se eu consigo pegar esse aqui essa curva sigmoide aqui ó que sai daqui deixa eu ver se eu consigo é que passa pelo aqui é a nota de corte né Tá então é como se tivesse uma sigmoid que passasse Assim e assim ó tá essa curva
aqui isso seria a curva rock ela é representada por essa curva aqui ó tá ela fica representada nessa curva então se eu pegar um ponto dela um ponto Qualquer né Essa curva aqui seria a curva a curva da glicemia curva dos valores de glicemia tá curva dos valores de glicemia então se eu pegar um ponto Qualquer Sei lá o ponto 100 né glicemia 100 aí eu consigo olhar para cá ó e ver o quanto de sensibilidade e especificidade eu tenho né então aqui eu vou ter sei lá 80% de sensibilidade tô chutando tá 80% de
sensibilidade e aqui eu vou ter 30% de um menos especificidade né um menos então quanto que é a especificidade mesmo 30% tá então eu sei que se eu colocar aqui quem tiver acima de 100 é positivo é diabético quem for abaixo É não diabético né para baixo aqui o que que Eu vou ter eu vou ter 80% de chance de dizer que você tem diabete e vou ter 70% de chance de dizer que você não é então vamos interpretar essa parte ó então olhando assim né supondo supondo uma nota de corte 100 né aqui ó
100 esse ponto aqui supondo uma nota de corte 100 tenho 80% de Chance de de dizer que você tem diabete que seria sensibilidade e 70% de chance de dizer que você não tem diabete diabete que seria a especificidade tudo bem gente e aí esse é o ponto quem escolhe a nota de corte é você você decide a a o que que a curva rock vai te dar é uma tabela de todos os valores aqui dessa linha ó todos os Valores de glicemia dessa linha ele vai te dar né E aí você escolhe a nota de
corte onde você quiser a ideia que ten a maior sensibilidade e maior especificidade possível tá você vai ver a nota de corte ali e decide tá o o interessante no programa é você ou Coloca aquela tabela ou escolhe não não escolhe só uma nota de corte escolhe uma duas duas ou três pega uma para cima e uma para baixo e mostra sensibilidade especificidade acima ou abaixo só só Para ter uma ideia tá sobreviveram a explicação gente sobreviveram o o Helder acabou o ATP já né o Elder já tá já tá aqui já caiu pro grupo
de k aqui ó da diabete baixa né da glicemia baixa já caiu para cá tá fez sentido tá veja que a curva rock é um teste bem legal bem legal agrega vários conhecimentos básicos assim e de novo gente isso aqui não é estatística isso aqui é aritmética tá tem um p tem o algum algum intervalo de confiança não Tem né Isso aqui é é é é pura conta dá para fazer tudo na mão tudo na mão só dá trabalho mas dá para fazer na mão tá morri mas passo bem né Vocês estão sentindo isso morri
mas passo bem então beleza então ó vamos fazer aqui um outro exemplo né para para encerrar o o exemplo do jamovi o jamovi faz o spcs faz o pacote noj movi pacote para fazer curva rock ele é o Como é que chama ppda PP da tá essa é a DLC do jamovi que você tem que instalar tá o ppda né ppda aqui ó Ah aqui ó ppda tá vendo esse pacote isso então o o a a variável categórica só pode ter dois níveis tá ela pode ter mais que dois níveis Mas você vai fazer uma
curva rock do a do sempre dois a dois essa observação é importante então a aqui né a a curva rock é sempre feita dois a do curva rock feita dois a dois Grupos tá é sempre feito dois a dois então a a você sempre tem que ter uma variável categórica que é da onde você vai tirar as categorias que é o teste né do diabete não diabete e uma variável contínua sempre para achar a nota de se tiver mais que duas categorias essa variável Ele sempre vai fazer dois a dois então você vai ter notas
de corte dois a dois tá então aqui né nesse banco de dados a gente vai lá no ppda o que eu quero fazer é o seguinte ó eu vou pegar Primeiro uma variável simples horas de TV e se você faz Esporte ou não Tá então eu tenho ó horas de TV e se você faz esporte eu podia começar fazendo um teste t né só ver se tem diferença de média entre quem faz ou não nas horas de TV ó se eu fizer um teste t né Isso é muito comum tá e eu coloco aqui ó
horas de TV fazer Esporte horas de TV né dá significante tá vendo aí aqui ele tá falando tem problema de homogeneidade corrige pelo we continua né eu peço aqui O descritivo e o gráfico né então ó d bem diferente tá vendo essa é a sacada da curva rock para vocês tá se você faz uma a nova faz um teste t e você vê que deu muita diferença dos grupos às vezes vale a pena fazer uma nota de corte pode te ajudar então por exemplo tudo bem eu sei que quem quem faz Esporte vê 2.4 horas
de tv e quem não faz Esporte vê 3.3 né Tá bom então quem não não faz Esporte vê mais TV né Mas a partir de quantas horas de TV eu posso diagnosticar entre aspas se você faz Esporte ou não perceberam minha pergunta então eu sei que o grupos já são diferentes né Isso é uma condição né é importante agora a partir de quantas horas de TV eu posso já dizer que você tem Provavelmente você é sedentário né Isso é legal de saber né Se eu monitoro por exemplo quanto você assiste de TV né eu posso
ter uma indicação do quanto de atividade física você faz ou não né é oo tá aí vale a pena descobrir a nota de Corte então eu entro aqui ó ppda ó test rock né teste rock aí o que que ele vai me pedir ó a variável dependente né a variável dependente à horas de TV e a variável de classe a variável de classe são as categorias né fazer Esporte ou não então ó o que que ele coloca aqui ó ele tá colocando como classe positiva o não fazer Esporte tá então lembra o doente doente ou
não doente o critério do doente para ele o positivo para ele é não fazer esporte é ser s Tá ser sedentário é não fazer esporte é ser doente entre aspas pro teste tá isso aqui seria o dema tá bom é o positivo aí o que que ele te dá ó ele te dá uma tabela aqui são as horas de TV ó 3 4 5 né e e aqui é a curva ó esse esses pontos aqui são todos os valores de Horas de TV né tantos valores de Horas de TV ó um Menos a especificidade e
a sensibilidade né E aí ele fala assim ó se você escolher 3 horas como referência 3 horas minha nota de corte Né acima de 3 horas é o positivo então ó acima de 3 horas você não faz exercício e abaixo de 3 horas você faz exercício né eu tenho 57% de chance de dizer de acertar de dizer que você não faz Esporte né e 61% de chance de dizer que você faz que é o contrário tá e deixa eu copiar isso aqui vamos interpretar isso aqui vamos escrever B uma vez para encerrar a aula né
aí a gente pega o tempinho que falta deixa eu copiar isso aqui vamos Interpretar aqui esse exemplo só para vocês darem o bizu aqui colo aqui e aqui então vamos lá ó deixa eu abrir outra janela vamos interpretar aqui o exemplo aqui assim né eu coloquei com um pouco aqui horas de TV tem poucos níveis mas pode ter mais né podia ter mais então Ó a a minha classe positiva é o não tá Esse seria o dema seria o doente o do o o demais né seria não fazer Esporte não fazer Esporte tá beleza aí
Se eu escolher Se eu escolher nota de corte nota 3 horas o que que isso quer dizer eu tenho 57 57% de chance de acertar em Dizer que você faz que você não faz Esporte não faz Esporte seria o positivo né o a classe positiva e eu tenho aqui né 57 aqui 61 ó eu tenho 61% de chance de acertar em dizer que você faz Esporte que é o contrário né que seria o d menos eh você perdiu três Cut points ou ele dá essa quantidade por default não depende do nível do número de níveis
da hora né Da da variável contínua Tá eu vou fazer depois com uma outra variável ele vai dar mais níveis tá por acaso ele deu três aqui tá então ó se eu se eu subir para 4 horas ó já já eu acerto só 38% de chance em dizer que você não faz Esporte e eu acerto 80% em dizer que você faz né Eh Ou seja não é um modelo lá muito bom tá não é um modelo lá muito bom Tá mas o que tá mais equilibrado né é o TR é o 3 horas tá então
assim uma boa nota de corte entre Aspas uma boa nota de corte é uma em que sensibilidade e especificidade estão equilibradas equilibradas e altas tá os dois valores altos e não tem não tem critério na literatura tá não tem critério na literatura para dizer se quanto a partir de quanto é bom depende depende dos outros testes que você tem Né se você tem um teste que a sensibilidade o padrão ouro a sensibilidade é 70% e o seu teste conseguiu 80 tá ótimo né e é já melhorou tá então tudo bem aí falta uma última coisa
que esse AOC AOC é a área sobre a curva área sob a curva né Isso é uma indicação da acurácia geral do modelo acurácia geral né então esse modelo ele acertou em geral 62% dos Casos tá o a o c é a taxa de acerto Geral do modelo tá então isso ó V eh ppv valor preditivo positivo valor preditivo negativo tá vendo então ele dá sensibilidade especificidade da coluna e o valor preditivo positivo e negativo da linha ele dá os dois valores tá se você é da área biomédica você vai olhar mais esses né se
você é da área de aprendizagem de máquina de previsão e tal você vai usar olhar esses dois tá e o AOC vale para todo mundo né o AOC é Vale para todo mundo então Eh eh é esperado um auc sempre maior 50% pelo menos então a pergunta da Mariana é boa esse valor de especificidade ele já tá corrigido ele não é um menos especificidade ele já tá certinho tá no jov no spcs ele faz invertido tá no spss ele coloca um menos especificidade então só tem que ter esse cuidado mas no ele já faz bonitinho
tá ele já Dea invertido certinho o a a gente vê aqui Ó quando você olha no gráfico essa área debaixo do gráfico aqui é o a c tá então a aqui né só para só para fechar deixar bonitinho então quando eu pego a curva aqui [Música] aqui aqui né Então essa área Aqui para baixo da curva né Toda essa área aqui ela é o AOC a área embaixo da curva tá é esperado que essa área seja maior que 50% Tá então ó se eu pegar uma diagonal aqui ó se eu pegar uma diagonal para cá
aqui aqui eu tenho 50% de acerto né para cima ou para baixo aí é o mesmo que jogar uma moeda né aí não é bom tá o meu o meu o me minha curva rock tem que tá acima disso por isso que ela faz uma barriga para cima tá o AOC tem que ser maior que 50% isso é uma medida da acurácia do modelo tá meu modelo tem que ser maior que 50% E aí e eh outras curiosidades aqui Do do daqui né é que eu posso por exemplo se eu quiser trocar a referência ó
a referência tá o não né se eu quiser trocar pro Yes É só colocar aqui classe positiva você escreve Yes que é o outro grupo ele troca aqui para Yes tá vendo aí ele muda ó aí ele muda tá aí quando você coloca Yes né fazer Esporte ele gerou mais notas de corte Tá então não não é proporcional lembra que sensibilidade especificidade não dá 100% então eu fazer uma nota de corte Para você fazer exercício físico pode ser diferente de fazer uma nota de corte para você não fazer exercício físico não é complementar porque sensibilidade
especificidade não é complementar tá Dá muito diferente então ó se eu quiser fazer uma nota de corte para você ser sedentário né para você ó nota de corte de Horas de TV para você ser sedentário é umas 3 horas e não é certa muito tá vendo ó 57 61 não acerta muito tá mas agora se eu quiser fazer uma nota de Corte para você fazer Esporte né o AOC diminui né então esse modelo não é tão bom para eh para dizer que você faz exercício em relação a não fazer mas se eu for olhar aqui
ó onde que equilibra mais ó nem equilibra direito tá vendo ó aqui 196 já cai para um tá vendo tá muito ruim tá então aqui mostra que esse modelo tá bem ruim tá bom então para para eu dizer que você faz Esporte horas de TV é um péssimo uma péssima métrica mas para eu dizer que Você é sedentário já é melhor já é melhor tá perceberam Gente esse jogo tá então se você mudar a categoria aqui de referência pode muda completamente as notas de corte porque uma coisa é eu fazer um teste para você ser
doente outra coisa é fazer um teste bom para dizer que você não é doente Tá então uma última observação aqui eh é diferente então um teste para Detectar que você tem a doença é bem diferente diferente de um teste para dizer que você não tem uma doença não tem uma doença tá é diferente eh então assim o o um exemplo né você comparar teste para Tuberculose o teste para Tuberculose ele é muito sensível qualquer espiradinho pro lado ele dá positivo então ele tem muito falso positivo compara com o teste De HIV o objetivo do teste
de HIV não é dizer que você tem HIV dizer que você não tem é o contrário é descartar então ele é um teste muito específico tá então nota de corte métrica são todas bem diferentes tá bom são naturezas diferentes tá quando essa curva tem umas pontas São outliers Não sei não sei tem que ver n né pode ser simplesmente que o modelo ficou ruim assim esse modelo aqui tá meio ruim tá mas pode ser E aí um só um último exemplo para ilustrar isso o Spcs não faz tá o jamovi faz que é o seguinte
por exemplo aqui eu tenho uma curva só né aí imagina que eu eu quero fazer essa curva rock para homens e mulheres por exemplo né Aí tem essa variável grupo ó eu posso colocar aqui sexo né homens e mulheres aí ele vai fazer ó ó um uma nota de corte pro homem e uma nota de corte pra mulher ele separa né Aí ele faz duas curvas ó ó a curva rock pro homem e a curva rock paraa mulher né aqui eh Dá para ver que Elas são equivalentes né não faz diferença mas às vezes pode
fazer diferença para vocês né então você vê que a acurácia do modelo pros homens e pras mulheres É bem a mesma tá é bem parecida tá então o modelo é igualmente bom mas se eu trocar aqui por exemplo para o que eu acho da vida que tem três grupos aqui eu acho que ele vai dar erro é ele vai dar erro porque o n não dá conta o n é pequeno aqui aí o n não dá conta mas dá para fazer para mais grupos Tá dá para fazer para mais grupos Mas aqui é um exemplo
tá legal a curva rock Não É Gente vocês gostaram eu gostei né É legal curva rock tá E aí foi foi ótimo pra gente rever vários indicadores de acerto e erro e tal e aí aqui na regressão logística binomial né tem esses índices de qualidade né então eu coloco se você faz Esporte ou não o modelo que a gente fez há duas aulas atrás né aqui e colocar o sexo aqui por Exemplo só fazer um exemplo rapidinho aqui da fazer Esporte ó eu tenho modelo de regressão logística binária que eu fiz aqui aí ten aba
prediction tá vendo aba prediction me dá sensibilidade especificidade acurácia a tabela de classificação né então ó isso aqui ela 2 por2 né é o quanto ele acerta o quanto ele erra né em relação ao dado observado versus o previsto Ou seja a realidade versus o teste né Então dessa tabela eu tiro sensibilidade especificidade valor Preditivo positivo e negativo né Então tá aqui ó acurácia sensibilidade especificidade e eu posso fazer a curva rock ó ele me dá uma curva rock tá vendo agora você entende o que que essa curva e a área sobre a curva é
o que tá embaixo tá vendo esse modelo tem 66% de acurácia legal né gente tá então agora a gente entende toda a parte de predição da regressão logística né E também você vai ouvir se você for para essa área de Modelagem Inteligência Artificial né a gente você vai também para essa área tá eh então você vai você vai ficar muito familiarizado com a regressão logística e e a curva rock junto dos modelos de classificação tá regressão eh curva rock é muito útil para avaliar qualidade de modelos de classificação como a regressão logística né E aí
finalmente encerramos eh com muito júbilo eh nosso curso né nossa parte de de regressão né Eh a aula que vem é a nossa última aula Formalmente do curso e é uma aula em que veremos um tópico Extra que eu vou deixar só como um vislumbre no curso dois atacaremos muito mais que é inferência Beana né se você sempre teve curiosidade de saber o que que é inferência Beana para que que serve como come como se alimenta onde vive é a aula que vem tá não vou fechar todas as questões a inferência bisana Claro mas a
gente vai ter um vislumbre é eu acho que é uma um ótimo fechamento para o curso Um tá então assim já temos todo o conteúdo do curso parabéns por ter chegado até aqui ru ficou feliz né Você está muito perto de dar um ruk agora né um huk não muito grande falta o curso dois né mas o huk bom assim né Eh e a aula que vem começaremos teremos essa aula extra sobre inferência basana tá bom o Igor e para quem para quem tem interesse em fazer o curso dois inscreve aqui no canal E observa
a aba comunidade né que quando abrir Inscrição pro curso dois eu posto uma mensagem lá tá E aí você eh vai ficar sabendo no dia que sair as inscrições Tá bom então isso vale para todo mundo que tiver assistindo depois e tal se você tiver interesse em fazer o curso dois presencialmente com a galera sofrer junto com a galera né No Caminho do conhecimento como ru né Eh se inscreva e acompanhe a aba comunidade né que meados de julho né Eu já vou postar lá o o a data da inscrição que eu ainda não sei
Mas é logo mais e aí você se inscreve tudo bem entra aí no discord manda bala e tamos junto tá eh Então parabéns por vocês que chegaram até aqui e vocês fazem parte de um grupo muito seleto eh e conto com vocês na nossa última aula do curso eh sobre inferência basana tá bom gente muito obrigado e até mais hum