[Música] sejam bem-vindos à nossa primeira aula sobre a importância da utilização e da análise de dados nessa aula eu quero falar para vocês passar alguns exemplos históricos da importância da análise de dados paraa nossa sociedade utilizar alguns exemplos recentes de saúde pública como o caso da covid né da pandemia de covid-19 e também falar de exemplos da do de de dados que a própria cátedra vem analisando e aplicando nos municípios que são parceiros dos nossos estudos então para começar o nosso estudo Eu quero que vocês vamos tentar entender de maneira conjunta aqui como o cera
se espalha tá E para isso eu vou precisar falar do Jon Snow mas não é o Jon Snow que a gente tá acostumado a ver do Game of Thrones e sim um Jon Snow um médico né que viveu no século XIX que realmente existiu e foi muito importante para descoberta de como o Cólera contamina as pessoas então no século XIX Era bastante frequente ter essas epidemias de Cólera e era também uma época onde o camento básico era ainda pouco desenvolvido pouco realizado então era comum encontrar casas ou ruas né com excrementos na rua né em
situações precárias de saneamento e em 1850 houve um surto de Cólera bastante eh Evidente bastante forte onde onde mais de 50 pessoas faleceram num período bastante curto de até 10 dias e nessa época acreditava-se que o colar era transmitido por meio de partículas aéreas a teoria do miasma certo mas o nosso médico aqui que eu tô falando jo Snow ele acreditava que não que o Cola era transmitido através da ingestão de água contaminada tá E ele fez então uma análise de dados tá que eu tô mostrando nesse mapa para vocês onde ele descreveu né que
o número de casos do do cólera ela de mortes pelo Cólera era muito maior ao redor de uma fonte de água que se encontrava na rua e as pessoas utilizavam essa fonte de água para beber a água para usar paraa limpeza certo do que próximo de outras fontes a gente pode ver nesse mapa que bem no centro dela que tá na fonte de broad Street a gente consegue verificar que tem um grande número de casos concentrados ali de morte por Cólera enquanto outras fontes mais espalhadas pela cidade a gente vê que não tem tantos casos
então ele começou a relacionar o qu o número de casos de morte de Cólera com essa fonte de água que poderia estar contaminado em amarelo a gente tá mostrando duas exceções a essa esse padrão que o joh snow observou tá uma delas era uma fábrica com mais de 200 ou 300 trabalhadores onde só teve poucos casos de cola e uma outra num retângulo um pouco menor ali é uma cervejaria onde também não foi regist AD nenhum caso apesar de está muito próximo dessa fonte de água mas o que ele verificou próprio Jes foi tentar entender
o que tava acontecendo nesse caso e ele viu que a fábrica tinha uma fonte própria de água possivelmente um poço artesiano ali deles e a Cervejaria obviamente consumia muita água da cerveja e muita água fervida onde então era eliminado o Cólera tá E foi com base nessas observações que o Jones levantou através dessas análises de dados que foi tomado das principais medidas na época de fechar essa essa torneira essa fonte na rua e a gente viu que os casos né Foi visto na realidade que os casos começaram a se reduzirem ao longo do tempo tá
então isso é um exemplo de como a análise de dados pode ajudar uma tomada de decisão pública e qual a importância dessa análise de dados então algo bastante relevante aqui pra gente a gente entender que dos dados os dados por si só não comunicam tanto né el por si só só existem a gente precisa fazer uma análise desses dados para tentar extrair padrões extrair insights e através dessas análises a gente consegue então obter informação que pode então ser um guia para uma política pública ou para ações de melhoria da educação que é o nosso foco
aqui um outro exemplo bastante interessante né da utilização de dados para políticas públicas foi a pandemia de covid-19 que nós passamos recentemente era muito comum a gente vê nos jornais né todos os dias a gente via o número de casos número de mortes e quando quando costumava né ter uma subida um aumento as normas de isolamento social ou eram recrudescida ou eram brandador com o número de casos o número de mortes que a gente via diariamente Então esse é um outro exemplo né que a gente utiliza informações paraa tomada de decisões públicas aí o caso
da pandemia Foi bastante icônico um outro caso que a gente pode citar né um caso recente né relativamente recente da vacinação de dengue que gerou bastante né comentários Ah por que que estão vacinando tem poucas vacinas né Por que que estão vacinando só os casos entre 10 e 14 anos Porque não vacin as crianças mais novas porque não vacina os adultos ou os idosos essa tabela obviamente não é a única fonte de dados que noru essa decisão Mas é uma das fontes de informação tá a gente consegue ver o número de casos tá o número
total de casos número de casos eh de dengue né abaixo dos 5 anos entre 5 e 9 anos e entre 10 e 14 anos e se a gente observar na última linha o número total de casas a gente observa que o número de casos entre 10 e 14 anos é quase o dobro dos casos de menor que 5 anos e ainda assim bastante maior do que o caso entre 5 e 9 anos então parte da decisão de vacinar essa faixa etária específica advem de dados como esse que eu tô mostrando para vocês agora falando né
de como que a gente pode utilizar a análise de dados na área de educação queria mostrar um estudo que que nós da cátedra realizamos e que tá sendo publicado na forma de um artigo científico onde a gente utilizou todos os municípios do Brasil certo eh foram 4360 municípios no Brasil inteiro que tinham os dados né ao longo dos anos e a gente viu quais eram os fatores os indicadores educacionais que mais estavam Associados ou que mais prediziam o resultado do Ideb né que é um indicador de desempenho e deux escolar que a gente vai falar
ao longo do curso bastante sobre isso sobre dbito mas aqui a gente queria ver Quais os indicadores que mais prediziam o resultado do Ideb e a gente tem esse gráfico aqui de de dispersão onde a gente mostra a gente tentou traduzir essa relação do modelo com o resultado Ideb através de uma equação linear e de uma reta certo mas que que é mais interessante é que a gente observou que alguns fatores estão mais Associados com a a O Bom desempenho no debe do que outros que a gente viu é que os fatores que mais estão
Associados é a média do nível socioeconômico ou seja quanto maior o nível socioeconômico das famílias desses alunos das escolas maior a nota de DBO por outro lado tem uma associação negativa com a taxa de distorção idade série que tá escrito como TDI e o abandono ou seja quanto maior a taxa de distorção idade série e o abandono escolar menor o desempenho de Dev eh então dessa forma a gente consegue encontrar fatores que podem estar associados ao desempenho escolar e entender o que que a gente pode atuar né como política pública para tentar melhorar esse entendimento
esse desempenho escolar bom aqui eu também trago um gráfico de uma análise que nós fazemos cotidianamente aqui na cátedra que é uma análise de componente principal a princípio parece uma análise bastante complexa e um gráfico bastante difícil de entender mas essa é uma coisa que a gente já trabalha bastante já trabalhar bastante nessa formação também que é com visualização de dados certo não adianta só a gente ter informação do dado mas a gente tem que comunicar isso pro secretário pro técnico para quem quer que seja pro gestor público certo então o que a gente faz
é traduzir a informação desse gráfico de dispersão que vocês estão vendo para esse mapa georreferenciado aqui onde eu vejo que as escolas que eu pintei em vermelho que escolhi a cor vermelha elas são as de pior desempenho aqui no caso do Município de São Paulo usando só como exemplo tá então a gente tem ali ah em vermelho as escolas com desempenho mais baixo em verde a escolas com os maiores desempenho e corroborando inclusive aquela informação que eu falei do nosso estudo né sobre a média do nível socioeconômico a gente consegue ver em roxo na cor
roxa quanto mais roxo maior o nível socioeconômico e quanto mais branquinho menor o nível socioeconômico a gente consegue observar que a maior parte das escolas vermelhas estão fora dessas manchas roxas mais evidentes e as escolas de melhor desempenho as escolas verdinhas geralmente estão dentro dessas manchas de maior nível socioeconômico então uma outra forma de mostrar né esse dado é utilizando mapas georreferenciados que a gente vai falar bastante no na nossa formação também por fim uma outra informação que a gente pode extrair são exemplos tá para motivar vocês de como a análise de dados pode trazer
informações relevantes pro dia a dia das secretarias pro dia a dia de quem faz análise de dados educacionais aqui a gente viu né as escolas que tiveram um melhor desempenho o melhor Progresso entre 2017 e 2019 ou seja escolas que mais melhoraram esse gráfico que eu tô mostrando para vocês esse gráfico de dispersão ele na realidade mostra que quanto mais a esquerda do gráfico pior o desempenho das escolas e cada pontinha uma escola aí tá E quanto mais à direita melhor esse desempenho em azul tá o ano de 2017 e em vermelho o ano de
2019 mas um gráfico muito complexo né Muito difícil muita coisa acontecendo ao mesmo tempo mas que eu quero ressaltar são essas setas vermelhas mostrando as escolas que tiveram melhor Progresso de 2017 para 2019 ou seja andaram mais da esquerda paraa direita do gráfico tá a gente pode pegar aqui por exemplo a escola que a gente né reduziu o nome para ficar mais simples aqui a escola Silvia que saiu do porcentagem de alunos com aprendizado adequado em língua portuguesa de 63% em 2017 para 80 44% em 2019 a porcentagem de aprendizado adequada em matemática era de
44% foi para 78% é um número crescimento muito grande e agora a gente pegando esses exemplos esses casos né que tiveram bastante sucesso dessa progressão é interessante pra gente entender o que que aconteceu nessas escolas foi alguma política pública Foi uma mudança administrativa foi alguma implementação de uma metodologia pedagógica isso é bastante interessante pra gente entender cada caso e ver os casos né de Bom desempenho e os casos onde teve na realidade uma pior desse desempenho então né na realidade eu trouxe esses exemplos para vocês para mostrar né como de diferentes formas a gente pode
trazer insights né pode trazer conclusões e informações interessantes sobre diferentes áreas do conhecimento e no nosso caso específico aqui é tentar entender a área da Educação para ressaltar ainda mais né Essa Ideia da importância de análise de dados existem alguns pesquisadores né que traduzem ah em diferentes paradigmas né ou como classificam diferentes paradigmas eh tecnológico científicos a a evolução né do conhecimento é tido que o primeiro paradigma foi a ciência empírica o que ela seja ciência experimental onde a gente dependia muito da experimentação para obter informações acerca da natureza um segundo paradigma que é é
baseada em modelos né uma ciência mais teórica onde é feito muitas inferências com base na parte matemática e na evolução dessas teorias um terceiro paradigma né que a gente tá segundo esses autores né a gente tá saindo dele entrando para um outro paradigma que é um paradigma computacional onde a gente não precisa fazer experimentação a gente pode simular essas experimentações no computador e agora um quarto paradigma que a gente tá vivendo que é justamente o que motiva também o fato dessa formação que é o paradigma do Big Data né da ciência direcionada por dados que
a gente chama de data driven né Ou seja é são os dados a gente tem uma grande compilação de dados tenta extrair padrões desses dados para trazer alguma inferência e alguma informação relevante e obviamente a gente tem uma fonte de dados muito grande hoje em dia né a gente fala só dos dados abertos de educação nós temos os dados do INEP dados né do IBGE de maneira geral dados de avaliações estaduais dados de avaliações internas municipais certo E além disso a gente tem todos os dados que pode ser discutido com o válido B propício é
utilizar esses dados mas nós temos muitos dados de saúde dados de de de mídias sociais dados de utilização do celular que constitui então uma grande variedade de dados e uma grande quantidade de dados que faz então que seja muito relevante a gente entender e participar da das análises de dados para finalizar eu queria mostrar para vocês o ciclo da política pública né tentando resumir esse ciclo e qual que é a importância né da análise de dados para esse CIC ciclo então era um ciclo de política pública ideal começaria com uma identificação do problema certo depois
a formulação dessa política para tentar sanar esse problema a implementação dessa política depois a avaliação e por fim a tomada de decisão Em relação a essa política pública e onde que entra então A análise de dados nesse ciclo e a análise de dados ela entra em todos os aspectos dessa política pública certo a gente tem né que os dados indicadores são importantes para pro diagnóstico PR gente identificar os problemas né como aquele exemplo que eu dei a gente pode identificar escolas que tiveram um progresso muito bom de um ano pro outro escolas que tiveram pioraram
muito de um ano pro outro esses dados indicadores são importantes para diagnosticar o que está acontecendo no cenário Educacional depois os dados vão ser relevantes para trazer informações da arquitetura de como essa política pública vai ser formulada implementada e e depois na parte de implementação monitorar essa política pública os resultados que ela tá trazendo para isso também nessa parte de avaliação os dados são utilizados né dados indicadores para avaliação da política pública e por fim né na na etapa de tomada de decisão a gente tem os dados e informações sobre continuidade expansão e término dessa
política pública bom nessa primeira aula então eu quis trazer Qual que é a importância né da da análise de dados paraa área de educação e paraa área de políticas públicas de maneira geral e eu quero né frisar para vocês que nessa formação nossa ideia é trabalhar com os dados tornar né vocês proficientes né ou bastante aptos a fazerem análise de dados educacionais e também a fazer competências de visualização e comunicação de dados então para resumir Nesta aula nós vimos alguns exemplos históricos né da utilização de dados e sua relevância paraa área da saúde também vimos
exemplos recentes né da área da saúde como a escolha da vacinação da dengue e a pandemia de covid-19 e por fim mostramos alguns exemplos da própria cátedra para análise de dados na área de educação e a importância disso para políticas públicas Então é isso Até a próxima aula