fala pessoal essa aula vai ser excelente para quem está querendo aprender a china que está começando e que entender o processo geral então a gente vai ver um mapa que está e como a gente resolve um problema de má china e desde o princípio cada uma das etapas que tem que ser seguida tá certo essa aula faz parte de um mini curso introdutório a uma china então recomendo que já tenha sido atrasada sasha em cima relacionado limite dessa pra eles que tinha várias aulas então recomendo que seja cada uma delas até chegar nessa aula aqui
tá certo eu desenho mapa ali no powerpoint taklin jahvai ver onde eu resume cada uma das etapas principais assim né de resolução de um problema de mach lane a gente poder ter uma ideia boa uma visão macro do kit vai estudar acerto então vamos ver aprender então o índice significa cada uma das etapas com a primeira etapa então é o conhecimento dos dados é o entendimento de qual o problema está cantando resolver recebeu um conjunto de dados mas o que estes dados significam uma tabela cheia de números mas é o que significa esse número significa
cada uma dessas variáveis qual quem está tentando prevendo o problema é uma previsão de um preço de alguma coisa uma previsão de uma medição de repente alguma coisa o que quer o problema então a primeira análise e conhecimento do conjunto de dados é essencial para poder avançar adianta ficar apressado e quer aplicar o modelo de machine há uma tabela cheia de valores nem saber que aquilo significa na prática então antes de mais nada é importante entender qual é o problema está tentando resolver certo logo em seguida então vem a etapa de pré processamento e seleção
das variáveis saibam que seria essa etapa já abrange várias micro etapas né ainda não são miguel por cada uma delas é bem trabalhosa então uma das etapas é adequar de forma tal estado está imaginando recebeu uma tabela que analisar essa tabela agora fazer uma proibição não mudar o modelo de machine com esse teu problema só que essa tabela com dados não foram marcados ou seja os dados estão em formato de texto é passar o formato numérico é buscar referências especiais é preciso remover também processamento mesmo né da adequação dos dados ou então de repente precisa
normalizar os dados nesta usar o modelo de machina específicos das princesas está normalizado então vai aproveitar a normalizar essa etapa precisa também tratar os faltantes mas ele tem alguns dados nem que estão faltando algumas amostras têm pontos de algumas variáveis algumas colunas do acúmulo de dados tem pontos que estão faltando não foram preenchidos e aí o que faz com isso vai eliminar aquela mostra inteira vai substituir aquele ponto importante por outra coisa é uma coisa tem que ser feito também nesta etapa e também o tratamento do salt laia que são aqueles pontos fora da curva
os valores mas ele tem uma coluna em alguma variável em alguns alunos estão muito distantes uns dos outros e aí vale a pena remover esses valores ou deixar esses valores nessa decisão também faz parte uma outra etapa que faz parte do tratamento da seleção das variáveis né isso escolher quais variáveis são as mais relevantes que o problema dele a ponto não quer usar todas as colunas do templo de dados ou acha que algumas não são tão relevantes mas é um teste é rodar alguns modelos de pra decidir quais variáveis são melhores do que outros isso
aqui ainda é o pé do orçamento a gente não tá ficando a chinena só selecionando as variáveis que possam ser mais relevante excluir variáveis que são paulina e áreas por exemplo é uma escolha mesmo do modelo quais variáveis que vão impactar o modelo depois e também da reduzida de mensalidade tem umas técnicas de redução de ansiedade que são basicamente tem um pouco a ver com essa etapa essa outra opção é a etapa anterior que só devemos excluir variáveis nesse caso não são relevantes a redução de demissões na unidade ela agrupa várias variáveis em uma só
vez ou em mais uma variável é um agrupamento de variáveis em outra ação a outra técnica também faz parte do processamento feito tudo isso aqui nessa terra de pré-processamento a e sem que vem a parte do machine propriamente dito só então tudo isso que eu falei até aqui no na mesma a china ainda foi aplicado aqui necessariamente só está trabalhando os dados preparando ele pra então eles querem redondinhas e prontos para aplicação do modelo de machine aqui que vem toda a mágica do machico ano é entre escolher o modelo de machine para aplicar os dados
agora os soldados estão prontos para receber o nosso modelo a gente já tratou e trabalhou eles o que precisava para então nosso modelo é claro que se por algum motivo o nosso modelo a coleta de dados já veio prontinho já em todo trabalhado melhor ainda a gente pode pular direto para cá mas geralmente não é um problema real é que vai receber alguns dos dados que precisa trabalhar esse tratado então tem toda essa etapa de processamento da seleção as variáveis que precisa ser feito antes de poder comandar o nosso modelo daí a boa notícia que
nem que essa etapa aqui é uma parte que em termos de programação é muito simples está é a sexta etapa que antes que a parte que exige mais conhecimento de programação então por que a gente vai trabalhar os dados sobre a formatação deles então tudo que o efeito é composto de dados em termos de programação a maior parte está aqui a partir da aplicação do modelo de mochilão e geralmente é a parte mais fácil mais rápido é só puxar um código né e executar ele o original já está praticamente pronta tem muita coisa que fazer
aqui o pessoal que está iniciando nesse assunto realmente ficar com medo aqui achando que podemos sair um especialista em programação para conseguir rodar um modelo de luxo land imagina que subscrever todo o cosmos um modelo mas não os códigos estão prontos a aplicar eles né essa parte é mais trabalhosa para tratar os dados então por isso que a gente coloque no canal já é o curso de partida para a china por sua linguagem r machine que além disso vai adquirir os conhecimentos já poderá trabalhar e tratar os dados porque depois a partir de aplicar o
modelo de rotina vai ser bem simples sistema de programação essa precisão do conhecimento mesmos modelos para escolher qual o modelo é o melhor na situação e assim por diante então aqui que ocorre a mágica do machine e depois o processamento e seleção de variáveis aí sim depois disso a gente vai medir os resultados certamente vai medir os resultados não só pelos resultados mas também escolher qual é a forma de medição vai separar os dados em um conjunto de treino de teste vai fazer validação cruzada vai fazer real mostragem então aqui também além de emidio os
resultados também a forma de medição a escolha de qual edição vai ser feito também é então feita a medição ou seja já rodou modelos machine agora vê o resultado foi a performance desse modelo para esse ponto de dados aí agora a gente pode aperfeiçoar as coisas né então a gente vai voltar aqui pra etapa do modelo de uma china porque de repente pode testar um outro modelo de machine ou ficar um outro modelo a gente consegue um resultado melhor né ou ainda vamos usar o mesmo modelo mas mudar os parâmetros do modelo né cada modelo
de máquina e tem parâmetros diferentes que podem ser alterados então você está usando redes neurais por exemplo a gente pode escolher quantas camadas generosas de ver quantos neurônios em cada camada é o valor da taxa de aprendizado é qual é a quantidade de amostras de cada menina lote que vai entrar lá pro aplicação do gradiente estocástico enfim tem conhecimento nem para saber quais parando sempre vai variar de tentar de novo aplicar um modelo aos resultados que me diga se de um resultado melhor pois nova combinação de parâmetros já estou um pouquinho pra cima um outro
para diminuir um pouco vamos ver como ficou o resultado ficou melhor ficou pior vamos tentar melhor fazer mais um teste diferente agora está melhorando o nosso modelo é assim por diante ou ainda né além de escolher um outro modelo xinane ou alterar parâmetros de um dedo do mesmo modelo de uma china a gente pode retroceder mais uma etapa ainda nessa fase de aperfeiçoamento e voltar para a parte de processamento e seleção de variáveis que daqui a pouco a gente pode tomar a decisão pouco diferente olha em vez de excluir os dados faltantes eu vou substituir
eles por outro pela média pela mediana fazer um tratamento diferente com os dados faltantes e ver como é que fica depois do resultado ou ainda vou tratar diferentes outline repente eu já tinha excluído outline agora não vou excluir ou vice-versa né enfiaram quais variáveis que eu excluiria onde deixei de excluir fazer agora uma combinação diferente não vou excluir as variáveis que eu achei que eu deveria ter escolhido o vice versa a gente pode voltar para a etapa aqui de preparar o modelo para depois aplicar ele vê se claramente teve um resultado melhor também então essa
etapa de de aperfeiçoamento e para tanto trabalhar aqui nos modelos de machine como também ainda na parte da seleção de variáveis e pré processamento ea gente está fazendo isso terá um tema como geralmente dias força em relação a nós ao valor que conseguiu obter um valor que você obter vai ter bastante esforço em tentar melhorar que os modelos multi lane voltar a processar os dados aqui selecionar as variáveis e vai chegar um momento em que a ponte não vai estar agregando tanto valor no início quanto mais força e vai colocando o nosso valoroso o desempenho
do modelo vai melhorando em relação às os dados vai descobrindo qual o melhor modelo quais são os melhores parâmetros né vai chegar um ponto a gente estava se esforçando muito e daqui a pouco ele não estava jogando tanto valor está chegando um limitante já aí essa é a partir do ponto onde pode parar na hora cabe aqui eu acho que por aqui está bom já tomei a decisão de que esse é o modelo então final que eu vou utilizar para esconder os dados dessa época mas eu consigo obter e era isso então a gente vai
em algum momento então essa decisão de parar de pacificar o infinitamente aqui né testando novos modelos novas combinações de parâmetros imaginando voltando e se novas combinações aqui com os dados aplicando o novo modelo ela chega a um ponto que talvez nossa performance não vai melhorando tanto mais que está fazendo só para formaria quiné fazer crer juizinho filho mas não tanto resultado da história pra quem tá bom eu já posso parar está pronto o meu trabalho aqui um profissional de uma china então o processo basicamente é esse uma dica que eu dou é ter esse mapa
sempre presente com você de alguma forma bata um print nessa nesse mapa acabei de mostrar e deixem salvo sair não resumiu de vocês né pessoal de estúdio the machine lane porque todos os assuntos que a gente vai ver da partir de agora é cada um dos tópicos importantes se situar em qual ponto a gente está então a gente quando estiver falando por exemplo de dar dois mísseis de dados faltantes olha aqui nós como cidadão agora trocando substituindo os dados faltantes por outra coisa quando está com a gente está em dia tá falando de mach lane
onde está falando de pré-processamento né então é importante é e saberá lícito ao jet estamos né pra não ficar confuso ela pisa estudam tanto isso aqui porque estamos falando disso o isso tem a ver com aquele algoritmo the machine quando as coisas não estão necessariamente associado está numa etapa específica né e depois vai pra outra etapa do machine propriamente dito então por isso é importante situar sabem qual ponto nós estamos estudando né cada aula que vai se dar sobre o assunto específico em cada um desses de pontos que eu comentei né esse mapa geral alguns
pontos têm várias coisas que se aprender vários conceitos e várias coisas têm que praticar colocar fazer exercícios então é importante saber situar né não se complicasse na visão macro tá porque essa visão mais ampla que vai se manter praticamente sempre em cima e fazer cada um nesse processo em etapas às vezes já poder pular um e direta para o outro dependendo da situação dependendo do problema mas em geral a gente vai seguir esse processo na maior parte das vezes é tão importante mobilizar isso ter sempre em vista se não é o que está fazendo a
final para onde estamos indo é o que estamos fazendo de onde começamos e para onde vamos tá então esse foi o objetivo dessa aula passar essa visão geral para que nas próximas aulas agora e foi abordar os temas mais específicos the machine vocês possam se situar melhor então só lembrando leva quem quiser estudar mais profundamente uma xinane a gente vai abordar com muitos detalhes cada um desses pontos desse mapa que eu mostrei nosso curso de machina é quem já tá assistindo essa aula aqui dentro do nosso curso vai ver logo na seqüência que todos cada
um desses pontos é esmiuçado com calma e ainda só escrito no nosso canal youtube quer conhecer mais os nossos cursos completos na china é só ver aqui na descrição do vídeo associado gente então por essa aula ficando por aqui ea gente se vê em breve em próximos vídeos até mais [Música]