a estatística algoritmos essência de dados i [Música] Olá eu sou Paulo Silveira e no universo do data Science a gente sempre se assusta muito não é Micaele porque a gente ouve teve nos estatísticas sobre complicadas a gente veio matemática e gradientes integrais E aí chega nos algoritmos de redes neurais implementar e Deep Lane tudo aquilo que envolve é muito assustador Aí como eu posso começar e sem entender nada diz ou já precisava entender o que acontece debaixo de uma rede neural o que acontece debaixo desses algoritmos de regressão de análise ou dá para começar sem
ou talvez hoje em dia tudo evolui tanto vai ser que nem a programação no futuro e na verdade homem sabe de nada como que o balanceio isso na ciência de dados preciso estudar o que está por trás na matemática na cotação posso ser só um usuário do pandas do site Lane do Power bi do que for eu acho que é depende muito e o que é a sua vontade especializar por exemplo se você vai ficar mais focado focada na paz de visualização então talvez não fazem tanto assim de você quer presunto gerar relatórios e tem
um aspecto um pouco mais ou menos diferencial fica mais focado na visualização e no produto final a centro extremamente importante é importante e a gente precisa de cada vez mais profissionais nessa área aí talvez você não precise ser tanto foco em si nessa parte de matemática mas sim entender talvez Como você consegue visualizar esses dados trazer esses dados não forma que você otimize e você não carregue tanto aquela ferramenta que trabalhando ou Quais são os gráficos são melhores para passar essa informação que eu quero Será que o gráfico de pizza por exemplo faz sentido para
botar essa informação ou será que um gráfico de barras ele vai mostrar melhor isso para a pessoa que está observando aquela informação Quais são as pessoas que vão assistir é e como será que eu consigo ser mais assertivo na mensagem que eu quero passar e fazer o storytelling então aí eu não preciso tanto sabe focar nessa parte de matemática estatística agora se você for focar na parte de modelagem e principalmente na parte de você analisar esses dados aí eu acho que é importante você ter sim um pé lá muito forte entender Quais são as correlações
como que variáveis ela se relacionam entre si é o presente o correlação e causalidade será que por exemplo o fato de as pessoas tomarem muito sorvete está atrelado a morte de tubarões então se eu tomar um sorvete eu vou por exemplo automaticamente tubarão vai matar uma pessoa ou será que só porque na época do ano que é o verão a gente tem um índice maior de pessoas tomando sorvete que coincide com o índice de mortes de pessoas banhistas por tubarões Por que estão na praia por conta do verão né então e acaba caindo nesse tipo
de problemática Esse foi exemplo super básica bem mais como se trabalhando num cenário real nas de dados você pode cair nesse tipo acontece acontece porque você analisa não dá você fala caramba isso está crescendo mesma forma que isso cresce então uma coisa causa a outra e não Às vezes só estão relacionadas às variáveis não tem nada haver entre si tem vezes que até a correlação não existe mais pela forma que a gente pegou os dados etc parece muito complicado nesse caso é importante entender aquelas coisas estatística intervalo de confiança pe velho e outras coisas exatamente
lá e se afastou se falou do que velho intervalo de confiança é muito importante principalmente fosse fala fala de teste saber festa é muito importante porque você vai colocar um modelo em produção mas você precisa se certificar de que será que esse modelo que eu coloquei ele está perfumando melhor do que aquele modelo estatístico tinha antes trancou que ela vai regressão linear eu tô tendo uma melhor performance do que a versão que tinha anteriormente mas com alguns parâmetros ajustados então a gente precisa se certificar que tá tendo realmente uma melhoria naquilo consegue saber que a
gente tem por exemplo intervalo de confiança o quê velho que você comentou você precisa saber por exemplo a sua população Qual é a mostra que você vai usar Você precisa ter métricas para avaliar isso que tem várias mim é verde para se já etc você tem por exemplo edcg que vai medir ranking então assim são várias métricas que são partes estatística e você às vezes precisa fazer o uso dela Outro ponto também além dessa parte de amostra comentei tem as correlações correlação de piercings firma que são nomes que podem assustar de início mas vão ser
muito úteis para você você sabe aonde distribuição normal uma moda mediana média e desvio padrão então isso são coisas tem a pelo menos a moda mediana a média o desvio-padrão a gente tende a o ensino médio em algumas algumas escolas ensinam só que aí quando a gente a gente tem pensa né que a gente nunca vai encontrar isso no mercado de trabalho eu pensei isso aí olha oniscus mas aí a bacana interessante você pensar aqui você vai precisar disso você não vai pensar eu não quero que você pense que é necessário como o pessoa que
sou hoje sem ter entrado em ciência de dados que eu tenho que dominar estatística e entender com todas as correlações que existem entender como fazer um teste de hipótese dominar álgebra linear dominar contribuições à teoria das probabilidades otimização linear que são coisas que você vai precisar como cientista Mas você não precisa disso para entrar na área Eu acho que isso que é importante utilizar porque eu por exemplo tem coisas que como minha formação acho que isso é muito legal falar a minha formação ela de Tecnologia e Ciência da Computação então eu as pessoas que estão
das estatísticas são Matemáticas e matemáticas Então essas pessoas elas têm uma facilidade muito grande nessa parte que às vezes eu posso pegar um pouco por não ter tido um foco tão grande na minha graduação Mas você consegue conversar bem com você conversar eu consigo auxiliá-la em como colocar modelos em produção em como talvez criar códigos a partir dessas probabilidades que elas são geradas e elas conseguem auxiliar para gerar cada vez mais números que façam sentido e até mesmo olhar esses números que eu tô gerando essas fórmulas que a gente utiliza essas distribuições de uma maneira
mais crítica Então acho que isso é bacana a gente vai dosando esse tipo de perfil você já falou umas palavras que eu nem sei o que é mas entendi que eu só preciso conhecer isso se eu for chegar mesmo eu criar a hipótese se eu for só interpretar para no final auxiliar na tomada de decisão e preparar aí rodar É talvez eu só preciso conhecer um pouco a fazer tudo ela também se aprofundar tanto agora por exemplo se você for criar um modelo de edícula em por exemplo você vai acabar caindo nessa parte que você
falou no início dessa parte de gradientes porque a gente precisa entender como que a rede aprende e a rede acaba aprendendo com ela Gradiente descendente que aí você vai ver uma parte de calça ou muito forte e você vai precisar entender uma forma muito profunda álgebra linear e aí sim eu acho que é é imprescindível que você tenha domínio nesse assunto mas para poder interpretar essas modelo ele tá bacana ou não agora se você por exemplo quer ficar mais uma parte abstrata aí você quer ter um conhecimento mais Genérico porque você vai auxiliar mais ainda
não alguns pitacos na tomada de decisão mas não precisa prestar contas o resultado aí sim eu acredito que você precisa só ter um overview de tudo isso que eu tô comentando né mas não atuando tão forte é que eu e por conta de ter responsável por criar esses modelos e precisa entender hora por quê que alterando esse parâmetro aqui a gente tem uma mudança é porque você está mudando talvez o seu Gradiente essa função sigmóide está performando de uma forma diferenciada isso é importante você tem esse domínio quando você for trabalhar vestida de problema por
último os algoritmos porque tem o vidro lá do universo programado um canal que eu vi ele tem um vídeo famoso a gente lá na lua a gente participa do canal dele ele tem um vídeo famoso e o que ele faz aquele jogo antigo quando dava erro no navegador do Chrome tinha que no jogo do dinossauro que você ia pulando ele fez um mecanismo de Inteligência Artificial usando redes neurais para aprender o jogo aprender e aí criar um dinossaurinho que pulava e ela não jogou bem longe aí eu tava conversando com ele aí eu falei deixa
eu ver código-fonte aí tá vendo se eu falei que meu até que você usou eu falo eu usei meu até que falei com você não sou nenhuma biblioteca o vento não escreveu 12 em uma rede neural o quê Por favor Micaele concorda comigo que não é necessário para você trabalhar com inteligência artificial mesmo com rede neural mas é óbvio que eu victoram menino super inteligente e dedicado é óbvio que ele conhecendo tendo escrito uma rede neural de 10 pelo menos uma vez na vida ou duas trás para ele algum site alguns pensamentos que eu nunca
vou ter como usuário de uma rede neural Ele criou uma eu eu só queria um colocando os parâmetros lá e nem fala quantos leites e acabou nem sei muito bem o que tá lá por trás nesse nível é só mesmo para quem for vir a cientista de verdade é exatamente e isso é importante o a gente não precisa Ainda mais se tratando no mercado de trabalho quando a gente está trabalhando com pesquisa aí é super importante você ter até as pessoas elas criam no zero porque elas querem realmente testar uma hipótese muito mais atrelada a
uma pesquisa que estão fazendo então às vezes você utilizar uma biblioteca é mais surpresa sua necessidade de ir além você precisa ir mais por baixo nível e alterar realmente código-fonte daquela meu Teka para testar realmente se faz sentido a sua hipótese agora você tá no mercado de trabalho eu acho você pode fazer o uso de técnicas como você comentou e até mesmo das meu teclas vai ser importante que você entenda o que está acontecendo por trás e entenda seo alterar uma layer porque é muito simples né Você não tem o Senhor por Aí você coloca
ponto Édila você vai querer Nossa cultura é muito legal é muito simples aí cinco minutinhos você tem um programa muito complexo rodando Mas aí você coloca e sem produção e aquele algoritmo que você tinha colocado e Tava perfeito lá parou de funcionar Porque então você acaba percebendo mudanças e isso é importante Se você entende o que acontece por trás você vai falar hora entendi porque tá alterando porque os dados talvez que eu estou aqui Eles são diferentes Como por exemplo o input de entrada dos algoritmos agora que saiu um outro ambiente tá diferente desse daqui
Então essas são coisas e preocupações que você mesmo se não for usar uma biblioteca foi usar Berotec para fazer do zero você precisa ter como desenvolvedora desenvolvedor de algum algoritmo mas como a gente tava falando com as pessoas que desenvolvem esse tipo de sistema que vão tem essa preocupação né e precisam prestar contas disso agora uma pessoa que por exemplo ela não tá tão focada nessa parte agora uma pessoa que está mais focada na análise dos dados talvez ela não precisa ter esse tipo de domínio entendeu E o outro ponto né é quando a gente
fala também das suas profissões o cabelo e falam de profissão agora uma pessoa que ela tá focada em mexer nos modelos a gente fala que ela é mais focada no ciência de dados cientista ou a cientista de dados tem essa pessoa que ela é mais da análise dos dados né ou uma Oi Taiana leite que a gente fala e tem mais tinha lá em genir na pessoa engenheira de Matinho uern que aí isso que eu falei agora a gente perceber que tem mudanças no modelo em produção Inês envolvimento dependendo ambiente que eu estou rodando uma
pessoa que ela é machinho a engenheira responsável por colocar esse modelo que foi criado às vezes um rio para notebook que a gente falou né que é um caderno basicamente você escreve não é isso que o cliente final que a gente não vai ver vai ver talvez uma Pein e quando você manda um dado eu quero saber a previsão da gasolina por exemplo amanhã isso já retorno dado para você mas isso não é feito no jogo para notebook a gente vê hoje eu para notebook Abstrai O código dele e coloca isso numa um formato que
uma outra aplicação vai poder chamar né então pego produto produto exatamente tá você sai daí pode se você vai uma variação né você vai com produto que aí tem toda aquela parte como o teste E como que eu garanto que aquilo vai funcionar coloco no nocker coloco como é que eu escalo esse modelo né em cima xinga aí vem muito do e-mail Ops que as pessoas falam e aí Nesse quesito aí vem a pessoa que é engenheiro at Mach Lane que tem um pé lá no cálculo na estatística e também tem um pé na engenharia
de software né Então aí a gente acabou falando de vários papéis né mas achei importante tocar nesse ponto depende do papel se você vai ter que se aprofundar exatamente tocha que tem dois motivos para você não se assustar com estatística ou matemática e algoritmos prima que vai depender muito com que você vai trabalhar em datas a essência de dados segundo que falar que é simples Eu tô mentindo mas é menos difícil do que você imagina eu espero que você encare tem muito conteúdo aqui no canal da loira descreva aqui o que você tá aprendendo de
matemática estatística de algoritmo insensibilizados que tá te ajudando e que você se ofendeu tô esperando o seu clique no like e assinar o canal largura as ações porque a gente tem cada vez mais conteúdo em ciência de dados hidratação esse e nas profissões que giram esse universo [Música] E aí [Música]