oi oi meus amores tudo bom com vocês sejam bem-vindos a mais um vídeo do meu Nata e no vídeo de hoje eu quero ensiná-los a verificar qualidade do sequenciamento Tá bom então a gente vai usar 2 programinhas sendo um pago é o dias Prime e também um outro que é gratuito O que é o faz esquecer então a gente vai baixar o faz esquecer e vai dar uma olhadinha na qualidade do sequenciamento tá então a gente pode aqui pela internet no Google digitem parte que ser depois Caso vocês queiram realizar essa análise aí no computador
de vocês testar direitinho para saber se está rodando se Vocês entenderam realmente eu vou deixar aqui na descrição ou então ele em cada aqui em algum lugar o vídeo de como baixar dados Brutos o reconhecimento do Sra do Mc Biel tem um banco de dados aonde tem vários sequenciamentos lá para você usar de exemplo tem lá caso você não tenha uma sequência sua própria então você pode baixar esse banco é bem facinho de baixar para o vídeo vai tá lá explicando direitinho é para que vocês possam fazer esse trem então vamos aqui acho que ser
gente abre a primeira primeira a bosinha ele já mostra aqui a opção de download Então a gente vai download Now eu tô ele tem que duas opções uma opção olha aqui é para o Windows e Linux e opção de baixo para quem tem computadores Mac para a gente vai baixar o Windows um cuidado que aqui para cima tem outras coisas olha só que quando ele abriu alto quando eu cliquei em download não automaticamente ele desceu para cá então você tenta isso é fácil que ser aqui nessa parte Zinha aonde tem o download não ela para
cima e nem para baixo então como eu tô aqui no Windows eu vou baixar esse daqui ele é leve então ele baixa rapidamente download dele é bem rapidinho e pronto já baixamos o faz esquecer eu vou lá na pasta downloads eu vou colocar ele na área de trabalho para facilitar e fechar aqui aquele é uma pasta zipada Tá bom então a gente vai abrir tem uma outra pasta dentro e ele tá aqui embaixo olha hum underline faz esquecer Lembrando que você precisa ter o Java instalado no computador para que ele funcione corretamente caso você não
tenha ele não vai rodar eu também vou deixar o site do Java Oracle aí no link na descrição para que vocês possam baixar quando eu tentar rodar ele vai perguntar ó extrair tudo o executar Então você vai primeiros traz tudo e aí vai fazer ele vai extrair e vai criar uma nova partida de mesmo nome E aí e prontinho já criou ele já até abriu automaticamente você clica vai que para baixo Olha granfest que ser clica duas vezes ele abra essa tela preta você deixa ela aberto mesmo e ele abra essa outra jornal na frente
aí você pode ampliar aqui ele só tem dois botões que eu falho e um help Então você faz a eu ou bem e vai abrir o seu dado bruto que Ou você tem do seu sequenciamento ou você baixou como eu ensinei no vídeozinho do essa real tanto faz então você vai precisar do outro vou procurar o meu aqui e olha aqui você me mandar do broto vou abrir um deles né a gente tem que ou dado unidade 2 que são provenientes de um mesmo sequenciamento então Obrigado um tanto faz a ordem roupa eu abrir dependendo
do seu apartamento Se for muito grande Ele pode demorar um pouco aqui como eu tô abrindo uma sequência de coronavírus é bem rapidinho então a primeira parte dessas estatísticas básicas aonde ele mostrou algumas informações como um conteúdo GC tamanho da Leitura aproximadamente né ele consegue ele supõe mais ou menos com a plataforma que você sequenciou ele consegue fazer isso E aqui as informações de qualidade do lado esquerdo Lembrando que eu faço que ser ele apenas um visualizador Então você vai fazer o seu sequenciamento abrindo acho que ser ver como tá a qualidade e Dependendo você
vai ou não fazer limpeza Então faz que ser para te nortear sobre a necessidade de fazer trimagem limpeza remoção de adaptadores em bases ruins e etc mas o que bastante interessa para gente aqui ó super beijo e 5S quality e onde a gente pode observar esses box-plots em amarelo que são nada mais nada menos que a representação das suas raízes nem das suas leituras Então o que a gente espera aí que essas leituras estejam aqui nessa faixa Verde observa é uma faixa Verde ao fundo essa faixa Verde significa que as leitoras estão boas uma qualidade
bem acurada laranja mediando vermelho ruim tá então é esse tipo de mais uma imagem que a gente não costuma ver depois do sequenciamento porque a gente sabe que eu sequência dou esse eles têm problemas Então na verdade isso aqui ser uma Utopia praticamente esse tipo de malha a gente consegue verificar após a limpeza então como eu baixo esses dados do Sra provavelmente os pesquisadores que depositaram já tinham feito a limpeza dos dados por isso que tá tão bom tudo bem então normalmente não é isso que a gente vê daqui a pouco vou mostrar para vocês
como são os dados que nós normalmente recebemos do Sacramento da ele é especialmente falando então também tenho transformações que a gente pode verificar como conteúdo de adaptadores tá então a gente na hora do preparo da biblioteca do seu conhecimento a gente coloca adaptadores para que a nossa mostra possa se fixar a flor céu tudo bem e depois esses adaptadores que são oligonucleotídeos mas que não importam para as nossas análises ele deve ser removidos então geralmente quando você pega esse sequenciamento bruto está fazendo limpeza nem nada e olha que não faz esquecer essa parte aqui do
adaptador com certeza vai ter um gráfico cozinha aqui em vermelho aqui uma linha subindo um pouco mostrando que tem adaptadores então aqui a gente observa que não tem nenhuma linha vermelha que nós temos uma linha uma linha Rosa né mas a linha vermelha não não tá aqui não tem gráfico mostrando a presença de adaptadores Estão realmente confirma aqui os pesquisadores Eles já haviam removido esses adaptadores antes de publicar lá no Olá tudo bem o que não é um problema tá é só realmente para manter o dado limpo e tudo nos conformes então a gente também
tem outras partes aqui a esquerda que não são tão relevante a gente não costuma olhar muito mas mesmo assim eu vou mostrar para vocês lá no site O que que significa cada uma se a gente for aqui de volta para internet e eu voltar um pouco o e olhar aqui embaixo ele tem algumas informações então um dado bom como seria esperado em um dado ruim tá olha só um dado bons box-plot Ficam todos na área verde e já um dado ruim né a gente tem que descendo até para vermelha então dá do Bom como esse
não precisaria fazer nada e um dado já ruim Eu precisaria né fazer uma imagem tudo mais então Caso vocês queiram Esse é um vídeo para ensinar vocês a visualizar qualidade Depois daí a gente parte para limpeza ou não então Caso vocês queiram um vídeo separado Onde eu posso mostrar como é que se faz a limpeza deixa nos comentários aí para eu saber e aí a gente pode estar fazendo um vídeo Extra tá já aproveita também esse momento para pedir o seu like aí você deixar a sua curtida compartilhar com seus amigos que eu não preciso
saber como é que verifica a qualidade e também não esqueça de se inscrever no Canal Tudo bem então você gente fazer mais algumas coisas para tá comparando e olha só então a qualidade aqui também olha tudo verdinho tudo bonitinho não têm ruído tudo em azul já aqui embaixo Ó tem ruídos tem algumas informações aqui que não tão legais que é mais e aqui uma média de qualidade por Leitura e aqui não tá tão homogêneo Olha esse gráfico não tá homogêneo aqui a qualidade Ela tá no ponto praticamente único né então é uma qualidade bem homogênea
também e aqui o conteúdo através das Barras ó então todas as bases também estão de maneira bem semelhantes aqui já tá uma confusão Zinha olha gráfico tá né sobe desce sobe desce sobe desce em relação à qualidade tudo bem é a média do conteúdo GC olha aqui aqui também ó então a média do conteúdo GC que está em vermelho se aproxima da Média da distribuição teórica tá então realmente está próximo do esperado já que não não está próximo do esperado esperado é esse gráfico é azul e o vermelho está destoando bastante É nesse ruim também
possui a presença de base Zeni né que são bases onde não foi possível determinar Quais são os nucleotídeos e a nesse aqui não tem então é mais ou menos assim que a gente Verifica a qualidade não faz que se olha só não tem adaptadores tá E aqui embaixo bem ele não tem aqui mostrando até que tem que adaptador subindo aqui um pouquinho Tudo bem então é basicamente assim que a gente verifica qualidade no facho que eu sei Lembrando que ele é um programa apenas visualizador ele não é um programa onde você vai executar nada ele
é um programa onde você vai verificar qualidade e a partir daí determinar se você vai fazer limpeza ou não em outros programas como treino Mary que como um trem segue e outros agora vou ensinar para vocês rapidamente também como Olha a qualidade no Dia dos Pais Lembrando que esse programa é pago Inclusive a licença e não é tão baratinha Mas você pode conseguir uma um experimento mas experimentação de 14 dias tá um teste Nat 14 dias Oi e aí quando a gente abre o dias a gente tem aqui essa essa esse layout né com várias
ferramentas de alinhamento primer clonagem Blast uma ligação direta que eu recebi ai enfim dá para fazer muitas coisas aqui e eu já coloquei aqui dentro ah os meus sequenciamentos de tratamentos e controles tudo bem nesse caso aqui tanto faz qual eu vou abrir que a gente não vai fazer nenhuma análise específica eu vou só tá mostrando a qualidade então eu vou abrir o controle e a gente visualiza aqui todas as leituras onde a primeira leitura isso aqui é o nome da Leitura tudo bem Então a primeira leitura até e até a leitura 20599764 pra gente
tem 20 milhões e no tanto de leitoras Inclusive tem aqui ó sequência 20 milhões ele também mostra é o tamanho das leituras 150 pares de base tudo bem E a gente também vê ali outras informações como a média né a média 35.7 a gente tem os erros esperados mas o que aonde a gente realmente visualiza a qualidade é aqui ó aqui Leite quer 20 que 30 40 Lembrando aqui para eu chegar aqui nessas estatísticas eu cliquei aqui do lado direito nessa nessa porcentagem região onde eu consigo obter essas informações aqui embaixo eu também tenho informações
da frequência da adenina citosina timina guanina e bar desenho Tá mas o que significa o quê que seria esse que 20 que 30 40 lembra O que é the Quality Então se a gente for no site da ilumina que eu já deixei até aberto aqui assim ó ele consegue ver os escores que que significa cada um deles então que 10 significa que a probabilidade de uma base incorreta é uma em 10 que é 20 significa uma e sem que 31 mil 40 uma em 10 mil que é 50 uma em cem mil ou seja quanto
maior é o que mais interessante né então qualquer que a gente tem aqui a gente tem que vir que é 30 e 40 a gente não tem né então a gente tem aqui que 20 representando 97/1997. 4 que é 30/92. 6 Então a gente tem não não tem menos que 20 né que a gente pode costurar que a nossa qualidade de pelo menos que 20 é basicamente Essas são as duas formas que você pode estar visualizando a qualidade das suas do sequenciamento para saber se você precisa ou não fazer uma limpeza mas a limpeza não
é feita nem aqui no dia dos pais e nem no Face que assim você usa outros programas geralmente são programas que podem ser de linha de comando como criar numérico ou também tem problema em nuvem Como prinseq que Como disse se vocês tiver interesse eu posso tá gravando um vídeo específico de como faz a limpeza tá então espero que vocês tenham gostado não esqueçam de se inscrever no canal deixar o like e ativar o Sininho porque agora a gente vai estar com vários vídeos nesse sentido mostrando um pouco do seu conhecimento como é que faz
a qualidade ou alinhamento todos os passo a passos que são necessárias para você tenha um bom aproveitamento dos seus dados tá então Obrigado por assistir esse vídeo até aqui até a próxima E aí E aí E aí