[Música] bom então aplicações para esses dados estruturados né então voltando aqui pra parte pra parte mais teórica aqui do do conceito só para ficar claro também as as os usos que a gente vê desse desse dessa infraestrutura a gente entende que isso vai vai ter um impacto isso sendo colocado dentro de um portal do CNJ né com com Ampla divulgação vai ter um impacto grande científico eu entendo que é um recurso muito rico e que a comunidade vai vai se interessar muito por explorar e eu e aqui eu não tô falando só a comunidade do
direito eu realmente acho que a a comunidade de computação física eh ciências de uma forma geral aí o pessoal vai se interessar porque aquela história é um volume de de dados interessante tem uma riqueza Aí também tem a parte de processamento de linguagem natural que pode ser associado o texto tá disponível lá nos portais né então pode ser associado feita análise junto com essa parte estruturada que a gente já fez e aqui é uma figura que do nosso artigo aí que a gente que a gente publicou que eu eu gosto dela porque ela dá um
pouquinho a a a dimensão a complexidade do do dado aqui né Tem vários tipos de legislação diferente o tamanho da da bola aqui do Círculo em função dos dos volumes dos dados E essas arestas aí são os tipos de de relações que existem né decretos alterando leis ordinárias e por aí vai o contrário né mas esse esse essa figura eu acho que ela ela dessa dessa ideia um pouquinho da dimensão dos dados Então são 200.000 vértices aí né que nessa estrutura desse gráfico que a gente tá apresentando e muitas arestas relacionando esses vértices bom o
o Eric vai falar um pouquinho aqui dessa outra aplicação aqui que é o O plugin do trat texto O plugin do trata texto é um outro entregável aqui do projeto a estruturação da base de legislação ela iniciou né a a motivação para fazer ela veio do do Plugin trat texto O plugin trat texto ele é um um entregável já mais consolidado do projeto ele é mais antigo tá desde o praticamente do final do da primeira parte do projeto a gente tá trabalhando com com isso aqui e a partir e a partir dele né desse desse
trabalho que tinha a necessidade de acessar a legislação a gente percebeu que POD pod evoluir para gerar por exemplo um arquivo totalmente estruturado que é aquele lá que a gente que eu apresentei nesses últimos slides mas eu eu acho importante falar um pouco do trat texto na reunião de hoje porque o trat texto ele acessa o nosso aquele recurso via api veja que tudo que eu expliquei até agora para vocês o dado é um arquivo Jon um arquivão né com todas as 200.000 legislações lá dentro é um arquivo que tem um tamanho razoável Então não
é uma coisa você precisa se você quiser manipular o ideal é que você baixe e leve para uma estrutura local né as equipes quando vão fazer exploração científica tem costume de fazer isso até porque elas vão montar grafos fazer coisas do tipo mas a gente também pode acessar aquele recurso via api tendo acessos diretos a partes da legislação por exemplo acessar a lei xpto artigo 2 parágrafo 5 Inciso tal e direto numa parte da da legislação que esteja querendo acessar o O Eric vai falar um pouquinho disso a partir de agora Eric você fica à
vontade Tá eu vou passando os slides para você pronto tá ótimo é só volta pr para o slide anterior por favor certo pronto e para quem ainda não viu essa aí é a é a cara da Aila Nossa assistente e legal né e o que que esse plugin ele faz e como o professor caminha falou tudo começou com o trat texto que foi uma uma uma biblioteca que a gente fez com base em reex para reconhecer eh alguns padrões no texto de legislações sejam dispositivos legais artigos coisas do tipo eh e como esse esse entregável
foi crescendo de importância Aí eh a gente sugeriu né para fazer um plugin esse plugin eh atualmente ele roda no Google Chrome como extensão do Google Chrome e ele tem essa carinha aí eh para quem ainda não viu Eh essa página tá oculta ali o nomezinho mas é simulação do pje porque o pje tem esse elemento essa caixinha de texto ali atrás que tá escrito segundo o artigo 1000 da Lei e tal né ou Eh desculpa do do Código Civil ali alguns elementos a gente pode ver eh nesse nesse layout tem essa caixa aí no
canto superior esquerdo escrito sugestão ou seja ele dá uma sugestão de de da citação em si né o o melhor método isso Onde tá o mouse do caminha dá um um a melhor citação possível pra gente poder padronizar esses textos peticionários textos jurídicos em geral né E porque justamente quando a gente estava analisando os dados foi visto que eh apesar de ter uma citação ótima existiam mu tinham muitas variações do jeito de citar então O plugin ele sugere uma uma uma padronização a partir do momento que o usuário Opa quero aceitar essa sugestão e corrige
na barra da direita ali que vocês estão vendo CC barra Pipe artigo 1000 eh ele ele reconhece um um documento nesse caso é o código civil né e o artigo 1000 que está junto dele isso é um um modelo de distância que a gente tem também por trás na na inteligência da Ila e ele faz esse reconhecimento Opa esse artigo 1000 Muito provavelmente está ligado com o código civil pela eh pela forma que o usuário digitou ali na caixa de texto e quando você eh quando o programa reconhece e pareia esse esse dispositivo né esse
documento com um artigo ele vai na que foi citada aqui né Toda o o trabalho de eh achar o texto da Lei e as jurisprudências e essa pop-up maior essa caixinha aí do centro que o caminha vai passar o mouse agora pronto ela tem a informação que que a gente conseguiu extrair das bases né se você vê essa primeira caixinha da esquerda escrito legislação é literalmente o texto da Lei Opa o que que diz o artigo 1000 do Código Civil ele vai lá e pega do do serviço que o caminha comentou e exibe pro usuário
e temos Eh esses posicionamentos agrupados do STJ e posicionamentos isolados do STJ são os as jurisprudências que influenciam naquele artigo em específico eh que foram eh estruturadas e a gente consegue agora recuperar graças a essa nova base e você pode consultar o texto das jurisprudências vendo Cada uma o ideal seria que esse plugin ele facilitaria para um peticionante ou alguém que está escrevendo um texto jurídico de fazer essas consultas de forma rápida prática ali sem precisar ir para outro site para procurar essas legislações e tudo mais isso é bem voltado para o usuário final na
área de especialidade do direito caso o usuário não esteja interessado em baixar o eh eh a extensão do Chrome e tudo mais é possível fazer o acesso via a api atualmente ela está eh hospedada numa máquina da Amazon eh mas isso pode ser alterado como todo o o processo passado que o caminha falou mas atualmente como é que você pode acessar ela com o Python né bem simples A gente vai precisar de um request né para para mandar essa requisição para a máquina da Amazon e ele é através de um Jon né a entrada vai
ser um Jon e a saída também vai ser um Jon então Eh aí tá o RL que tá recebendo essa essa a a com a porta eh a Ila tá recebendo e um exemplo de texto eh artigo 2 da Lei 9455 nessa próxima célula eu tô estruturando o Jon já que eh tenho variável né que é o texto dentro junto com eh alguns algumas estruturas que a Ila pede para você ver essa mensagem tipo texto puro e o conteúdo dentro desse conteúdo vai ter o texto que você quer consultar eu carrego essa mensagem né ali
dentro de um Jon e envio como uma requisição post para url que foi determinado ali em cima Aliás só um exemplo da resposta 200 que ele tá recebendo ele está 24 24 horas não eu acho que ele tá sendo desligado né Caio eh de madrugada por enquanto ainda não ainda não ainda não né então pronto tá 24 horas ali eh a máquina rodando por caso queiram consultar e eh essa célula aí da direita em destaque é a resposta ele vai voltar esse joninho que é como aquele plugin né o frontend da Ila ele pega essas
informações e mostra na tela pro usuário final mas aí é exatamente o e o Jon bruto que ela lê então eu vou ter essa extensão dado saída Jon é uma estrutura fixa isso aí não vai alterar nunca e temos aí os marcadores os marcadores Eles simplesmente vão dizer o que que tá escrito no texto que o usuário digitou né nesse caso na na terceira linha lá do nosso código texto né aquela variável ali tem a posição dele na string e tem sugestões né Eh é importante eu vou eh detalhar mais na frente eh tem essa
chave tipo aí no Jon que nesse caso é sugestão dispositivo e tem lá embaixo né no artigo dois ele deu uma sugestão também artigo segundo e sugestão artigo recapitulando o que a entrada né é um Jon a saída também é um Jon com essa estrutura e o que tá aí entre maior e menor são os campos que podem eh variar né com a sua requisição e a a resposta da Ila os tip de de retorno né Eu disse que aquela chave tipo ela pode retornar algumas opções uma sugestão dispositivo ou sugestão artigo e isso é
simplesmente quando a Ila ela reconhece opa não tá na padronização que a gente considera como ideal então quando esse tipo é apresentado é simplesmente usuário Você não acha melhor usar essa padronização próximo tipo consulta dispositivo ou consulta legislação eh a partir do momento que está padronizado você pode consultar o texto da Lei as jurisprudências que e como a a seta aí mostra a saída ela vai ser um pouco mais complexa né nesse caso de consultas só bagunçou um pouquinho a formatação Mas você vê que uma chave chamada jurisprudências ela abriu ali embaixo ela aparece nessas
consultas e nela e tem uma lista de jurisprudência tem duas listas na verdade né que é uma do dos posicionamentos agrupados e o dos posicionamentos isolados que podem conter ou não pode ser uma lista vazia as jurisprudências que influenciam naquele artigo então voltando para os tipos ali de retorno só uma coisa a consulta dispositivo é só o documento por exemplo código civil e a consulta legislação é quando ele encontra um dispositivo e um artigo e Paraí ele reconhece Opa a Ila viu que esses dois aqui no texto provavelmente estão conectados então é aquele artigo eh
ou qualquer subnível né artigo parágrafo inciso a linha dentro desse documento dentro do do Código Civil por exemplo Então o próximo tipo de retorno pode ser um erro dispositivo ou um erro legislação O que é isso eh temos duas opções ou o dispositivo né a lei citada a le relação citada não existe na nossa base por algum motivo ou ele está errado né a gente eh fez esse tipo quando ainda tava muito rudimentar a base então a gente não tinha todos os documentos ainda varridos né com o crawler e tudo mais então poderia não estar
na nossa base mas eh a partir do momento que o crawler vai se aperfeiçoando tende a esse erro aí Provavelmente o usuário digitou algo que não existe né quando a gente caminha a a base completa e por último tem um erro de pareamento quer dizer que a Ila ela não conseguiu achar nemhum um um documento eh que aquele artigo pertence Então eu tenho um artigo que está flutuando ali no seu texto e a Ila não conseguiu identificar de quem lhe pertence Como eh os especialistas eh mostraram e a gente compreende um artigo sozinho ele não
faz sentido né ele precisa estar atrelado algum documento Obrigado aí er legal [Música]