Busca avançada
Ano de início
Entree

Veritas: base de dados de textos jurídicos brasileiros para processamento de linguagem natural

Processo: 21/06783-3
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de outubro de 2021
Vigência (Término): 30 de novembro de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Esther Luna Colombini
Beneficiário:Guilherme Pereira Corrêa
Instituição Sede: Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Empresa Sede:Universidade de São Paulo (USP). Centro de Inovação da USP (INOVA)
Vinculado ao auxílio:19/07665-4 - Centro de Inteligência Artificial, AP.eScience.CPE
Assunto(s):Inteligência artificial   Processamento de linguagem natural   Bases de dados   Técnicas computacionais
Palavra(s)-Chave do Pesquisador:artificial intelligence for social good | computational legal science | legal documents dataset | natural language processing in the legal domain | unsupervised classification | Inteligência Artificial

Resumo

Nos últimos anos, o volume de dados disponíveis já vinha aumentando de forma diversa, porém essa alta tomou outras proporções durante a pandemia de Covid-19. Em conjunto com a evolução de técnicas computacionais para análise dessas informações, isso fez com que áreas que se concentravam em abordagens qualitativas começassem a utilizar técnicas de computação científica para facilitar a consideração de outro paradigma na pesquisa - o quantitativo. O Direito, em particular, não é exceção, já que muitos textos jurídicos estão disponíveis publicamente em sua forma digital, principalmente após a oficialização da Lei Federal 11419/2006, que regulamenta e incentiva o uso de documentos digitais em processos judiciais. Uma vez que essa área tem potencial de impactar diretamente a vida de muitas pessoas, trabalhos que fazem uso de técnicas computacionais aplicadas ao Direito que visam ao interesse público são especialmente relevantes. Por conta disso, uma parceria entre o Instituto de Computação da Unicamp e a Faculdade de Direito de Ribeirão Preto da USP foi feita, onde o objetivo de tal colaboração é atender as demandas de computational legal science que promovem o bem-estar social. Inspirado por essa parceria, este projeto de Iniciação Científica visa contribuir para a exploração de técnicas de Aprendizado de Máquina no Direito, com foco em trabalhos cujo objetivo visa ao interesse coletivo. Ao término do mesmo, pretende-se criar uma base de dados que contenha textos jurídicos brasileiros, onde tal base é gerada a partir dos dados coletados por um web crawler de acordo com os parâmetros desejados, sendo, também, direcionada à aplicação de técnicas de aprendizado não supervisionado. Para validação, planeja-se criar um modelo de aprendizado não supervisionado para classificação de decisões judiciais com base no conteúdo dos respectivos documentos jurídicos. Com isso, espera-se contribuir para a comunidade falante de português de pesquisadores de computational legal science, dada a escassez desse tipo de base de dados - as bases de dados disponíveis para uso ou são em inglês, restringem-se a somente uma classe de documentos ou são anotadas de tal modo que a generalidade é perdida e a usabilidade se torna limitada.(AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)