Busca avançada
Ano de início
Entree

Representação semântica para classificação de textos

Processo: 16/07620-2
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Doutorado
Vigência (Início): 01 de agosto de 2016
Vigência (Término): 31 de janeiro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Roberta Akemi Sinoara
Supervisor no Exterior: Roberto Navigli
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa : Università degli Studi di Roma La Sapienza, Itália  
Vinculado à bolsa:13/14757-6 - Incorporação da semântica na construção de websensors, BP.DR
Assunto(s):Semântica   Inteligência artificial   Mineração de texto

Resumo

Em mineração de textos, normalmente os textos são representados com base na frequência das palavras presentes na coleção de documentos. Apesar dos bons resultados obtidos com esse tipo de representação, chamada de bag-of-words, tal modelo pode não ser adequado a todos os problemas de classificação. Representações mais ricas podem ser requeridas. Nesse contexto, o objetivo deste projeto de estágio em pesquisa é desenvolver uma representação de textos baseada na abordagem NASARI. Essa é uma abordagem para representação de conceitos, sendo utilizada para medir similaridade semântica com bons resultados em tarefas como similaridade de palavras e agrupamento de sentidos. As representações de conceitos na abordagem NASARI são baseadas em conhecimento de duas fontes, WordNet e Wikipedia. Assim, esse projeto busca o enriquecimento da representação de documentos por meio da representação de conceitos NASARI, que é semanticamente rica. A representação de documentos proposta será avaliada em tarefas de classificação de textos. É esperado que o uso da representação baseada na NASARI melhore os resultados da classificação de documentos. Esse projeto está relacionado com o projeto de doutorado da candidata, que está sendo desenvolvido na Universidade de São Paulo. O projeto de estágio em pesquisa proposto será desenvolvido na Sapienza - Università di Roma, sob a supervisão do professor Roberto Navigli, um dos autores da abordagem NASARI, um dos autores da abordagem NASARI.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Inteligência artificial rastreia notícias sobre COVID-19 
Matéria(s) publicada(s) em Outras Mídias: (3 total)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SINOARA, ROBERTA A.; CAMACHO-COLLADOS, JOSE; ROSSI, RAFAEL G.; NAVIGLI, ROBERTO; REZENDE, SOLANGE O. Knowledge-enhanced document embeddings for text classification. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 955-971, JAN 1 2019. Citações Web of Science: 4.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.