Busca avançada
Ano de início
Entree

Representação Semântica para Classificação de Textos

Processo: 16/07620-2
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Doutorado
Vigência (Início): 01 de agosto de 2016
Vigência (Término): 31 de janeiro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Roberta Akemi Sinoara
Supervisor: Roberto Navigli
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa: Università degli Studi di Roma La Sapienza, Itália  
Vinculado à bolsa:13/14757-6 - Incorporação da semântica na construção de websensors, BP.DR
Assunto(s):Semântica   Classificação de textos   Inteligência artificial   Mineração de texto
Palavra(s)-Chave do Pesquisador:Classificação de Textos | Mineração de Textos | Representação de dados textuais | semântica | Inteligência Artificial

Resumo

Em mineração de textos, normalmente os textos são representados com base na frequência das palavras presentes na coleção de documentos. Apesar dos bons resultados obtidos com esse tipo de representação, chamada de bag-of-words, tal modelo pode não ser adequado a todos os problemas de classificação. Representações mais ricas podem ser requeridas. Nesse contexto, o objetivo deste projeto de estágio em pesquisa é desenvolver uma representação de textos baseada na abordagem NASARI. Essa é uma abordagem para representação de conceitos, sendo utilizada para medir similaridade semântica com bons resultados em tarefas como similaridade de palavras e agrupamento de sentidos. As representações de conceitos na abordagem NASARI são baseadas em conhecimento de duas fontes, WordNet e Wikipedia. Assim, esse projeto busca o enriquecimento da representação de documentos por meio da representação de conceitos NASARI, que é semanticamente rica. A representação de documentos proposta será avaliada em tarefas de classificação de textos. É esperado que o uso da representação baseada na NASARI melhore os resultados da classificação de documentos. Esse projeto está relacionado com o projeto de doutorado da candidata, que está sendo desenvolvido na Universidade de São Paulo. O projeto de estágio em pesquisa proposto será desenvolvido na Sapienza - Università di Roma, sob a supervisão do professor Roberto Navigli, um dos autores da abordagem NASARI, um dos autores da abordagem NASARI.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SINOARA, ROBERTA A.; CAMACHO-COLLADOS, JOSE; ROSSI, RAFAEL G.; NAVIGLI, ROBERTO; REZENDE, SOLANGE O.. Knowledge-enhanced document embeddings for text classification. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 955-971, . (16/17078-0, 13/14757-6, 16/07620-2)
SINOARA, ROBERTA A.; ROSSI, RAFAEL G.; REZENDE, SOLANGE O.; IEEE. Semantic Role-based Representations in Text Classification. 2016 23RD INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR), v. N/A, p. 6-pg., . (16/07620-2, 14/08996-0, 11/12823-6, 13/14757-6)

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.