| Processo: | 16/07620-2 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Doutorado |
| Data de Início da vigência: | 01 de agosto de 2016 |
| Data de Término da vigência: | 31 de janeiro de 2017 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Solange Oliveira Rezende |
| Beneficiário: | Roberta Akemi Sinoara |
| Supervisor: | Roberto Navigli |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Instituição Anfitriã: | Università degli Studi di Roma La Sapienza, Itália |
| Vinculado à bolsa: | 13/14757-6 - Incorporação da semântica na construção de websensors, BP.DR |
| Assunto(s): | Semântica Classificação de textos Inteligência artificial Mineração de texto |
| Palavra(s)-Chave do Pesquisador: | Classificação de Textos | Mineração de Textos | Representação de dados textuais | semântica | Inteligência Artificial |
Resumo Em mineração de textos, normalmente os textos são representados com base na frequência das palavras presentes na coleção de documentos. Apesar dos bons resultados obtidos com esse tipo de representação, chamada de bag-of-words, tal modelo pode não ser adequado a todos os problemas de classificação. Representações mais ricas podem ser requeridas. Nesse contexto, o objetivo deste projeto de estágio em pesquisa é desenvolver uma representação de textos baseada na abordagem NASARI. Essa é uma abordagem para representação de conceitos, sendo utilizada para medir similaridade semântica com bons resultados em tarefas como similaridade de palavras e agrupamento de sentidos. As representações de conceitos na abordagem NASARI são baseadas em conhecimento de duas fontes, WordNet e Wikipedia. Assim, esse projeto busca o enriquecimento da representação de documentos por meio da representação de conceitos NASARI, que é semanticamente rica. A representação de documentos proposta será avaliada em tarefas de classificação de textos. É esperado que o uso da representação baseada na NASARI melhore os resultados da classificação de documentos. Esse projeto está relacionado com o projeto de doutorado da candidata, que está sendo desenvolvido na Universidade de São Paulo. O projeto de estágio em pesquisa proposto será desenvolvido na Sapienza - Università di Roma, sob a supervisão do professor Roberto Navigli, um dos autores da abordagem NASARI, um dos autores da abordagem NASARI. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |