Busca avançada
Ano de início
Entree

Combinando redes complexas e word embeddings em tarefas de classificação de textos

Processo: 20/06271-0
Modalidade de apoio:Auxílio à Pesquisa - Regular
Vigência: 01 de março de 2022 - 29 de fevereiro de 2024
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Diego Raphael Amancio
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Processamento de linguagem natural  Classificação de textos  Word embedding  Redes complexas  Redes semânticas 
Palavra(s)-Chave do Pesquisador:Classificação de Textos | Previsão de Links | Processamento de Línguas Naturais | Redes Complexas | Redes semânticas | Word Embeddings | Redes de Informação e Processamento de Línguas Naturais

Resumo

A modelagem por redes complexas tem sido utilizadas em uma miríade de sistemas complexos. Embora este modelo já tenha sido usado na classificação de textos, a maior parte dos estudos se baseou no modelo de co-ocorrência de palavras para estudar as propriedades estruturais e estilísticas de documentos. Nesse projeto, propomos estender a modelagem tradicional de redes representando textos usando informação de embeddings de palavras. A modelagem proposta consiste no enriquecimento de redes (grafos) por arestas virtuais provenientes de informação contextual das palavras. Espera-se com esta modelagem obter aperfeiçoamentos em alguns aspectos da classificação de textos, incluindo qualidade, robustez e adequação à classificação de textos pequenos. Devido à generalidade dos métodos e técnicas propostas, acreditamos que estas possam ser usadas para estudar também outros sistemas complexos com a generalização do conceito de embeddings de palavras para embeddings de vértices de redes complexas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)