Busca avançada
Ano de início
Entree

Combinando redes complexas e word embeddings em tarefas de classificação de textos

Processo: 20/06271-0
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de março de 2022
Data de Término da vigência: 29 de fevereiro de 2024
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Diego Raphael Amancio
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Processamento de linguagem natural  Classificação de textos  Redes complexas  Redes semânticas 
Palavra(s)-Chave do Pesquisador:Classificação de Textos | Previsão de Links | Processamento de Línguas Naturais | Redes Complexas | Redes semânticas | Word Embeddings | Redes de Informação e Processamento de Línguas Naturais

Resumo

A modelagem por redes complexas tem sido utilizadas em uma miríade de sistemas complexos. Embora este modelo já tenha sido usado na classificação de textos, a maior parte dos estudos se baseou no modelo de co-ocorrência de palavras para estudar as propriedades estruturais e estilísticas de documentos. Nesse projeto, propomos estender a modelagem tradicional de redes representando textos usando informação de embeddings de palavras. A modelagem proposta consiste no enriquecimento de redes (grafos) por arestas virtuais provenientes de informação contextual das palavras. Espera-se com esta modelagem obter aperfeiçoamentos em alguns aspectos da classificação de textos, incluindo qualidade, robustez e adequação à classificação de textos pequenos. Devido à generalidade dos métodos e técnicas propostas, acreditamos que estas possam ser usadas para estudar também outros sistemas complexos com a generalização do conceito de embeddings de palavras para embeddings de vértices de redes complexas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (5)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BRITO, ANA C. M.; SILVA, FILIPI N.; AMANCIO, DIEGO R.. Analyzing the influence of prolific collaborations on authors productivity and visibility. SCIENTOMETRICS, v. 128, n. 4, p. 17-pg., . (20/14817-2, 20/06271-0)
DE ARRUDA, HENRIQUE FERRAZ; REIA, SANDRO MARTINELLI; SILVA, FILIPI NASCIMENTO; AMANCIO, DIEGO RAPHAEL; COSTA, LUCIANO DA FONTOURA. Finding contrasting patterns in rhythmic properties between prose and poetry. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 598, p. 13-pg., . (18/10489-0, 20/06271-0, 15/22308-2)
SOUZA, BARBARA C. E.; SILVA, FILIPI N.; DE ARRUDA, HENRIQUE F.; DA SILVA, GIOVANA D.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R.. Text characterization based on recurrence networks. INFORMATION SCIENCES, v. 641, p. 15-pg., . (19/07665-4, 21/01744-0, 20/06271-0, 18/10489-0, 15/22308-2)
BRITO, ANA CAROLINE M.; OLIVEIRA, MARIA CRISTINA F.; OLIVEIRA JR, OSVALDO N.; SILVA, FILIPI N.; AMANCIO, DIEGO R.. Network Analysis and Natural Language Processing to Obtain a Landscape of the Scientific Literature on Materials Applications. ACS APPLIED MATERIALS & INTERFACES, v. 15, n. 23, p. 10-pg., . (20/14817-2, 20/06271-0, 18/22214-6)