Busca avançada
Ano de início
Entree

Classificação de documentos usando informações semânticas em redes complexas

Processo: 16/19069-9
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de fevereiro de 2017 - 31 de dezembro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Diego Raphael Amancio
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Redes complexas  Reconhecimento de padrões  Mineração de texto 

Resumo

Redes complexas têm sido utilizadas para modelar uma grande quantidade de sistemas complexos. Embora a teoria de redes já tenham sido empregadas na análise de textos, a maior parte desta teoria foi aplicada para estudar as propriedades estruturais/estilísticas de documentos. Nesse projeto, propomos estender modelagens tradicionais de redes representando textos de forma a capturar seus aspectos semânticos. Exemplos de aperfeiçoamento propostos na modelagem incluem uma representação multi-escala de partes do texto e a inclusão de links semânticos com medidas recentes de similaridade textual. Nesse contexto, duas tarefas serão abordadas, a segmentação de tópicos e a sumarização multi-documentos. Para tratar tais tarefas, utilizaremos os conceitos de detecção de comunidades e modelagem de redes por multi-camadas. Devido à generalidade dos métodos e técnicas propostas, acreditamos que estas possam ser facilmente adaptadas à modelagem de vários outros sistemas complexos similares. (AU)

Publicações científicas (15)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CORREA, JR., EDILSON A.; AMANCIO, DIEGO R. Word sense induction using word embeddings and community detection in complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 523, p. 180-190, JUN 1 2019. Citações Web of Science: 0.
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R. Paragraph-based representation of texts: A complex networks approach. INFORMATION PROCESSING & MANAGEMENT, v. 56, n. 3, p. 479-494, MAY 2019. Citações Web of Science: 1.
DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F. Connecting network science and information theory. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 515, p. 641-648, FEB 1 2019. Citações Web of Science: 0.
RODRIGUEZ, MAYRA Z.; COMIN, CESAR H.; CASANOVA, DALCIMAR; BRUNO, ODEMIR M.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.; RODRIGUES, FRANCISCO A. Clustering algorithms: A comparative approach. PLoS One, v. 14, n. 1 JAN 15 2019. Citações Web of Science: 1.
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; LIMA, THALES S.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F. An image analysis approach to text analytics based on complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 510, p. 110-120, NOV 15 2018. Citações Web of Science: 1.
TOHALINO, JORGE V.; AMANCIO, DIEGO R. Extractive multi-document summarization using multilayer networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 503, p. 526-539, AUG 1 2018. Citações Web of Science: 2.
LIMA, THALES S.; DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F. The dynamics of knowledge acquisition via self-learning in complex networks. Chaos, v. 28, n. 8 AUG 2018. Citações Web of Science: 1.
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, AUG 2018. Citações Web of Science: 0.
CORREA, JR., EDILSON A.; LOPES, ALNEU A.; AMANCIO, DIEGO R. Word sense disambiguation: A complex network approach. INFORMATION SCIENCES, v. 442, p. 103-113, MAY 2018. Citações Web of Science: 4.
AKIMUSHKIN, CAMILO; AMANCIO, DIEGO R.; OLIVEIRA, JR., OSVALDO N. On the role of words in the network structure of texts: Application to authorship attribution. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 495, p. 49-58, APR 1 2018. Citações Web of Science: 1.
MACHICAO, JEANETH; CORREA, JR., EDILSON A.; MIRANDA, GISELE H. B.; AMANCIO, DIEGO R.; BRUNO, ODEMIR M. Authorship attribution based on Life-Like Network Automata. PLoS One, v. 13, n. 3 MAR 22 2018. Citações Web of Science: 0.
DE ARRUDA, HENRIQUE FERRAZ; SILVA, FILIPI NASCIMENTO; MARINHO, VANESSA QUEIROZ; AMANCIO, DIEGO RAPHAEL; COSTA, LUCIANO DA FONTOURA. Representation of texts as complex networks: a mesoscopic approach. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 1, p. 125-144, FEB 2018. Citações Web of Science: 3.
DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R. Knowledge acquisition: A Complex networks approach. INFORMATION SCIENCES, v. 421, p. 154-166, DEC 2017. Citações Web of Science: 8.
CORREA, JR., EDILSON A.; SILVA, FILIPI N.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R. Patterns of authors contribution in scientific manuscripts. Journal of Informetrics, v. 11, n. 2, p. 498-510, MAY 2017. Citações Web of Science: 5.
AKIMUSHKIN, CAMILO; AMANCIO, DIEGO RAPHAEL; OLIVEIRA, JR., OSVALDO NOVAIS. Text Authorship Identified Using the Dynamics of Word Co-Occurrence Networks. PLoS One, v. 12, n. 1 JAN 26 2017. Citações Web of Science: 14.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.
Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.