Busca avançada
Ano de início
Entree

Classificação de documentos usando informações semânticas em redes complexas

Processo: 16/19069-9
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de fevereiro de 2017
Data de Término da vigência: 31 de dezembro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Diego Raphael Amancio
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Redes complexas  Classificação de textos  Reconhecimento de padrões  Mineração de texto 
Palavra(s)-Chave do Pesquisador:Classificação de Textos | Mineração de Textos | Processamento de Textos | Reconhecimento de Padrões | Redes Complexas | Sumarização | Reconhecimento de Padrões em Textos com Redes Complexas

Resumo

Redes complexas têm sido utilizadas para modelar uma grande quantidade de sistemas complexos. Embora a teoria de redes já tenham sido empregadas na análise de textos, a maior parte desta teoria foi aplicada para estudar as propriedades estruturais/estilísticas de documentos. Nesse projeto, propomos estender modelagens tradicionais de redes representando textos de forma a capturar seus aspectos semânticos. Exemplos de aperfeiçoamento propostos na modelagem incluem uma representação multi-escala de partes do texto e a inclusão de links semânticos com medidas recentes de similaridade textual. Nesse contexto, duas tarefas serão abordadas, a segmentação de tópicos e a sumarização multi-documentos. Para tratar tais tarefas, utilizaremos os conceitos de detecção de comunidades e modelagem de redes por multi-camadas. Devido à generalidade dos métodos e técnicas propostas, acreditamos que estas possam ser facilmente adaptadas à modelagem de vários outros sistemas complexos similares. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (24)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, . (15/05676-8, 14/20830-0, 15/23803-7, 16/19069-9)
GEWERS, FELIPE L.; FERREIRA, GUSTAVO R.; DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. Principal Component Analysis: A Natural Approach to Data Exploration. ACM COMPUTING SURVEYS, v. 54, n. 4, . (17/13464-6, 18/09125-4, 15/22308-2, 16/19069-9, 18/10489-0, 11/50761-2, 19/16223-5)
DE ARRUDA, HENRIQUE FERRAZ; SILVA, FILIPI NASCIMENTO; MARINHO, VANESSA QUEIROZ; AMANCIO, DIEGO RAPHAEL; COSTA, LUCIANO DA FONTOURA. Representation of texts as complex networks: a mesoscopic approach. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 1, p. 125-144, . (16/19069-9, 11/50761-2, 15/05676-8, 14/20830-0, 15/08003-4)
DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R.. Knowledge acquisition: A Complex networks approach. INFORMATION SCIENCES, v. 421, p. 154-166, . (14/20830-0, 16/19069-9, 11/50761-2, 15/08003-4)
DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. Connecting network science and information theory. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 515, p. 641-648, . (15/18942-8, 16/19069-9, 14/20830-0, 15/08003-4, 11/50761-2)
CORREA, JR., EDILSON A.; SILVA, FILIPI N.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R.. Patterns of authors contribution in scientific manuscripts. Journal of Informetrics, v. 11, n. 2, p. 498-510, . (14/20830-0, 16/19069-9, 11/50761-2, 15/08003-4)
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R.. Paragraph-based representation of texts: A complex networks approach. INFORMATION PROCESSING & MANAGEMENT, v. 56, n. 3, p. 479-494, . (17/13464-6, 15/22308-2, 16/19069-9, 11/50761-2, 15/05676-8)
CORREA, JR., EDILSON A.; AMANCIO, DIEGO R.. Word sense induction using word embeddings and community detection in complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 523, p. 180-190, . (14/20830-0, 17/13464-6, 16/19069-9)
MACHICAO, JEANETH; CORREA, JR., EDILSON A.; MIRANDA, GISELE H. B.; AMANCIO, DIEGO R.; BRUNO, ODEMIR M.. Authorship attribution based on Life-Like Network Automata. PLoS One, v. 13, n. 3, . (17/13464-6, 14/20830-0, 15/05899-7, 16/19069-9, 14/08026-1)
COMIN, CESAR H.; PERON, THOMAS; SILVA, FILIPI N.; AMANCIO, DIEGO R.; RODRIGUES, FRANCISCO A.; COSTA, LUCIANO DA F.. Complex systems: Features, similarity and connectivity. PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, v. 861, p. 1-41, . (15/22308-2, 15/08003-4, 16/23827-6, 18/09125-4, 16/19069-9, 14/20830-0, 13/26416-9)
AKIMUSHKIN, CAMILO; AMANCIO, DIEGO RAPHAEL; OLIVEIRA, JR., OSVALDO NOVAIS. Text Authorship Identified Using the Dynamics of Word Co-Occurrence Networks. PLoS One, v. 12, n. 1, . (14/20830-0, 16/19069-9)
CORREA JR, EDILSON A.; MARINHO, VANESSA Q.; AMANCIO, DIEGO R.. Semantic flow in language networks discriminates texts by genre and publication date. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 557, . (15/05676-8, 16/19069-9)
MEDEIROS BRITO, ANA CAROLINE; SILVA, FILIPI NASCIMENTO; AMANCIO, DIEGO RAPHAEL. A complex network approach to political analysis: Application to the Brazilian Chamber of Deputies. PLoS One, v. 15, n. 3, . (16/19069-9)
BRITO, ANA C. M.; SILVA, FILIPI N.; DE ARRUDA, HENRIQUE F.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. Classification of abrupt changes along viewing profiles of scientific articles. Journal of Informetrics, v. 15, n. 2, p. 15-pg., . (18/09125-4, 18/10489-0, 15/22308-2, 16/19069-9, 15/08003-4)
BRITO, ANA C. M.; SILVA, FILIPI N.; DE ARRUDA, HENRIQUE F.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. lassification of abrupt changes along viewing profiles of scientific article. Journal of Informetrics, v. 15, n. 2, . (18/10489-0, 19/16223-5, 15/08003-4, 16/19069-9, 18/09125-4, 15/22308-2)
DA SILVA, EDUARDO BORGES; SILVA, THIAGO CHRISTIANO; CONSTANTINO, MICHEL; AMANCIO, DIEGO RAPHAEL; TABAK, BENJAMIN MIRANDA. Overconfidence and the 2D:4D ratio. JOURNAL OF BEHAVIORAL AND EXPERIMENTAL FINANCE, v. 25, . (16/19069-9)
LIMA, THALES S.; DE ARRUDA, HENRIQUE F.; SILVA, FILIPI N.; COMIN, CESAR H.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. The dynamics of knowledge acquisition via self-learning in complex networks. Chaos, v. 28, n. 8, . (17/13464-6, 17/09280-7, 15/22308-2, 16/19069-9, 11/50761-2, 15/08003-4, 15/18942-8)
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; LIMA, THALES S.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.. An image analysis approach to text analytics based on complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 510, p. 110-120, . (16/19069-9, 11/50761-2, 15/22308-2, 15/05676-8)
AKIMUSHKIN, CAMILO; AMANCIO, DIEGO R.; OLIVEIRA, JR., OSVALDO N.. On the role of words in the network structure of texts: Application to authorship attribution. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 495, p. 49-58, . (14/20830-0, 13/14262-7, 16/19069-9)
CORREA, JR., EDILSON A.; LOPES, ALNEU A.; AMANCIO, DIEGO R.. Word sense disambiguation: A complex network approach. INFORMATION SCIENCES, v. 442, p. 103-113, . (17/13464-6, 16/19069-9, 15/14228-9, 14/20830-0, 11/22749-8)
TOHALINO, JORGE V.; AMANCIO, DIEGO R.. Extractive multi-document summarization using multilayer networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 503, p. 526-539, . (17/13464-6, 16/19069-9)
RODRIGUEZ, MAYRA Z.; COMIN, CESAR H.; CASANOVA, DALCIMAR; BRUNO, ODEMIR M.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F.; RODRIGUES, FRANCISCO A.. Clustering algorithms: A comparative approach. PLoS One, v. 14, n. 1, . (16/19069-9, 14/20830-0, 15/18942-8, 15/22308-2, 14/08026-1, 18/09125-4, 11/50761-2)
TOHALINO, JORGE VALVERDE; AMANCIO, DIEGO RAPHAEL; IEEE. Extractive Multi Document Summarization using Dynamical Measurements of Complex Networks. 2017 6TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (16/19069-9)
SILVA, THIAGO CHRISTIANO; AMANCIO, DIEGO RAPHAEL; TABAK, BENJAMIN MIRANDA. Modeling supply-chain networks with firm-to-firm wire transfers. EXPERT SYSTEMS WITH APPLICATIONS, v. 190, . (16/19069-9)