Busca avançada
Ano de início
Entree

Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas

Processo: 15/05676-8
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de julho de 2015
Vigência (Término): 31 de julho de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Convênio/Acordo: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Vanessa Queiroz Marinho
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):15/23803-7 - Atribuição de autoria através do uso de métodos tradicionais e redes complexas, BE.EP.MS
Assunto(s):Processamento de linguagem natural   Processamento de texto   Teoria dos grafos   Reconhecimento de padrões   Redes complexas

Resumo

A modelagem de grafos e redes complexas vem sendo aplicada com sucesso em diferentes domínios, sendo objeto de estudo de distintas áreas que incluem, por exemplo, a matemática e a computação. A descoberta de que métodos derivados do estudo de redes complexas podem ser utilizados para analisar textos em seus distintos níveis de complexidade proporcionou grandes avanços em tarefas de processamento de línguas naturais. Exemplos de aplicações analisadas com os métodos e ferramentas de redes complexas são a detecção de conceitos relevantes, a criação de sumarizadores extrativos automáticos e reconhecedores de autoria. Esta última tarefa, que é foco deste projeto de pesquisa, tem sido estudada com certo sucesso através da representação de redes de adjacência de palavras que conectam apenas as palavras mais próximas. O objetivo deste projeto é estender a modelagem tradicional, escolhendo-se a janela de conexão ótima para o problema, para um dado conjunto de treinamento. Além disso, pretende-se utilizar informação de conectividade de palavras funcionais para complementar a caracterização de estilo de autores. Finalmente, pretende-se criar classificadores híbridos que sejam capazes de combinar fatores tradicionais com as propriedades fornecidas pela análise topológica de redes complexas. Através da adaptação, combinação e aperfeiçoamento da modelagem, pretendemos não apenas melhorar o desempenho dos sistemas de caracterização estilística textual e reconhecimento de autoria, mas também entender melhor quais são os fatores quantitativos textuais (medidos via redes) que podem ser utilizados na área de estilometria. Os avanços obtidos durante este projeto podem ser úteis para estudar aplicações relacionadas, como é o caso de análise de inconsistências estilísticas e plagiarismos. (AU)

Publicações científicas (5)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CORREA JR, EDILSON A.; MARINHO, VANESSA Q.; AMANCIO, DIEGO R. Semantic flow in language networks discriminates texts by genre and publication date. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 557, NOV 1 2020. Citações Web of Science: 0.
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; COSTA, LUCIANO DA F.; AMANCIO, DIEGO R. Paragraph-based representation of texts: A complex networks approach. INFORMATION PROCESSING & MANAGEMENT, v. 56, n. 3, p. 479-494, MAY 2019. Citações Web of Science: 1.
DE ARRUDA, HENRIQUE F.; MARINHO, VANESSA Q.; LIMA, THALES S.; AMANCIO, DIEGO R.; COSTA, LUCIANO DA F. An image analysis approach to text analytics based on complex networks. PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS, v. 510, p. 110-120, NOV 15 2018. Citações Web of Science: 2.
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, AUG 2018. Citações Web of Science: 0.
DE ARRUDA, HENRIQUE FERRAZ; SILVA, FILIPI NASCIMENTO; MARINHO, VANESSA QUEIROZ; AMANCIO, DIEGO RAPHAEL; COSTA, LUCIANO DA FONTOURA. Representation of texts as complex networks: a mesoscopic approach. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 1, p. 125-144, FEB 2018. Citações Web of Science: 3.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
MARINHO, Vanessa Queiroz. Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas. 2017. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.