Busca avançada
Ano de início
Entree

Atribuição de autoria através do uso de métodos tradicionais e redes complexas

Processo: 15/23803-7
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Vigência (Início): 01 de março de 2016
Vigência (Término): 31 de agosto de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Vanessa Queiroz Marinho
Supervisor no Exterior: Graeme Hirst
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa : University of Toronto (U of T), Canadá  
Vinculado à bolsa:15/05676-8 - Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas, BP.MS
Assunto(s):Processamento de texto   Processamento de linguagem natural   Teoria dos grafos   Reconhecimento de padrões   Redes complexas

Resumo

Conceitos e métodos de redes complexas provaram ser úteis para investigar vários sistemas reais de natureza distinta. A descoberta de que os métodos de redes complexas podem ser utilizados para analisar textos em seus diferentes níveis de complexidade permitiu o estudo de tarefas de processamento de línguas naturais (PLN) de uma nova perspectiva. Exemplos de tarefas estudadas através da análise topológica de redes são a identificação de palavras-chave, sumarização automática e atribuição de autoria. A última tarefa, que é o foco deste projeto, foi estudada com certo sucesso através da representação de textos pelas redes de adjacência de palavras. Embora as representações em rede tenham sido aplicadas para estudar o problema de reconhecimento de autoria, tais abordagens não superaram outros modelos tradicionais baseados em paradigmas estatísticos. Uma vez que os modelos de rede são capazes de extrair os padrões textuais que não são obtidos com modelos estatísticos tradicionais, pretendemos desenvolver sistemas híbridos que combinam ambas as técnicas tradicionais de PLN com propriedades fornecidas pela análise topológica das redes complexas. Ao combinar esses paradigmas distintos, de forma complementar, pretendemos melhorar o desempenho dos sistemas de caracterização estilísticas e de atribuição de autoria. Acredita-se que essa combinação deve, provavelmente, melhorar o desempenho de aplicações relacionadas, tais como a análise de inconsistências estilísticas, fraudes científicas e plágio.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, AUG 2018. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.