Busca avançada
Ano de início
Entree

Atribuição de autoria através do uso de métodos tradicionais e redes complexas

Processo: 15/23803-7
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Data de Início da vigência: 01 de março de 2016
Data de Término da vigência: 31 de agosto de 2016
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Vanessa Queiroz Marinho
Supervisor: Graeme Hirst
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Instituição Anfitriã: University of Toronto (U of T), Canadá  
Vinculado à bolsa:15/05676-8 - Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas, BP.MS
Assunto(s):Processamento de texto   Processamento de linguagem natural   Teoria dos grafos   Reconhecimento de padrões   Redes complexas
Palavra(s)-Chave do Pesquisador:Atribuição de Autoria | Processamento de texto | Reconhecimento de Padrões | Redes Complexas | teoria dos grafos | Processamento de Línguas Naturais

Resumo

Conceitos e métodos de redes complexas provaram ser úteis para investigar vários sistemas reais de natureza distinta. A descoberta de que os métodos de redes complexas podem ser utilizados para analisar textos em seus diferentes níveis de complexidade permitiu o estudo de tarefas de processamento de línguas naturais (PLN) de uma nova perspectiva. Exemplos de tarefas estudadas através da análise topológica de redes são a identificação de palavras-chave, sumarização automática e atribuição de autoria. A última tarefa, que é o foco deste projeto, foi estudada com certo sucesso através da representação de textos pelas redes de adjacência de palavras. Embora as representações em rede tenham sido aplicadas para estudar o problema de reconhecimento de autoria, tais abordagens não superaram outros modelos tradicionais baseados em paradigmas estatísticos. Uma vez que os modelos de rede são capazes de extrair os padrões textuais que não são obtidos com modelos estatísticos tradicionais, pretendemos desenvolver sistemas híbridos que combinam ambas as técnicas tradicionais de PLN com propriedades fornecidas pela análise topológica das redes complexas. Ao combinar esses paradigmas distintos, de forma complementar, pretendemos melhorar o desempenho dos sistemas de caracterização estilísticas e de atribuição de autoria. Acredita-se que essa combinação deve, provavelmente, melhorar o desempenho de aplicações relacionadas, tais como a análise de inconsistências estilísticas, fraudes científicas e plágio. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL. Labelled network subgraphs reveal stylistic subtleties in written texts. JOURNAL OF COMPLEX NETWORKS, v. 6, n. 4, p. 620-638, . (15/05676-8, 14/20830-0, 15/23803-7, 16/19069-9)
MARINHO, VANESSA QUEIROZ; HIRST, GRAEME; AMANCIO, DIEGO RAPHAEL; IEEE. Authorship attribution via network motifs identification. PROCEEDINGS OF 2016 5TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS 2016), v. N/A, p. 6-pg., . (15/05676-8, 14/20830-0, 15/23803-7)