Busca avançada
Ano de início
Entree

A complex network approach to stylometry

Processo: 15/19320-0
Modalidade de apoio:Auxílio à Pesquisa - Publicações científicas - Artigo
Data de Início da vigência: 01 de novembro de 2015
Data de Término da vigência: 30 de abril de 2016
Área do conhecimento:Interdisciplinar
Pesquisador responsável:Diego Raphael Amancio
Beneficiário:Diego Raphael Amancio
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Reconhecimento de padrões  Redes complexas 
Palavra(s)-Chave do Pesquisador:Processamento de Textos | Reconhecimento de Padrões | Redes Complexas | Computação interdisciplinas

Resumo

Métodos estatísticos tem sido cada vez mais utilizados para estudar as propriedades da linguagem. Recentemente, métodos emprestados da teoria de redes e de sistemas dinâmicos se mostraram úteis para criar diversos modelos linguísticos. Apesar da grande quantidade de estudos voltados para representar textos como sistemas físicos, apenas um número limitado de estudos tem mostrado como as propriedades dos sistemas físicos podem ser aplicados para aperfeiçoar o desempenho de tarefas de processamento de línguas naturais. Neste paper, estudei este problema criando métodos que são capazes de aperfeiçoar o desempenho dos métodos estatísticos atuais. Usando uma estratégia de classificação fuzzy, mostro que as propriedades topológicas extraídas de textos complementam a forma de descrição textual tradicional. Em diversos casos, o desempenho obtido com abordagens híbridas foi maior que o desempenho obtido com abordagens tradicionais ou com métodos baseados em redes apenas. Uma vez que o modelo proposto é genérico, o arcabouço desenvolvido aqui pode ser útil para estudar aplicações textuais similares onde a topologia desempenha um papel fundamental na descrição da interação dos agentes no sistema. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)