| Processo: | 15/23803-7 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Mestrado |
| Data de Início da vigência: | 01 de março de 2016 |
| Data de Término da vigência: | 31 de agosto de 2016 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Diego Raphael Amancio |
| Beneficiário: | Vanessa Queiroz Marinho |
| Supervisor: | Graeme Hirst |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Instituição Anfitriã: | University of Toronto (U of T), Canadá |
| Vinculado à bolsa: | 15/05676-8 - Desenvolvimento de novos modelos para reconhecimento de autoria com a utilização de redes complexas, BP.MS |
| Assunto(s): | Processamento de texto Processamento de linguagem natural Teoria dos grafos Reconhecimento de padrões Redes complexas |
| Palavra(s)-Chave do Pesquisador: | Atribuição de Autoria | Processamento de texto | Reconhecimento de Padrões | Redes Complexas | teoria dos grafos | Processamento de Línguas Naturais |
Resumo Conceitos e métodos de redes complexas provaram ser úteis para investigar vários sistemas reais de natureza distinta. A descoberta de que os métodos de redes complexas podem ser utilizados para analisar textos em seus diferentes níveis de complexidade permitiu o estudo de tarefas de processamento de línguas naturais (PLN) de uma nova perspectiva. Exemplos de tarefas estudadas através da análise topológica de redes são a identificação de palavras-chave, sumarização automática e atribuição de autoria. A última tarefa, que é o foco deste projeto, foi estudada com certo sucesso através da representação de textos pelas redes de adjacência de palavras. Embora as representações em rede tenham sido aplicadas para estudar o problema de reconhecimento de autoria, tais abordagens não superaram outros modelos tradicionais baseados em paradigmas estatísticos. Uma vez que os modelos de rede são capazes de extrair os padrões textuais que não são obtidos com modelos estatísticos tradicionais, pretendemos desenvolver sistemas híbridos que combinam ambas as técnicas tradicionais de PLN com propriedades fornecidas pela análise topológica das redes complexas. Ao combinar esses paradigmas distintos, de forma complementar, pretendemos melhorar o desempenho dos sistemas de caracterização estilísticas e de atribuição de autoria. Acredita-se que essa combinação deve, provavelmente, melhorar o desempenho de aplicações relacionadas, tais como a análise de inconsistências estilísticas, fraudes científicas e plágio. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |