Busca avançada
Ano de início
Entree

Filogenia de textos

Processo: 14/13433-5
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de setembro de 2014
Vigência (Término): 31 de agosto de 2015
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Zanoni Dias
Beneficiário:Guilherme Duarte Marmerola
Instituição-sede: Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Aprendizado computacional

Resumo

A redistribuição de conteúdo através da Internet, por meios legais ou ilegais, tem atraído atenção nos últimos anos em campos como ciência forense, proteção de direitos autorais, segurança e monitoramento de redes sociais. Muitas vezes, os objetos digitais envolvidos neste processo passam por um cadeia evolutiva, em que diferentes versões de um documento original surgem, criando dependências que podem ser representadas por um grafo acíclico orientado, que é conhecido na área como árvore filogenética de documentos, análoga às usadas em estudos de evolução, na Biologia. Através da análise da topologia de árvores deste tipo, é possível descobrir pistas sobre malfeitores, ou compreender como certo tipo de informação se propaga através da rede. Portanto, a reconstrução de árvores filogenéticas associadas à multimídia se apresenta como um problema importante, com grande capacidade de geração de valor e benefícios para a sociedade. A sub-área de pesquisa que estuda este problema é conhecida como Filogenia Multimídia e mostra avanço significativo em alguns tipos de mídia, como imagens e vídeo. Em ensaios preliminares, realizados pelo próprio candidato, foram obtidos resultados promissores em outro tipo particular de mídia, pouco explorado: documentos de texto. Neste projeto, propomos expandir o estudo da filogenia de textos, utilizando conjuntos de teste sintéticos e reais, visando aprimorar as etapas do processo de reconstrução que se mostraram mais desafiadoras nos primeiros estudos.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MARMEROLA, GUILHERME D.; OIKAWA, MARINA A.; DIAS, ZANONI; GOLDENSTEIN, SIOME; ROCHA, ANDERSON. On the Reconstruction of Text Phylogeny Trees: Evaluation and Analysis of Textual Relationships. PLoS One, v. 11, n. 12 DEC 19 2016. Citações Web of Science: 4.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.