Busca avançada
Ano de início
Entree

Filogenia de textos

Processo: 14/13433-5
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2014
Data de Término da vigência: 31 de agosto de 2015
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Zanoni Dias
Beneficiário:Guilherme Duarte Marmerola
Instituição Sede: Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Filogenia   Aprendizado computacional   Árvore filogenética   Documentos   Revisão de texto
Palavra(s)-Chave do Pesquisador:Análise Forense de Documentos | Aprendizado de Máquina | Árvore Filogenética | Detecção de plágio | Filogenia Multimídia | Rastreamento de Notícias | Aprendizado de Máquina

Resumo

A redistribuição de conteúdo através da Internet, por meios legais ou ilegais, tem atraído atenção nos últimos anos em campos como ciência forense, proteção de direitos autorais, segurança e monitoramento de redes sociais. Muitas vezes, os objetos digitais envolvidos neste processo passam por um cadeia evolutiva, em que diferentes versões de um documento original surgem, criando dependências que podem ser representadas por um grafo acíclico orientado, que é conhecido na área como árvore filogenética de documentos, análoga às usadas em estudos de evolução, na Biologia. Através da análise da topologia de árvores deste tipo, é possível descobrir pistas sobre malfeitores, ou compreender como certo tipo de informação se propaga através da rede. Portanto, a reconstrução de árvores filogenéticas associadas à multimídia se apresenta como um problema importante, com grande capacidade de geração de valor e benefícios para a sociedade. A sub-área de pesquisa que estuda este problema é conhecida como Filogenia Multimídia e mostra avanço significativo em alguns tipos de mídia, como imagens e vídeo. Em ensaios preliminares, realizados pelo próprio candidato, foram obtidos resultados promissores em outro tipo particular de mídia, pouco explorado: documentos de texto. Neste projeto, propomos expandir o estudo da filogenia de textos, utilizando conjuntos de teste sintéticos e reais, visando aprimorar as etapas do processo de reconstrução que se mostraram mais desafiadoras nos primeiros estudos.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MARMEROLA, GUILHERME D.; OIKAWA, MARINA A.; DIAS, ZANONI; GOLDENSTEIN, SIOME; ROCHA, ANDERSON. On the Reconstruction of Text Phylogeny Trees: Evaluation and Analysis of Textual Relationships. PLoS One, v. 11, n. 12, . (14/19401-8, 15/19222-9, 14/13433-5, 13/08293-7, 14/03535-5)