Busca avançada
Ano de início
Entree

Análise de dados heterogêneos para detecção de eventos

Processo: 18/16214-3
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de dezembro de 2018
Vigência (Término): 29 de fevereiro de 2020
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Zanoni Dias
Beneficiário:Caroline Mazini Rodrigues
Instituição-sede: Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:17/12646-3 - Déjà vu: coerência temporal, espacial e de caracterização de dados heterogêneos para análise e interpretação de integridade, AP.TEM
Assunto(s):Aprendizado computacional

Resumo

Considerando a ocorrência de um evento com grande impacto social, é importante estabelecer uma relação espaço-temporal das informações dispon1veis e assim, responder algumas questões sobre o evento como "quem", "como", "onde" e o "porquê". Este trabalho é parte do projeto temático FAPESP "DéjàVu: Feature-Space-Time Coherence from Heterogeneous Data for Media Integrity Analytics and Interpretation of Events" e propõe, a partir de dados coletados de redes sociais, determinar a relevância destes para o evento analisado, possibilitando a correta construção de relações entre esses dados durante a etapa de análise. Os principais desafios deste trabalho são as caracter1sticas dos dados que serão utilizados: heterogeneidade, já que são obtidos de diferentes fontes; multimodalidade, incluindo textos, imagens e v1deos; não-rotulação, não apresentando rótulos de relevância para o evento; e não-estruturação, já que não possuem caracter1sticas que possam ser utilizadas diretamente durante o aprendizado. Para determinar a relevância de itens analisados, será seguida uma sequência de etapas que incluem: preparação dos dados, onde eliminaremos redundâncias e rotularemos parte dos dados; engenharia de caracter1sticas, onde extrairemos caracter1sticas visuais e textuais; aprendizado de máquina, onde analisaremos técnicas de aprendizado não supervisionado e semi-supervisionado; e, validação e análise dos resultados, onde avaliaremos as soluções obtidas.