| Processo: | 11/23689-9 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado |
| Data de Início da vigência: | 01 de junho de 2012 |
| Data de Término da vigência: | 10 de maio de 2016 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação |
| Pesquisador responsável: | Alneu de Andrade Lopes |
| Beneficiário: | Thiago de Paulo Faleiros |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Bolsa(s) vinculada(s): | 13/15353-6 - Avaliação do modelo sintático de tópico, BE.EP.DR |
| Assunto(s): | Inteligência computacional Mineração de texto |
| Palavra(s)-Chave do Pesquisador: | Algoritmo online | Aprendizado de Máquinas em Ambiente Dinâmico | Clustering Data Stream | Extração de Tópicos | Mineração de Dados Textuais | Inteligência Computacional |
Resumo Uma grande quantidade de pesquisa é dedicada a mineração de dados dinâmicos (Data Streams) que, em geral, contém grandes volumes de informação contínua, são multi-dimensionais e de alta velocidade. Tais dados são comuns em aplicações diárias, tais como chamadas telefônicas, vendas no varejo, desempenho de data center, operações de produção, entre outras. Uma instância específica desse problema é a exploração e mineração de coleções em fluxo contínuo de dados textuais. Tal área, na qual analistas estão interessados na percepção do comportamento e tendências desses dados, além de relevante, ainda impõe inúmeros desafios a pesquisadores. Nesse contexto, este projeto tem o objetivo de investigar técnicas inovadoras em mineração de textos para extração de tópicos em fluxo de dados. Os dados considerados são grandes coleções de textos, tipicamente notícias, conteúdo de web-logs etc. As publicações desses dados acontecem em tempo real, o que resulta em constantes alterações na distribuição dos tópicos. Assim, o escopo desta proposta compreende todas as etapas de mineração de textos relacionadas com a extração de tópicos em fluxo de dados. Para isso, serão exploradas e desenvolvidas tecnologias em mineração de textos para a extração e identificação das alterações de tópicos altamente dinâmicos, extração de informação ao longo do tempo e categorização dos textos em relação a sua cobertura temporal. Os resultados desse projeto de doutorado serão validados por meio de corpus e técnicas disponíveis na comunidade de mineração de texto e Data Streaming. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |