| Processo: | 10/20564-8 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado |
| Data de Início da vigência: | 01 de junho de 2011 |
| Data de Término da vigência: | 28 de fevereiro de 2013 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Pesquisador responsável: | Solange Oliveira Rezende |
| Beneficiário: | Ricardo Marcondes Marcacini |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Assunto(s): | Inteligência computacional Mineração de texto Aprendizado computacional Algoritmos Agrupamento incremental de documentos |
| Palavra(s)-Chave do Pesquisador: | Agrupamento de Documentos | Agrupamento Incremental | Aprendizado Multidescrição | Mineração de Textos | Inteligência Computacional |
Resumo Métodos de agrupamento hieráquico e incremental de textos são úteis para organização não supervisionada de coleções textuais dinâmicas em grupos, sumarizando o conhecimento implícito nos textos. Nestes métodos, o agrupamento resultante é disposto de maneira hierárquica, em que grupos e subgrupos representam um tópico de conhecimento da coleção, provendo um meio intuitivo para explorar o conhecimento. Ainda, eles possiblitam a incorporação de novo conhecimento sem reprocessamento redundante, uma vez que apenas informações inseridas, removidas ou atualizadas são consideradas, ou seja, o agrupamento é realizado de maneira incremental. No entanto, as abordagens existentes para agrupamento hierárquico e incremental possuem limitações que afetam a qualidade dos resultados. Entre as limitações, um problema relevante ocorre durante a tarefa incremental: quando novos documentos apresentados ao agrupamento são alocados em grupos errados, este erro é propagado para as próximas iterações e faz com que o modelo final tenha seu desempenho degradado. Esse problema é típico em agrupamento incremental e explorar formas de solucioná-lo é útil e necessário para diversas aplicações relacionadas à organização de informação. Ainda, as coleções de textos podem ser representadas por diferentes meios, no qual conjuntos de informações diferentes se referem ao mesmo documento, e cada conjunto de informação é capaz de descrever de maneira independente o documento de interesse. Assim, uma direção importante de pesquisa, denominada aprendizado multidescrição, foca em usar as diferentes descrições dos textos para aumentar a confiança de uma tarefa de aprendizado, porém, é uma tema em aberto e não explorado em agrupamento incremental. Desta forma, o presente projeto de doutorado visa investigar o uso de aprendizado multidescricão em tarefas de agrupamento hierárquico e incremental, com foco em coleções de textos dinâmicas e, assim, explorar de maneira efetiva as várias descrições dos textos para aumentar a qualidade do agrupamento hierárquico incremental. A ideia se baseia no princípio de maximização do consenso entre múltiplas hipóteses, que considera que o aprendizado é melhorado utilizando o consenso de todas descrições do conjunto de dados. Com isto, espera-se oferecer uma nova abordagem para agrupamento hierárquico e incremental de textos capaz de manter a representação do conhecimento sempre válida e atualizada e permitindo a descoberta de conhecimento nos cenários atuais, caracterizados pela alta frequência de publicação e atualização das informações (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |