Busca avançada
Ano de início
Entree

Métodos de agrupamento hierárquico para organização automática de resultados de motores de busca

Processo: 11/19850-9
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de janeiro de 2012
Data de Término da vigência: 31 de dezembro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Solange Oliveira Rezende
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Recuperação da informação  Motores de busca  Mineração de texto  Agrupamento de dados  Agrupamento incremental de documentos 
Palavra(s)-Chave do Pesquisador:Agrupamento fuzzy | Agrupamento Incremental | agrupamento multidrescrição | agrupamento semissupervisonado | Mineração de Textos | Motores de Busca | Inteligência Computacional

Resumo

Tradicionalmente, a recuperação de informação textual é baseada em consultas por palavras-chave, nas quais uma lista ordenada com os documentos mais relevantes à consulta é apresentada como resposta. No entanto, algumas limitações desse modelo são bem conhecidas na literatura. Em geral, os usuários exploram apenas os primeiros resultados da lista de resposta, em detrimento dos documentos considerados menos relevantes pelo motor de busca. Ainda, uma outra parte significativa de informação também é perdida devido à dificuldade dos usuários expressarem seus objetivos por meio de palavras-chave. Nesse projeto, métodos de agrupamento hierárquico de textos são explorados para auxiliar a organização dos resultados retornados por motores de busca. Os dados retornados por um ou mais motores de busca são organizados em grupos, em que itens similares e relacionados a um mesmo tema são alocados juntos em um mesmo grupo. Ainda, os grupos são organizados de maneira hierárquica, de forma que grupos próximos à raiz representam o conhecimento mais genérico, enquanto seus detalhamentos e conhecimento mais específico são dispostos nos grupos e subgrupos de níveis mais baixo. Cada grupo possui uma descrição sucinta, ou seja, um tópico que permite auxiliar o usuário em uma busca exploratória dos resultados obtidos, em diversos níveis de granularidade. Essa organização em tópicos facilita a busca pela informação de interesse, obtendo-se uma visão complementar ao modelo baseado em uma simples lista ordenada de acordo com a relevância. Por outro lado, o agrupamento de resultados de busca tem desafios e requisitos específicos. A natureza dinâmica dos dados provenientes dos motores de busca, a necessidade de eficiência computacional e a exigência de interpretação e interação por parte dos usuários, resultaram em novos requisitos, com seus respectivos desafios científicos e tecnológicos, que são objetivos de pesquisa deste projeto. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
NOGUEIRA, TATIANE M.; REZENDE, SOLANGE O.; CAMARGO, HELOISA A.; ABRAHAM, A; ZOMAYA, A; VENTURA, S; YAGER, R; SNASEL, V; MUDA, AK; SAMUEL, P. Fuzzy cluster descriptors improve flexible organization of documents. 2012 12TH INTERNATIONAL CONFERENCE ON INTELLIGENT SYSTEMS DESIGN AND APPLICATIONS (ISDA), v. N/A, p. 6-pg., . (11/19850-9)
ROSSI, RAFAEL GERALDELI; LOPES, ALNEU DE ANDRADE; FALEIROS, THIAGO DE PAULO; REZENDE, SOLANGE OLIVEIRA. Inductive Model Generation for Text Classification Using a Bipartite Heterogeneous Network. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, v. 29, n. 3, p. 361-375, . (11/12823-6, 11/23689-9, 11/19850-9)
CONRADO, MERLEY DA SILVA; LAGUNA GUTIERREZ, VICTOR ANTONIO; REZENDE, SOLANGE OLIVEIRA; MURGANTE, B; GERVASI, O; MISRA, S; NEDJAH, N; ROCHA, AMAC; TANIAR, D; APDUHAN, BO. Evaluation of Normalization Techniques in Text Classification for Portuguese. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS - ICCSA 2012, PT III, v. 7335, p. 13-pg., . (09/16142-3, 11/19850-9)