Busca avançada
Ano de início
Entree

Modelo híbrido de extração de termos aplicado na mineração de textos

Processo: 09/16142-3
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de julho de 2011
Data de Término da vigência: 31 de maio de 2014
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Merley da Silva Conrado
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):12/09375-4 - O uso de características das palavras na extração de termos em fóruns online, BE.EP.DR
Assunto(s):Inteligência artificial   Mineração de texto   Extração automática de termos
Palavra(s)-Chave do Pesquisador:Extração de termos | lingüísticos e estatísticos | Mineração de Textos | Modelos híbridos | Inteligência Artificial

Resumo

Devido à enorme quantidade de informação no formato textual disponível atualmente no universo digital, torna-se necessário transformá-la de forma automática ou semi-automática em conhecimento útil organizado. O processo de Mineração de Textos tem sido muito utilizado para esse fim, sendo que um dos passos mais importantes desse processo é a extração de termos. Estes termos exercem grande influência no resultado final, uma vez que são eles que representam o domínio de conhecimento explorado. Sendo assim, é de vital importância para a eficiência do processo garantir a qualidade dos termos obtidos. Os termos podem ser extraídos utilizando a abordagem estatística, que em geral é barata computacionalmente, e a abordagem linguística, que normalmente obtém resultados melhores do que a estatística. Neste sentido, uma abordagem interessante é a adoção de modelos híbridos, dado que estes agregam as vantagens e desvantagens das abordagens estatística e linguística. Devido a este fato e a lacuna considerável de trabalhos envolvendo pesquisas nesta área voltadas exclusivamente a bases de textos não-supervisionadas na língua Portuguesa, este projeto de pesquisa visa explorar e propor um modelo de extração de termos envolvendo abordagens híbridas para o contexto de Mineração de Textos direcionado à língua Portuguesa. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CONRADO, MERLEY DA SILVA; LAGUNA GUTIERREZ, VICTOR ANTONIO; REZENDE, SOLANGE OLIVEIRA; MURGANTE, B; GERVASI, O; MISRA, S; NEDJAH, N; ROCHA, AMAC; TANIAR, D; APDUHAN, BO. Evaluation of Normalization Techniques in Text Classification for Portuguese. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS - ICCSA 2012, PT III, v. 7335, p. 13-pg., . (09/16142-3, 11/19850-9)