Bolsa 09/16142-3 - Inteligência artificial, Mineração de texto

Processo:	09/16142-3
Modalidade de apoio:	Bolsas no Brasil - Doutorado
Data de Início da vigência:	01 de julho de 2011
Data de Término da vigência:	31 de maio de 2014
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Solange Oliveira Rezende
Beneficiário:	Merley da Silva Conrado

Instituição Sede:	Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil

Bolsa(s) vinculada(s):	12/09375-4 - O uso de características das palavras na extração de termos em fóruns online, BE.EP.DR

Assunto(s):	Inteligência artificial Mineração de texto Extração automática de termos
Palavra(s)-Chave do Pesquisador:	Extração de termos \| lingüísticos e estatísticos \| Mineração de Textos \| Modelos híbridos \| Inteligência Artificial
Resumo Devido à enorme quantidade de informação no formato textual disponível atualmente no universo digital, torna-se necessário transformá-la de forma automática ou semi-automática em conhecimento útil organizado. O processo de Mineração de Textos tem sido muito utilizado para esse fim, sendo que um dos passos mais importantes desse processo é a extração de termos. Estes termos exercem grande influência no resultado final, uma vez que são eles que representam o domínio de conhecimento explorado. Sendo assim, é de vital importância para a eficiência do processo garantir a qualidade dos termos obtidos. Os termos podem ser extraídos utilizando a abordagem estatística, que em geral é barata computacionalmente, e a abordagem linguística, que normalmente obtém resultados melhores do que a estatística. Neste sentido, uma abordagem interessante é a adoção de modelos híbridos, dado que estes agregam as vantagens e desvantagens das abordagens estatística e linguística. Devido a este fato e a lacuna considerável de trabalhos envolvendo pesquisas nesta área voltadas exclusivamente a bases de textos não-supervisionadas na língua Portuguesa, este projeto de pesquisa visa explorar e propor um modelo de extração de termos envolvendo abordagens híbridas para o contexto de Mineração de Textos direcionado à língua Portuguesa. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

CONRADO, MERLEY DA SILVA; LAGUNA GUTIERREZ, VICTOR ANTONIO; REZENDE, SOLANGE OLIVEIRA; MURGANTE, B; GERVASI, O; MISRA, S; NEDJAH, N; ROCHA, AMAC; TANIAR, D; APDUHAN, BO. Evaluation of Normalization Techniques in Text Classification for Portuguese. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS - ICCSA 2012, PT III, v. 7335, p. 13-pg., 2012-01-01. (09/16142-3, 11/19850-9)

URL curto