| Processo: | 09/16142-3 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado |
| Data de Início da vigência: | 01 de julho de 2011 |
| Data de Término da vigência: | 31 de maio de 2014 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Solange Oliveira Rezende |
| Beneficiário: | Merley da Silva Conrado |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Bolsa(s) vinculada(s): | 12/09375-4 - O uso de características das palavras na extração de termos em fóruns online, BE.EP.DR |
| Assunto(s): | Inteligência artificial Mineração de texto Extração automática de termos |
| Palavra(s)-Chave do Pesquisador: | Extração de termos | lingüísticos e estatísticos | Mineração de Textos | Modelos híbridos | Inteligência Artificial |
Resumo Devido à enorme quantidade de informação no formato textual disponível atualmente no universo digital, torna-se necessário transformá-la de forma automática ou semi-automática em conhecimento útil organizado. O processo de Mineração de Textos tem sido muito utilizado para esse fim, sendo que um dos passos mais importantes desse processo é a extração de termos. Estes termos exercem grande influência no resultado final, uma vez que são eles que representam o domínio de conhecimento explorado. Sendo assim, é de vital importância para a eficiência do processo garantir a qualidade dos termos obtidos. Os termos podem ser extraídos utilizando a abordagem estatística, que em geral é barata computacionalmente, e a abordagem linguística, que normalmente obtém resultados melhores do que a estatística. Neste sentido, uma abordagem interessante é a adoção de modelos híbridos, dado que estes agregam as vantagens e desvantagens das abordagens estatística e linguística. Devido a este fato e a lacuna considerável de trabalhos envolvendo pesquisas nesta área voltadas exclusivamente a bases de textos não-supervisionadas na língua Portuguesa, este projeto de pesquisa visa explorar e propor um modelo de extração de termos envolvendo abordagens híbridas para o contexto de Mineração de Textos direcionado à língua Portuguesa. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |