Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)

Cristina Miyuki Narukawa

Texto completo
Autor(es):	Cristina Miyuki Narukawa Número total de Autores: 1
Tipo de documento:	Dissertação de Mestrado
Imprenta:	Marília. 2014-06-11.
Instituição:	Universidade Estadual Paulista (Unesp). Faculdade de Filosofia e Ciências. Marília
Data de defesa:	2011-06-22
Orientador:	Mariângela Spotti Lopes Fujita; Isidoro Gil Leiva
Resumo
A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários... (AU)

Processo FAPESP:	08/07622-9 - O uso de linguagens documentárias alfabéticas na indexação automatizada
Beneficiário:	Cristina Miyuki Narukawa
Modalidade de apoio:	Bolsas no Brasil - Mestrado

URL curto