Busca avançada
Ano de início
Entree

Desambiguação de palavras via algoritmos semissupervisionados baseados em grafos

Processo: 18/09465-0
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de dezembro de 2018
Situação:Interrompido
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Convênio/Acordo: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Lilian Berton
Beneficiário:Samuel Bruno da Silva Sousa
Instituição-sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos, SP, Brasil
Assunto(s):Inteligência computacional

Resumo

A desambiguação do sentido da palavra é um problema aberto do Processamento de Linguagem Natural, que visa identificar o sentido apropriado de uma palavra em algum contexto. Muitas abordagens têm sido propostas para resolver o problema, como a Aprendizagem Baseada em Conhecimento, Supervisionada e Não Supervisionada. O Aprendizado Semissupervisionado tornou-se recentemente uma área de pesquisa ativa que requer uma pequena quantidade de dados de treinamento rotulados juntamente com muitos dados não rotulados. Neste projeto, propomos empregar o aprendizado semissupervisionado baseado em grafos para desambiguação de palavras. O grafo será construído de acordo com os sentidos das palavras vizinhas. Um algoritmo de propagação de rótulos será executado no grafo de palavras para espalhar o sentido de vértices rotulados para os não-rotulados atribuindo o sentido mais apropriado para cada palavra. Investigaremos diferentes medidas de similaridade para palavras/documentos, proporemos novos métodos para construção de grafo-de-palavras e analisaremos diferentes algoritmos de propagação de rótulos. As abordagens propostas serão avaliadas em conjuntos de dados de benchmarks da área, especialmente em tarefas de desambiguação de todas as palavras.