Busca avançada
Ano de início
Entree

Desambiguação de palavras via algoritmos semissupervisionados baseados em grafos

Processo: 18/09465-0
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de dezembro de 2018
Data de Término da vigência: 31 de janeiro de 2020
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Acordo de Cooperação: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Lilian Berton
Beneficiário:Samuel Bruno da Silva Sousa
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Assunto(s):Inteligência computacional
Palavra(s)-Chave do Pesquisador:Aprendizado Semissupervisionado | Desambiguação de palavras | Métodos baseados em grafos | Processamento de Textos | Propagação de rótulos | Inteligência Computacional

Resumo

A desambiguação do sentido da palavra é um problema aberto do Processamento de Linguagem Natural, que visa identificar o sentido apropriado de uma palavra em algum contexto. Muitas abordagens têm sido propostas para resolver o problema, como a Aprendizagem Baseada em Conhecimento, Supervisionada e Não Supervisionada. O Aprendizado Semissupervisionado tornou-se recentemente uma área de pesquisa ativa que requer uma pequena quantidade de dados de treinamento rotulados juntamente com muitos dados não rotulados. Neste projeto, propomos empregar o aprendizado semissupervisionado baseado em grafos para desambiguação de palavras. O grafo será construído de acordo com os sentidos das palavras vizinhas. Um algoritmo de propagação de rótulos será executado no grafo de palavras para espalhar o sentido de vértices rotulados para os não-rotulados atribuindo o sentido mais apropriado para cada palavra. Investigaremos diferentes medidas de similaridade para palavras/documentos, proporemos novos métodos para construção de grafo-de-palavras e analisaremos diferentes algoritmos de propagação de rótulos. As abordagens propostas serão avaliadas em conjuntos de dados de benchmarks da área, especialmente em tarefas de desambiguação de todas as palavras.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SOUSA, SAMUEL; MILIOS, EVANGELOS; BERTON, LILIAN; IEEE. Word sense disambiguation: an evaluation study of semi-supervised approaches with word embeddings. 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (18/01722-3, 18/09465-0)
DUARTE, JOSE MARCIO; SOUSA, SAMUEL; MILIOS, EVANGELOS; BERTON, LILIAN. Deep analysis of word sense disambiguation via semi-supervised learning and neural word representations. INFORMATION SCIENCES, v. 570, p. 278-297, . (18/01722-3, 18/09465-0)