Busca avançada
Ano de início
Entree

VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil

Processo: 10/03785-0
Modalidade de apoio:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de agosto de 2010
Vigência (Término): 31 de dezembro de 2012
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Carolina Evaristo Scarton
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):11/22882-0 - Classificação automática de verbos na taxonomia da VerbNet, BE.EP.MS
Palavra(s)-Chave do Pesquisador:classes de Levin | Classes verbais | recursos léxicos | VerbNet | Inteligência Artificial / Processamento de Linguagem Natural

Resumo

A construção de recursos léxicos geralmente é muito custosa, pois depende de trabalhos manuais. Uma das tarefas da área de Processamento de Linguagem Natural (PLN) é facilitar este cenário fornecendo subsídios para a criação automática ou semiautomática destes recursos. Uma das abordagens utilizadas é o uso de técnicas de aprendizado de máquina em um córpus para extrair informações linguísticas. Outra abordagem é a utilização de recursos existentes para outras línguas, principalmente o inglês, visando à criação de um novo recurso alinhado. Neste projeto, verificamos a hipótese de criação de um recurso léxico para o português de mesmas características da VerbNet, diretamente alinhado com a mesma, de forma rápida e robusta. A criação se dará com base em um método composto por dois processos: um automático e um semiautomático. A VerbNet é um léxico que fornece informações semânticas e sintáticas dos verbos do inglês, independente de domínio, com base nas classes verbais de Levin e com mapeamentos para a WordNet de Princeton (WordNet). Como a WordNet está alinhada com a wordnet do Brasil (Wordnet.Br) e existem mapeamentos entre a VerbNet e a WordNet, nos aproveitaremos destas ligações para a fase automática deste projeto. Esta fase consiste de mapeamentos dos membros da VerbNet para os synsets da Wordnet.Br. Porém, as classes de Levin são dependentes de língua o que não torna possível a herança automática das informações sintáticas e semânticas da VerbNet para a VerbNet.Br. Por isso, criaremos um editor capaz de apoiar o trabalho linguístico na tarefa de validar as classes da VerbNet para o português. Neste projeto, trabalharemos somente com os casos em que as características semânticas e sintáticas sejam as mesmas tanto no inglês quanto no português.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SCARTON, CAROLINA; SUN, LIN; KIPPER-SCHULER, KARIN; DURAN, MAGALI SANCHES; PALMER, MARTHA; KORHONEN, ANNA; GELBUKH, A. Verb Clustering for Brazilian Portuguese. COMPUTATIONAL LINGUISTICS AND INTELLIGENT TEXT PROCESSING, CICLING 2014, PT I, v. 8403, p. 15-pg., . (10/03785-0, 11/22882-0)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SCARTON, Carolina Evaristo. VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil. 2013. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.