Busca avançada
Ano de início
Entree

Classificação automática de verbos na taxonomia da VerbNet

Processo: 11/22882-0
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Vigência (Início): 01 de abril de 2012
Vigência (Término): 31 de agosto de 2012
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Carolina Evaristo Scarton
Supervisor: Anna Korhonen
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa: University of Cambridge, Inglaterra  
Vinculado à bolsa:10/03785-0 - VerbNet.Br: construção semiautomática de um léxico verbal online e independente de domínio para o português do Brasil, BP.MS
Assunto(s):Inteligência artificial   Processamento de linguagem natural
Palavra(s)-Chave do Pesquisador:classes de Levin | classificação automática de verbos | verb clustering | VerbNet | Inteligência Artificial / Processamento de Língua Natural

Resumo

A construção de recursos léxicos geralmente é muito custosa, pois depende de trabalhos manuais. Uma das tarefas da área de Processamento de Linguagem Natural (PLN) é facilitar este cenário fornecendo subsídios para a criação automática ou semiautomática destes recursos. Uma das abordagens utilizadas é o uso de técnicas de aprendizado de máquina em um corpus para extrair informações linguísticas. Outra abordagem é cross-linguística e utiliza recursos existentes para outras línguas, principalmente o inglês, visando à criação de um novo recurso alinhado. Neste projeto, serão exploradas técnicas de aprendizado de máquina não supervisionado (agrupamento) com intuito de encontrar classes verbais sintático-semânticas para o português do Brasil - de acordo com a primeira abordagem. Especificamente, pretende-se seguir a taxonomia da VerbNet para o agrupamento de verbos. A VerbNet é um léxico que fornece informações semânticas e sintáticas dos verbos do inglês, independente de domínio, com base nas classes verbais de Levin e com mapeamentos para a WordNet de Princeton (WordNet). As classes verbais resultantes da tarefa de agrupamento serão comparadas com os resultados da VerbNet.Br (projeto de mestrado da aluna em questão). A VerbNet.Br está sendo construída utilizando os alinhamentos dos recursos léxicos computacionais: VerbNet, WordNet, WordNet.Br em um processo semiautomático - de acordo com a abordagem cross-linguística. O objetivo desta comparação é verificar se o método semiautomático (mais caro) apresenta resultados mais precisos do que os métodos de aprendizado de máquina não supervisionado (mais baratos). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SCARTON, CAROLINA; SUN, LIN; KIPPER-SCHULER, KARIN; DURAN, MAGALI SANCHES; PALMER, MARTHA; KORHONEN, ANNA; GELBUKH, A. Verb Clustering for Brazilian Portuguese. COMPUTATIONAL LINGUISTICS AND INTELLIGENT TEXT PROCESSING, CICLING 2014, PT I, v. 8403, p. 15-pg., . (10/03785-0, 11/22882-0)

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.