Busca avançada
Ano de início
Entree

Elaboração de ferramentas computacionais para construção e uso do Corpus do português histórico Tycho Brahe

Processo: 08/04312-9
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de junho de 2008
Data de Término da vigência: 30 de novembro de 2009
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Charlotte Marie Chambelland Galves
Beneficiário:Pablo Picasso Feliciano de Faria
Instituição Sede: Instituto de Estudos da Linguagem (IEL). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:04/03643-0 - Padrões rítmicos, fixação de parâmetros e mudança lingüística, fase 2, AP.TEM
Assunto(s):Linguística de corpus
Palavra(s)-Chave do Pesquisador:corpus anotado | corpus do português histórico | ferramentas de busca | Linguística de Corpus

Resumo

O programa de atividades proposto se insere no primeiro objetivo do projeto temático Padrões rítmicos, fixação de parâmetros e mudança linguística, Fase II (processo Fapesp 2004/03643-0) : a ampliação e consolidação do Corpus Tycho Brahe (http://ime.usp.br/~tycho/corpus). O programa desta bolsa consiste em duas partes: 1) desenvolvimento de interfaces que tornarão as funcionalidades do Corpus mais acessíveis à comunidade acadêmica: - Disponibilização do etiquetador morfológico on-line; - Disponibilização de ferramenta amigável de buscas variadas, por etiqueta e por palavra; - Disponibilização de ferramenta amigável para buscar frases com base em expressões regulares. 2) desenvolvimento de pequenos programas computacionais que agilizem a preparação dos textos para a aplicação de ferramentas automáticas de anotação, ou a sua adaptação às modificações estabelecidas no sistema de anotação: - interface para modernização dos textos em linguagem XML (E-Dictor) - programa de transformação automática das palavras com contração de pronomes ou artigos e suas respectivas etiquetas, em palavras independentes com etiquetas independentes. Administração geral do Site do Corpus.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)