Busca avançada
Ano de início
Entree

Tipologia de tracos linguisticos de textos do portugues do brasil dos seculos xvi, xvii e xviii: uma proposta para classificacao automatica de generos textuais.

Processo: 07/52655-0
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de setembro de 2007
Data de Término da vigência: 31 de agosto de 2009
Área de conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Gladis Maria de Barcellos Almeida
Beneficiário:Jacqueline Aparecida de Souza
Instituição Sede: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Assunto(s):Aprendizado computacional   Linguística de corpus
Palavra(s)-Chave do Pesquisador:Aprendizado De Maquina | Classificacao Automatica | Genero Textual | Linguistica De Corpus

Resumo

A partir de um corpus do português dos séculos XVI, XVII e XVIII, obtido a partir do projeto Dicionário Histórico do Português Brasil, inserido no programa Institutos do Milênio/CNPq, pretende-se descrever os traços lingüísticos característicos esses textos, correlacionando-os a seus respectivos gêneros, e propor uma tipologia de traços de forma que seja possível identificar o gênero de cada texto automaticamente. A importância de um trabalho que extrai traços de gêneros de documentos se dá primeiro pelo trabalho descritivo em si. Entretanto, o aspecto mais relevante para o contexto atual, em que se tem um enorme conjunto de documentos a serem recuperados na Internet, é que este conhecimento possibilita a construção de programas computacionais (chamados classificadores) que utilizam esses traços para recuperar documentos com certas características. Para as tarefas de recuperação de informação, mineração de textos e categorização de textos é de extrema importância conhecer os traços distintivos de um documento, para que seja possível recuperá-lo no conjunto de uma coleção de textos. Para tanto, essa pesquisa deverá basear-se nos postulados teórico-metodológicos da Lingüística de Corpus e nos conceitos operacionais de gênero do ponto de vista computacional, tais como os propostos por Swales (1990) e Marcuschi (2002, 2005). No que concerne aos aspectos referentes à aplicação computacional propriamente dita, esta pesquisa contará com a colaboração de um mestrando integrante do NILC/ICMC-USP, campus de São Carlos. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)