Busca avançada
Ano de início
Entree

Exploração de aprendizado semissupervisionado e sem fim de uma abordagem de parsing discursivo

Processo: 14/11632-0
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Doutorado
Vigência (Início): 01 de setembro de 2014
Vigência (Término): 31 de agosto de 2015
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Erick Galani Maziero
Supervisor no Exterior: Graeme Hirst
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa : University of Toronto (U of T), Canadá  
Vinculado à bolsa:11/23323-4 - Análise retórica automática com base em grande quantidade de dados, BP.DR
Assunto(s):Linguística computacional

Resumo

(Contexto) O Processamento da Linguagem Natural (PLN) é uma área instigadora cujo alvo é proporcionar o entendimento e a geração automáticos de textos. Esse processamento ocorre em diversos níveis e um deles é o discurso, em que se ocupa dos objetivos e intenções do autor do texto. Um texto possui uma estrutura elaborada, que relaciona todo o seu conteúdo, atribuindo-lhe coerência. Diversas metodologias têm sido empregadas na análise automática do discurso, dentre elas abordagens baseadas em padrões lexicais, modelos probabilísticos e modelos de classificação provindos de técnicas de aprendizado de máquina. (Lacunas) As abordagens citadas dependem de dados anotados, que são custosos de se obter, tornando potencial a utilização de aprendizado semissupervisionado que se adeque à escassez de informação, generalizando eficientemente o conhecimento obtido com os poucos dados anotados. (Objetivos) Esse trabalho tem como objetivo principal a exploração do parser HILDA em um cenário de aprendizado semissupervisionado e sem fim com grande quantidade de dados. Outros objetivos incluem melhorar o aprendizado com a incorporação de novos atributos e exploração de agrupamentos das relações retóricas no aprendizado. A avaliação desta pesquisa será realizada tanto intrínseca, quanto extrinsecamente, com a aplicação do parser discursivo resultante em tarefas de interesse dos grupos de pesquisa envolvidos.(Hipóteses) Parte-se da hipótese de que o uso de abordagens semissupervisionadas de aprendizado possibilitará alcançar bons resultados, dada a escassez de informações anotadas para o parsing discursivo. Outras hipóteses dizem respeito à plausibilidade dos novos atributos propostos nesta pesquisa para a análise discursiva e que agrupamentos das relações retóricas podem beneficiar os algoritmos de aprendizado automático. (AU)