Busca avançada
Ano de início
Entree

Análise retórica automática com base em grande quantidade de dados

Processo: 11/23323-4
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de maio de 2012
Data de Término da vigência: 01 de abril de 2016
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Erick Galani Maziero
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):14/11632-0 - Exploração de aprendizado semissupervisionado e sem fim de uma abordagem de parsing discursivo, BE.EP.DR
Assunto(s):Aprendizado computacional   Processamento de linguagem natural   Linguística computacional
Palavra(s)-Chave do Pesquisador:Análise Discursiva Automática | Aprendizado de Máquina | Linguística Computacional | Rhetorical Struture Theory | Processamento de Linguagem Natural

Resumo

A análise discursiva é uma tarefa de base amplamente utilizada na área de Processamento de Linguagem Natural, subsidiando desde tarefas de análise de fenômenos linguísticos até aplicações sofisticadas, como sumarização automática e perguntas e respostas. Enquanto para algumas línguas há analisadores discursivos automáticos de bom desempenho, para a língua portuguesa tem-se apenas uma metodologia simbólica que se utiliza de padrões discursivos para a identificação de estruturas discursivas. Objetiva-se, neste projeto, a proposta e a exploração de métodos de análise discursiva automática, especialmente para o português, numa abordagem híbrida simbólico-estatística, a fim de aumentar o desempenho obtido até então e avançar o estado da arte. Em particular, para produzir análises automáticas de maior qualidade, visa-se à utilização de grande quantidade de dados provenientes da web e de córpus anotados já existentes, fazendo-se uso principalmente de técnicas de aprendizado de máquina semi-supervisionadas e não supervisionadas, de forma que a limitação da quantidade de dados seja superada. Dentre os modelos discursivos disponíveis, será seguida a Rhetorical Structure Theory (RST), já tradicional na área e de grande utilidade para diversas aplicações. Além de contribuições práticas pela criação e disponibilização de uma nova ferramenta de análise textual, acredita-se que este projeto tem grande potencial de produzir contribuições teóricas significativas, como a modelagem da tarefa em questão e a proposta de uma estratégia de aprendizado dedicada à questão do discurso.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
MAZIERO, Erick Galani. Análise retórica com base em grande quantidade de dados. 2016. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.