| Processo: | 11/23323-4 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado |
| Data de Início da vigência: | 01 de maio de 2012 |
| Data de Término da vigência: | 01 de abril de 2016 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Thiago Alexandre Salgueiro Pardo |
| Beneficiário: | Erick Galani Maziero |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Bolsa(s) vinculada(s): | 14/11632-0 - Exploração de aprendizado semissupervisionado e sem fim de uma abordagem de parsing discursivo, BE.EP.DR |
| Assunto(s): | Aprendizado computacional Processamento de linguagem natural Linguística computacional |
| Palavra(s)-Chave do Pesquisador: | Análise Discursiva Automática | Aprendizado de Máquina | Linguística Computacional | Rhetorical Struture Theory | Processamento de Linguagem Natural |
Resumo A análise discursiva é uma tarefa de base amplamente utilizada na área de Processamento de Linguagem Natural, subsidiando desde tarefas de análise de fenômenos linguísticos até aplicações sofisticadas, como sumarização automática e perguntas e respostas. Enquanto para algumas línguas há analisadores discursivos automáticos de bom desempenho, para a língua portuguesa tem-se apenas uma metodologia simbólica que se utiliza de padrões discursivos para a identificação de estruturas discursivas. Objetiva-se, neste projeto, a proposta e a exploração de métodos de análise discursiva automática, especialmente para o português, numa abordagem híbrida simbólico-estatística, a fim de aumentar o desempenho obtido até então e avançar o estado da arte. Em particular, para produzir análises automáticas de maior qualidade, visa-se à utilização de grande quantidade de dados provenientes da web e de córpus anotados já existentes, fazendo-se uso principalmente de técnicas de aprendizado de máquina semi-supervisionadas e não supervisionadas, de forma que a limitação da quantidade de dados seja superada. Dentre os modelos discursivos disponíveis, será seguida a Rhetorical Structure Theory (RST), já tradicional na área e de grande utilidade para diversas aplicações. Além de contribuições práticas pela criação e disponibilização de uma nova ferramenta de análise textual, acredita-se que este projeto tem grande potencial de produzir contribuições teóricas significativas, como a modelagem da tarefa em questão e a proposta de uma estratégia de aprendizado dedicada à questão do discurso. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |