| Processo: | 17/09387-6 |
| Modalidade de apoio: | Auxílio à Pesquisa - Regular |
| Data de Início da vigência: | 01 de setembro de 2017 |
| Data de Término da vigência: | 29 de fevereiro de 2020 |
| Área do conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Pesquisador responsável: | Tiago Agostinho de Almeida |
| Beneficiário: | Tiago Agostinho de Almeida |
| Instituição Sede: | Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil |
| Município da Instituição Sede: | Sorocaba |
| Pesquisadores associados: | Renato Moraes Silva |
| Assunto(s): | Inteligência artificial Aprendizado computacional Processamento de linguagem natural Categorização de textos |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | Categorização de texto | Processamento de Linguagem Natural | Inteligência Artificial |
Resumo
O aumento no volume de dados não-estruturados produzidos pela humanidade motivou a utilização de máquinas para executar tarefas que antes eram tradicionalmente realizadas por humanos, tais como tradução, transcrição, análise de opinião, entre outras. Apesar de existir dezenas de métodos de categorização de textos disponíveis, um desafio ainda em aberto é encontrar uma representação computacional capaz de capturar o significado semântico dos textos e aumentar continuamente o vocabulário, bem como evoluir o conhecimento a respeito das relações existentes entre termos e sentenças. Com os modelos de representação existentes, alterações nos padrões dos textos não são rapidamente refletidas no modelo que os representa computacionalmente. Portanto, em cenários nos quais o padrão textual é dinâmico e altera-se com frequência, os modelos de representação disponíveis demandam longo tempo e custo de adaptação. Nesse contexto, o cenário de textos curtos e ruidosos, comumente presente na comunicação por texto via web e smartphones, é uma das aplicações que demanda modelos incrementais, pois termos novos podem surgir o tempo todo, tais como símbolos, gírias e abreviações. Assim, este projeto de pesquisa propõe utilizar técnicas não-supervisionadas de agrupamento e redes neurais recorrentes para criar um modelo computacional de representação de texto capaz de aprender continuamente, associando novos termos a grupos de termos já conhecidos, permitindo que termos ainda não vistos tenham relevância e sejam compreendidos pelo modelo existente. (AU)
| Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio: |
| Mais itensMenos itens |
| TITULO |
| Matéria(s) publicada(s) em Outras Mídias ( ): |
| Mais itensMenos itens |
| VEICULO: TITULO (DATA) |
| VEICULO: TITULO (DATA) |