| Processo: | 18/02146-6 |
| Modalidade de apoio: | Bolsas no Brasil - Pós-Doutorado |
| Data de Início da vigência: | 01 de agosto de 2018 |
| Data de Término da vigência: | 31 de julho de 2021 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Pesquisador responsável: | Tiago Agostinho de Almeida |
| Beneficiário: | Renato Moraes Silva |
| Instituição Sede: | Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil |
| Assunto(s): | Inteligência artificial Redes neurais (computação) Aprendizado computacional Categorização de textos Processamento de linguagem natural |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | Categorização de texto | Processamento de Linguagem Natural | Representação Vetorial Distribuída | Inteligência Artificial |
Resumo Na última década, com a inclusão digital e a popularização dos smartphones, o volume de informações digitais armazenadas em forma textual vem crescendo radicalmente. Com isso, a demanda por sistemas computacionais capazes de extrair conhecimento a partir de textos tem aumentado e torna-se cada vez mais fundamental. A qualidade desses sistemas é altamente influenciada pelo modelo de representação computacional dos textos, sendo que o modelo mais tradicional, o bag of words, não captura informações semânticas ou de contexto, é altamente esparso e não é capaz de refletir no tempo adequado as constantes alterações nos padrões de informações textuais geradas por aplicações como redes sociais e aplicativos de mensagens instantâneas. Até mesmo os recentes modelos de representação distribuída possuem limitações quando usados nesses cenários, pois é necessário que tais modelos possuam aprendizado incremental, uma vez que novos termos, como gírias, símbolos e abreviações, surgem com muita frequência. Diante disso, esse projeto de pesquisa tem o objetivo de propor e desenvolver uma representação distribuída de textos que possa ser atualizada incrementalmente. Para isso, técnicas não-supervisionadas de agrupamento e redes neurais recorrentes serão combinadas para associar novos termos a grupos de termos já conhecidos, capacitando o modelo a representar apropriadamente termos ainda não vistos. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |