Busca avançada
Ano de início
Entree

Representação distribuída de textos com atualização incremental

Processo: 18/02146-6
Linha de fomento:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de agosto de 2018
Vigência (Término): 31 de julho de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Tiago Agostinho de Almeida
Beneficiário:Renato Moraes Silva
Instituição-sede: Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil
Assunto(s):Inteligência artificial   Redes neurais (computação)   Aprendizado computacional   Categorização de textos   Processamento de linguagem natural

Resumo

Na última década, com a inclusão digital e a popularização dos smartphones, o volume de informações digitais armazenadas em forma textual vem crescendo radicalmente. Com isso, a demanda por sistemas computacionais capazes de extrair conhecimento a partir de textos tem aumentado e torna-se cada vez mais fundamental. A qualidade desses sistemas é altamente influenciada pelo modelo de representação computacional dos textos, sendo que o modelo mais tradicional, o bag of words, não captura informações semânticas ou de contexto, é altamente esparso e não é capaz de refletir no tempo adequado as constantes alterações nos padrões de informações textuais geradas por aplicações como redes sociais e aplicativos de mensagens instantâneas. Até mesmo os recentes modelos de representação distribuída possuem limitações quando usados nesses cenários, pois é necessário que tais modelos possuam aprendizado incremental, uma vez que novos termos, como gírias, símbolos e abreviações, surgem com muita frequência. Diante disso, esse projeto de pesquisa tem o objetivo de propor e desenvolver uma representação distribuída de textos que possa ser atualizada incrementalmente. Para isso, técnicas não-supervisionadas de agrupamento e redes neurais recorrentes serão combinadas para associar novos termos a grupos de termos já conhecidos, capacitando o modelo a representar apropriadamente termos ainda não vistos. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BITTENCOURT, MARCIELE M.; SILVA, RENATO M.; ALMEIDA, TIAGO A. ML-MDLText: An efficient and lightweight multilabel text classifier with incremental learning. APPLIED SOFT COMPUTING, v. 96, NOV 2020. Citações Web of Science: 0.
SILVA, RENATO M.; SANTOS, RONEY L. S.; ALMEIDA, TIAGO A.; PARDO, THIAGO A. S. Towards automatically filtering fake news in Portuguese. EXPERT SYSTEMS WITH APPLICATIONS, v. 146, MAY 15 2020. Citações Web of Science: 0.
FREITAS, BRENO L.; SILVA, RENATO M.; ALMEIDA, TIAGO A. Gaussian Mixture Descriptors Learner. KNOWLEDGE-BASED SYSTEMS, v. 188, JAN 5 2020. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.