Busca avançada
Ano de início
Entree

Representação distribuída de textos com atualização incremental

Processo: 18/02146-6
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de agosto de 2018
Vigência (Término): 31 de julho de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Tiago Agostinho de Almeida
Beneficiário:Renato Moraes Silva
Instituição Sede: Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil
Assunto(s):Inteligência artificial   Redes neurais (computação)   Aprendizado computacional   Categorização de textos   Processamento de linguagem natural
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Categorização de texto | Processamento de Linguagem Natural | Representação Vetorial Distribuída | Inteligência Artificial

Resumo

Na última década, com a inclusão digital e a popularização dos smartphones, o volume de informações digitais armazenadas em forma textual vem crescendo radicalmente. Com isso, a demanda por sistemas computacionais capazes de extrair conhecimento a partir de textos tem aumentado e torna-se cada vez mais fundamental. A qualidade desses sistemas é altamente influenciada pelo modelo de representação computacional dos textos, sendo que o modelo mais tradicional, o bag of words, não captura informações semânticas ou de contexto, é altamente esparso e não é capaz de refletir no tempo adequado as constantes alterações nos padrões de informações textuais geradas por aplicações como redes sociais e aplicativos de mensagens instantâneas. Até mesmo os recentes modelos de representação distribuída possuem limitações quando usados nesses cenários, pois é necessário que tais modelos possuam aprendizado incremental, uma vez que novos termos, como gírias, símbolos e abreviações, surgem com muita frequência. Diante disso, esse projeto de pesquisa tem o objetivo de propor e desenvolver uma representação distribuída de textos que possa ser atualizada incrementalmente. Para isso, técnicas não-supervisionadas de agrupamento e redes neurais recorrentes serão combinadas para associar novos termos a grupos de termos já conhecidos, capacitando o modelo a representar apropriadamente termos ainda não vistos. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (6)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BITTENCOURT, MARCIELE M.; SILVA, RENATO M.; ALMEIDA, TIAGO A.. ML-MDLText: An efficient and lightweight multilabel text classifier with incremental learning. APPLIED SOFT COMPUTING, v. 96, . (18/02146-6, 17/09387-6)
SILVA, RENATO M.; SANTOS, RONEY L. S.; ALMEIDA, TIAGO A.; PARDO, THIAGO A. S.. Towards automatically filtering fake news in Portuguese. EXPERT SYSTEMS WITH APPLICATIONS, v. 146, . (18/02146-6, 17/09387-6)
FREITAS, BRENO L.; SILVA, RENATO M.; ALMEIDA, TIAGO A.. Gaussian Mixture Descriptors Learner. KNOWLEDGE-BASED SYSTEMS, v. 188, . (18/02146-6, 17/09387-6)
SILVA, RENATO M.; LOCHTER, JOHANNES, V; ALMEIDA, TIAGO A.; YAMAKAMI, AKEBO; XAVIER-JUNIOR, JC; RIOS, RA. FastContext: Handling Out-of-Vocabulary Words Using the Word Structure and Context. INTELLIGENT SYSTEMS, PT II, v. 13654, p. 19-pg., . (18/02146-6)
LOCHTER, JOHANNES V.; SILVA, RENATO M.; ALMEIDA, TIAGO A.; YAMAKAMI, AKEBO; WANI, MA; KANTARDZIC, M; SAYEDMOUCHAWEH, M; GAMA, J; LUGHOFER, E. Semantic indexing-based data augmentation for filtering undesired short text messages. 2018 17TH IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS (ICMLA), v. N/A, p. 6-pg., . (17/09387-6, 18/02146-6)
LOCHTER, JOHANNES V.; SILVA, RENATO M.; ALMEIDA, TIAGO A.. Multi-level out-of-vocabulary words handling approach. KNOWLEDGE-BASED SYSTEMS, v. 251, p. 11-pg., . (18/02146-6, 17/09387-6)

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.