Busca avançada
Ano de início
Entree

Incorporação da semântica na construção de websensors

Processo: 13/14757-6
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de dezembro de 2013
Vigência (Término): 31 de maio de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Roberta Akemi Sinoara
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):16/07620-2 - Representação semântica para classificação de textos, BE.EP.DR
Assunto(s):Inteligência artificial   Semântica   Agrupamento de dados   Banco de dados textuais   Web semântica   Mineração de texto

Resumo

Com o aumento da quantidade e variedade de textos em formato digital, seja em redes sociais, web ou internamente nas organizações, as técnicas de Mineração de Textos tornam-se essenciais no apoio à extração de conhecimento. Pesquisas e aplicações têm sido desenvolvidas visando utilizar a web como um poderoso sensor social. Nesse contexto, surgem os websensors, sensores que monitoram a publicação de textos e mantêm uma série temporal da atividade de determinados tópicos. A aplicabilidade dos websensors é ampla. De acordo com os textos monitorados, a atividade de um websensor pode ajudar a entender, explicar ou predizer determinado fato. Os websensors podem ser construídos a partir do agrupamento de textos, evitando assim a necessidade de um grande volume de dados rotulados ou do intenso esforço de um especialista do domínio para definir os parâmetros dos sensores. No entanto, os aspectos semânticos dos textos podem ser decisivos na qualidade e no uso efetivo do agrupamento obtido. Para o aprendizado de bons websensors pode ser necessária, por exemplo, uma organização dos textos que diferencie documentos que, apesar de utilizarem o mesmo vocabulário, apresentem ideias diferentes sobre um mesmo assunto. Pesquisas em Mineração de Textos têm apresentado diversos avanços nos últimos anos, porém a incorporação da semântica ainda é um desafio a ser superado. Motivado por essa lacuna, este projeto de doutorado visa explorar a incorporação de semântica na construção de websensors, buscando uma organização mais refinada, que considere ideias expressas nos documentos. Visando representar diferentes aspectos semânticos, será desenvolvido um novo formato de representação de dados textuais. Além disso, algoritmos de agrupamento serão desenvolvidos ou adaptados para utilizar essa nova representação de maneira efetiva. Vale ressaltar que, apesar do foco deste trabalho ser a incorporação da semântica no agrupamento de textos para construção de websensors, os resultados obtidos poderão posteriormente ser expandidos para outras tarefas da Mineração de Textos, como a classificação automática de documentos e a análise de sentimentos. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SINOARA, ROBERTA A.; CAMACHO-COLLADOS, JOSE; ROSSI, RAFAEL G.; NAVIGLI, ROBERTO; REZENDE, SOLANGE O. Knowledge-enhanced document embeddings for text classification. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 955-971, JAN 1 2019. Citações Web of Science: 4.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SINOARA, Roberta Akemi. Aspectos semânticos na representação de textos para classificação automática. 2018. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.