Busca avançada
Ano de início
Entree

Fluxo de seleção de fontes de dados linked data para enriquecimento semântico de dados de comunicação cientifica.

Processo: 21/03349-0
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de março de 2022
Data de Término da vigência: 31 de dezembro de 2025
Área de conhecimento:Ciências Sociais Aplicadas - Ciência da Informação
Pesquisador responsável:José Eduardo Santarem Segundo
Beneficiário:Ananda Fernanda de Jesus
Instituição Sede: Faculdade de Filosofia e Ciências (FFC). Universidade Estadual Paulista (UNESP). Campus de Marília. Marília , SP, Brasil
Bolsa(s) vinculada(s):23/13574-7 - Os vocabulários semânticos na seleção de dados linked data, BE.EP.DR
Assunto(s):Comunicação científica   Linked data
Palavra(s)-Chave do Pesquisador:Comunicação Científica | Dimensões de qualidade | Linked data | métricas de qualidade | qualidade de dados | Revisão sistemática da literatura | Ciência da Informação

Resumo

Os novos suportes informacionais e o desenvolvimento do ambiente Web afetaram a comunicação cientifica. O aumento no número de recursos e os problemas de recuperação existentes no contexto da Web fazem com que os pesquisadores tenham dificuldade em localizar, recuperar e selecionar os recursos de seu interesse. O Linked Data é um conjunto de princípios proposto visando permitir publicação de dados estruturados e conectados na Web. Esses princípios podem ser adotados para otimizar a representação e a recuperação de informação científica, entretanto a heterogeneidade da Web faz com que os dados publicados em Linked Data possuam diferentes níveis de qualidade, sendo necessário identificar formas de selecionar fontes de dados que atendam às necessidades da comunidade cientifica. Nesse sentido, questiona-se: Como selecionar datasets Linked Data que possam melhorar o processo de publicação de dados relacionados à comunicação cientifica? Parte-se da hipótese de que a noção de qualidade de dados no contexto da comunicação científica possui suas particularidades, e que essas particularidades interferem no processo de seleção de fontes de dados. O projeto tem por objetivo discutir o processo de seleção de fontes de datasets Linked Data, que possam ser aplicados na etapa de formalização e enriquecimento semântico de dados de comunicação científica, mais especificamente durante a tarefa de ligação com outros datasets, levando em consideração as questões relacionadas a qualidade dos dados. Propõe-se a realização de uma Revisão Sistemática de Literatura, um levantamento documental e a condução de um estudo empírico dos datasets que publiquem dados relacionados à comunicação cientifica. Como resultados espera-se construir um fluxo para a seleção de fontes de datasets Linked Data para enriquecimento semântico de dados de comunicação cientifica.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
ANANDA FERNANDA DE JESUS; JOSÉ EDUARDO SANTAREM SEGUNDO. A descrição formal da qualidade de dados publicados na Web: análise do Data Quality Vocabulary (DQV). Em Questão, v. 29, . (21/03349-0)
CHAVES FILHO, GILDACIO PEREIRA; TAVARES, PEDRO DE ANDRADE; DE JESUS, ANANDA FERNANDA; CIANCAGLINI, PIETRO; SEGUNDO, JOSE EDUARDO SANTAREM; RAMOS, ANA PAULA. Building a digital library on research into mineralizing vesicles: a systematic review-based approach. BIOPHYSICAL REVIEWS, v. N/A, p. 25-pg., . (19/25054-2, 19/08568-2, 21/03349-0, 23/07244-4)