Busca avançada
Ano de início
Entree


Construindo um grafo de conhecimento biológico via Wikidata com foco no Human Cell Atlas

Texto completo
Autor(es):
Tiago Lubiana Alves
Número total de Autores: 1
Tipo de documento: Tese de Doutorado
Imprenta: São Paulo.
Instituição: Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI)
Data de defesa:
Membros da banca:
Helder Takashi Imoto Nakaya; Yesid Cuesta Astroz; Helena Paula Brentani; Jose Eduardo Santarem Segundo
Orientador: Helder Takashi Imoto Nakaya
Resumo

Com os avanços do Human Cell Atlas e das tecnologias ômicas de células únicas (como o single-cell RNA-seq), aumentou a necessidade de estratégias para organizar sistematicamente o conhecimento sobre os tipos celulares. Sistemas de representação formal são essenciais para tarefas como o gerenciamento de bancos de dados e a anotação de conjuntos de dados ômicos. A infraestrutura do Wikidata, integrada à Wikipédia, apresenta-se como uma plataforma valiosa e de custo baixo para representações estruturadas de conhecimento biomédico. Nós a utilizamos para desenvolver o WikiORA, uma plataforma web interativa para análise de enriquecimento funcional. Ferramentas como essa dependem da cobertura do Wikidata, e para isso enriquecemos seu conteúdo com duas bases de dados importantes: PanglaoDB, de marcadores celulares, e o Complex Portal, de complexos proteicos. Além da integração de fontes externas, exploramos como o Wikidata poderia ser enriquecido por meio de biocuradoria de novo, desenvolvendo uma metodologia para catalogar a diversidade celular na plataforma. Como resultado, transformamos o Wikidata no maior catálogo multiespécie de classes celulares do mundo, com identificadores únicos para mais de 6.000 entradas. Os dados curados estão disponíveis publicamente por meio de uma interface gráfica e de um endpoint SPARQL. Ao sequir o padrão de 5-star Linked Open Data, possibilitamos a reutilização eficiente dos dados, apoiando o desenvolvimento de uma versão multilíngue da Cell Ontology e alimentando infocaixas da Wikipédia. Desta forma, este estudo de caso reafirma o valor do Wikidata como uma ferramenta de representação de conhecimento nas ciências da vida, especialmente para organizar informações sobre a diversidade celular humana. (AU)

Processo FAPESP: 19/26284-1 - Criando um grafo de conhecimento biológico através do Wikidata com foco no projeto Human Cell Atlas
Beneficiário:Tiago Lubiana Alves
Modalidade de apoio: Bolsas no Brasil - Doutorado