Busca avançada
Ano de início
Entree


Improving annotation propagation on molecular networks through random walks: introducing ChemWalker

Texto completo
Autor(es):
Borelli, Tiago Cabral ; Arini, Gabriel Santos ; Feitosa, Luis G. P. ; Dorrestein, Pieter C. ; Lopes, Norberto Peporine ; da Silva, Ricardo R.
Número total de Autores: 6
Tipo de documento: Artigo Científico
Fonte: Bioinformatics; v. 39, n. 3, p. 2-pg., 2023-03-01.
Resumo

Motivation: Annotation of the mass signals is still the biggest bottleneck for the untargeted mass spectrometry analysis of complex mixtures. Molecular networks are being increasingly adopted by the mass spectrometry community as a tool to annotate large-scale experiments. We have previously shown that the process of propagating annotations from spectral library matches on molecular networks can be automated using Network Annotation Propagation (NAP). One of the limitations of NAP is that the information for the spectral matches is only propagated locally, to the first neighbor of a spectral match. Here, we show that annotation propagation can be expanded to nodes not directly connected to spectral matches using random walks on graphs, introducing the ChemWalker python library.Results: Similarly to NAP, ChemWalker relies on combinatorial in silico fragmentation results, performed by MetFrag, searching biologically relevant databases. Departing from the combination of a spectral network and the structural similarity among candidate structures, we have used MetFusion Scoring function to create a weight function, producing a weighted graph. This graph was subsequently used by the random walk to calculate the probability of 'walking' through a set of candidates, departing from seed nodes (represented by spectral library matches). This approach allowed the information propagation to nodes not directly connected to the spectral library match. Compared with NAP, ChemWalker has a series of improvements, on running time, scalability and maintainability and is available as a standalone python package.Availability and implementation: ChemWalker is freely available atContact: ridasilva@usp.brSupplementary information: are available at Bioinformatics online. (AU)

Processo FAPESP: 21/08235-3 - Desvendando a lógica evolutiva e estrutura do resistoma marinho: uma abordagem com aprendizado estruturado profundo para descoberta de restrições evolutivas
Beneficiário:Tiago Cabral Borelli
Modalidade de apoio: Bolsas no Brasil - Doutorado
Processo FAPESP: 20/02207-5 - Inventariando o metabolismo secundário através da metabolômica: contribuição para a valoração da biodiversidade brasileira
Beneficiário:Norberto Peporine Lopes
Modalidade de apoio: Auxílio à Pesquisa - Programa BIOTA - Temático
Processo FAPESP: 17/18922-2 - Desenvolvimento de uma plataforma computacional modular extensível para análises de experimentos de metabolômica e metagenômica: inovando com a descoberta de novas atividades enzimáticas e produtos naturais de interesse farmacêutico derivados
Beneficiário:Ricardo Roberto da Silva
Modalidade de apoio: Auxílio à Pesquisa - Programa BIOTA - Jovens Pesquisadores
Processo FAPESP: 19/05026-4 - Desenvolvimento de uma plataforma computacional modular extensível para análises de experimentos de metabolômica e metagenômica: Inovando com a descoberta de novas atividades enzimáticas e produtos naturais de interesse farmacêutico derivados
Beneficiário:Ricardo Roberto da Silva
Modalidade de apoio: Bolsas no Brasil - Programa BIOTA - Jovens Pesquisadores
Processo FAPESP: 21/10401-9 - Otimização da detecção e armazenamento de espectros de fragmentação de sinais biológicos em estudos de metabolômica
Beneficiário:Gabriel Santos Arini
Modalidade de apoio: Bolsas no Brasil - Doutorado