Busca avançada
Ano de início
Entree

Desenvolvimento de um pipeline universal para análise de contexto genômico de dados de diferentes fontes.

Processo: 21/03400-6
Linha de fomento:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de agosto de 2021
Vigência (Término): 31 de julho de 2022
Área do conhecimento:Ciências Biológicas - Bioquímica - Biologia Molecular
Pesquisador responsável:Ethel Bayer Santos
Beneficiário:Gianlucca Gonçalves Nicastro
Instituição-sede: Instituto de Ciências Biomédicas (ICB). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:17/02178-2 - Função de sistemas de secreção do tipo VI de bactérias patogênicas na interação com células eucarióticas, AP.JP
Assunto(s):Sintenia   Toxinas   Biologia computacional

Resumo

A maior parte dos efetores antibacterianos secretados pelo sistema de secreção do tipo 6(T6SS) são similares a toxinas bacterianas do tipo II, as quais são codificadas junto com uma proteína de imunidade (antitoxina) cognata que se liga a toxina inibindo sua atividade. Esses pares de genes são frequentemente encontrados próximos a genes que codificam componentes estruturais do T6SS. Em alguns casos, múltiplos pares de efetores tóxicos e proteínas de imunidade aparecem em um único loci, formando um cassete polimórfico. Uma estratégia para identificar esses pares efetor/imunidade é baseada na organização desses genes no contexto genômico. A conservação do contexto genômico nesses loci permite identificar candidatos a efetores com base nas funções dos genes vizinhos. A análise de contexto genômico foi aplicada por nosso grupo anteriormente no trabalho que caracterizou a família Tlde1 (type VI L,D-transpeptidase effector 1) de efetores do T6SS relacionada a L,D-transpeptidases6. A mesma abordagem continua sendo aplicada por nosso grupo na caracterização de novas famílias de efetores do T6SS. No entanto, apesar do sucesso do nosso protocolo de análise, esse foi utilizado para analisar um pequeno número de genomas. Com o objetivo de analisar conjuntos contendo 10 mil genomas ou mais (10K Salmonella Genomes - 10KSG) e/ou dados de metagenomas precisamos reprogramar nossos pipelines. Desta forma, o objetivo desse projeto é desenvolver um protocolo de análise de contexto genômico que utiliza scripts nas linguagens Python e/ou R para coletar e analisar a vizinhança genica de homólogos de proteínas alvo em larga escala.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: