| Processo: | 22/03534-5 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Doutorado Direto |
| Data de Início da vigência: | 01 de julho de 2022 |
| Data de Término da vigência: | 30 de junho de 2023 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | André Carlos Ponce de Leon Ferreira de Carvalho |
| Beneficiário: | Jonas Coelho Kasmanas |
| Supervisor: | Peter Florian Stadler |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Instituição Anfitriã: | Leipzig University, Alemanha |
| Vinculado à bolsa: | 19/03396-9 - Análise e Classificação de Microbiomas Humanos: Detecção de Bioindicadores e Otimização por meio de Aprendizado de Máquina, BP.DD |
| Assunto(s): | Biologia computacional Aprendizado computacional Microbiota |
| Palavra(s)-Chave do Pesquisador: | bioinformática | Human metagenomes | machine learning | Metagenome | Microbiome | Bioinformática e Aprendizado de Máquina |
Resumo Diferentes comunidades microbianas habitam as diferentes regiões do corpo humano, seja boca, intestino, vagina ou outras. Eles são chamados coletivamente de Microbioma Humano (HM). Essas comunidades participam de processos essenciais na saúde humana. Assim, uma melhor compreensão do microbioma central humano pode ajudar no diagnóstico precoce de distúrbios e contribuir para tratamentos potencialmente mais eficientes. A metagenômica, por sua vez, é uma das melhores maneiras de experimentar e compreender comunidades de microbiomas. Neste projeto, investigarei o uso de metagenômica e Machine Learning (ML) para recuperar Metagenomes Assembled Genomes (MAGs) e desvendar a biodiversidade, potencial genético e conexão com a saúde humana. A metagenômica, o estudo do material genético de uma comunidade mista de organismos, gera uma grande quantidade de informação que atualmente é subutilizada devido à sua complexidade. Ao mesmo tempo, o ML é uma maneira eficiente de extrair informações novas e úteis e modelos de previsão de dados complexos.O principal objetivo deste BEPE é melhorar a compreensão de como a biodiversidade e o potencial genético do microbioma humano saudável (procariontes, eucariotos e vírus) podem ser descritos. Consequentemente, usarei modelos de ML para diferenciar amostras metagenômicas humanas de pacientes saudáveis e não saudáveis. Resultados preliminares do projeto de doutorado do aluno devem apoiar o bom desenvolvimento do estágio. No ano passado, criei o HumanMetagenomeDB (HMgDB) e selecionei cerca de 12 mil amostras metagenômicas humanas para servir de dados para este estágio. O estágio começará atualizando o HMgDB para incluir feedback dos especialistas do domínio dos dados da Universidade de Leipzig (UniLeipzig) e do Centro Helmholtz de Pesquisa Ambiental (UFZ). O grupo do Prof. Peter Stadler possui ampla experiência no desenvolvimento de ferramentas computacionais para explorar dados de sequências biológicas. Além disso, a UniLeipzig tem estreita parceria com a UFZ e o grupo de análise centrada em genoma do Dr. Ulisses Nunes da Rocha. Consequentemente, a colaboração interdisciplinar entre os grupos será de extrema importância para o estágio. A seguir, com a ajuda do grupo de análise centrada no genoma da UFZ, vou recuperar os MAGs das amostras metagenômicas. Os genomas recuperados são de centenas de estudos diferentes em todo o mundo. Portanto, este BEPE visa contribuir com dados para o Human Metagenomic Assemble Genomes Consortium (HuMAGs), criado durante o projeto de doutorado do aluno em parceria com os especialistas da UFZ. O segundo passo é descrever os MAGs recuperados em larga escala com os especialistas participantes do HuMAGs. Esta etapa também definirá e extrairá as características biológicas relevantes dos MAGs que serão usadas na etapa seguinte. A terceira etapa do estágio é criar modelos preditivos de ML capazes de identificar características do microbioma relevantes capazes de separar o status de saúde e não-saúde. Esta etapa deve ajudar na definição das principais estruturas genéticas de um microbioma humano saudável dos diferentes compartimentos do corpo (ou seja, intestino, pele, vagina, etc.) e estabelecer as bases de modelagem de ML para lidar com dados metagenômicos. Por fim, pretendo avaliar os modelos juntamente com especialistas do domínio de dados para identificar potenciais bioindicadores do microbioma humano a partir de um estado não saudável. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |