Busca avançada
Ano de início
Entree


Extensions and applications of the genomic rank distance

Texto completo
Autor(es):
Lucas Peres Oliveira
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:
Membros da banca:
João Meidanis; Fábio Henrique Viduani Martinez; Guilherme Pimentel Telles
Orientador: João Meidanis
Resumo

Sob uma perspectiva computacional, genomas podem ser modelados como uma coleção de segmentos orientados, comumente denominados blocos sintênicos, que representam regiões conservadas ao longo da evolução. Tais regiões são suscetíveis a mutações em larga escala --- conhecidas como rearranjos de genomas --- que permutam os blocos sintênicos em diferentes configurações. Ao longo dos anos, diversos modelos de distância baseados em rearranjos foram desenvolvidos a fim de calcular eficientemente a distância evolutiva entre genomas. Dentre eles, a distância de posto baseia-se na modelagem de genomas como matrizes e na utilização do posto como métrica de distância. A distância de posto é a sucessora da distância algébrica, um modelo de distância que representa genomas como permutações e é fundamentado na teoria de grupos de permutação. Recentemente, a distância de posto foi estendida para abarcar eventos de inserção e remoção --- indels. Embora existam algoritmos eficientes para calcular o posto nesse contexto, muitos resultados da teoria matricial para rearranjo de genomas ainda são fundamentados em noções de teoria de grupos de permutação. Em adição, os resultados são em grande parte teóricos, e pouco se conhece sobre a aplicabilidade biológica dessa extensão da distância de posto. Neste trabalho, consolidamos e expandimos os resultados recentes referentes à extensão da distância de posto que considera eventos de indel. Em particular, introduzimos uma estrutura de dados denominada grafo de colunas a fim de elaborar fórmulas mais simples para calcular o posto em tempo linear. Este ferramental permitiu que a teoria matricial para rearranjo de genomas e algoritmos derivados fossem simplificados consideravelmente. Em adição, realizamos experimentos em inferência filogenética utilizando dados simulados e genomas reais para averiguar a aplicabilidade biológica da distância de posto. Nossos resultados atestam que a distância de posto é competitiva quando comparada com a distância DCJ-Indel, um método estado-da-arte em rearranjo de genomas. Finalmente, apresentamos uma contribuição para o estudo de enumeração de cenários de ordenação sob a distância de posto (AU)

Processo FAPESP: 20/00740-8 - Extensões da distância de posto e contagem de cenários de ordenação
Beneficiário:Lucas Peres Oliveira
Modalidade de apoio: Bolsas no Brasil - Mestrado