Busca avançada
Ano de início
Entree

Desenvolvimento de um sistema de alinhamento múltiplo utilizando GPHMMs

Processo: 10/04409-2
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de agosto de 2010
Data de Término da vigência: 31 de julho de 2012
Área de conhecimento:Ciências Biológicas - Bioquímica - Biologia Molecular
Pesquisador responsável:Alan Mitchell Durham
Beneficiário:Vitor Ferreira Onuchic
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Biologia computacional   Filogenia molecular
Palavra(s)-Chave do Pesquisador:Alinhamento múltiplo de seqüências | Arcabouço de implementação | Cadeiras Oculdas de Markov Generalizadas para Pares de sequencias | Cadeiras Ocultas de Markov | Filogenia molecular | Sitemas de caracterização probabilística | Bioinformática

Resumo

Alinhamento múltiplo de sequências é passo fundamental para o estudo de filogenias moleculares e anotação de genomas. O resultado dos processamentos, porém, quase sempre precisa de uma edição manual. Isso se deve a vários fatores, em particular pontuação homogênea de pareamentos, deleções e inserções para toda a extensão das sequências. Goldman e Löytynoja propuseram, para melhorar esta situação, modificações na pontuação de inserções e deleções e a utilização do modelo probabilístico pair-HMM, descrevendo separadamente regiões codificadoras, regiões de rápida evolução e regiões de evolução lenta. Com isso conseguiram melhora substantiva na qualidade inicial dos alinhamentos. Porém, os modelos utilizados ainda têm problemas, em particular os estados do pair-HMM, não são capazes de acertar a duração correta das regiões codificadoras. Em predição de genes este problema foi resolvido com a utilização de Modelos de Markov Ocultos Generalizados (GHMMs), onde a duração de cada estado pode ser modelada por uma distribuição determinada pelo pesquisador. Recentemente Pachter propôs as GPHMMs, uma generalização de GHMMs para alinhamento de pares de sequências. A proposta de deste trabalho é utilizar GPHMMs para a melhoria de alinhamentos múltiplos, generalizando a abordagem proposta por Goldman e Löytynoja. Esta implementação será feita inicialmente estendendo-se a plataforma TOPs, uma implementação genérica de GHMMs desenvolvida pelo nosso grupo para modelagem de preditores de genes ab inicio. Em seguida utilizaremos as GPHMMs geradas em um programa de alinhamento múltiplo. Numa terceira fase, utilizaremos esta plataforma para estudar a melhoria nos alinhamentos automáticos. Embora a utilização de GPHMM em preditores de Genes já apareça na literatura a utilização de GPHMM em programas de alinhamento múltiplo é, até o momento, inédita.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
KASHIWABARA, ANDRE YOSHIAKI; BONADIO, IGOR; ONUCHIC, VITOR; AMADO, FELIPE; MATHIAS, RAFAEL; DURHAM, ALAN MITCHELL. ToPS: A Framework to Manipulate Probabilistic Models of Sequence Data. PLOS COMPUTATIONAL BIOLOGY, v. 9, n. 10, . (10/04409-2)
KASHIWABARA, ANDRE YOSHIAKI; BONADIO, IGOR; ONUCHIC, VITOR; AMADO, FELIPE; MATHIAS, RAFAEL; DURHAM, ALAN MITCHELL. ToPS: A Framework to Manipulate Probabilistic Models of Sequence Data. PLOS COMPUTATIONAL BIOLOGY, v. 9, n. 10, p. 10-pg., . (10/04409-2)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
ONUCHIC, Vitor Ferreira. Inovações em técnicas de alinhamentos múltiplos e predições de genes. 2012. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI) São Paulo.