Busca avançada
Ano de início
Entree

Estimação consistente de processos estocásticos com memória de comprimento variável: aplicações na modelagem de sequências biológicas

Processo: 09/09411-8
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de setembro de 2009
Data de Término da vigência: 30 de novembro de 2011
Área do conhecimento:Ciências Exatas e da Terra - Probabilidade e Estatística - Estatística
Pesquisador responsável:Florencia Graciela Leonardi
Beneficiário:Florencia Graciela Leonardi
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Estatística de processos estocásticos  Modelos para processos estocásticos  Algoritmos  Mapeamento genético  Genomas 
Palavra(s)-Chave do Pesquisador:árvores de contextos | estrutura secundária de proteínas | mapeamento de doenças complexas | processos estocásticos com memória de comprimento variável | seleção consistente da árvore de contextos | seleção de modelos para processos estocásticos | Inferência em Processos Estocásticos

Resumo

Este projeto de pesquisa tem como objetivo principal estudar as propriedades dos processos estocásticos com memória de comprimento variávele a sua estimação. Também propõe-se aplicar as ferramentas de análise de dados baseadas na modelagem com este tipo de processos estocásticos a dois problemas importantes da Biologia: o mapeamento de doenças complexas e a caracterização de estrutura secundária em proteínas. Do ponto de vista teórico, um dos objetivos principais do projeto é a obtenção de condições suficientes para a consistência das árvores de contextos empíricas não necessariamente truncadas a um nível pre-estabelecido. Também esperamos obter limitantes superiores ótimas para a velocidade de convergência destes estimadores. Por outro lado, pretendemos obter condições sobre certos funcionais de processos estocásticos para a existência de estimadores consistentes. Do ponto de vista das aplicações, no caso do mapeamento de doenças complexas, pretendemos desenvolver algoritmos de análise de mapas de SNPs que permitam inferir relações de ancestralidade entre os diferentes indivíduos e também identificar quais são as regiões do genoma que contêm uma maior associação com a doença estudada. Com relação a estrutura secundária de proteínas, esperamos desenvolver algoritmos que possam predizer as diferentes estruturas secundárias a partir da sequência de aminoácidos da proteína. Também esperamos que essa associação entre estrutura secundária e sequência possa ser utilizada para projetar algoritmos mais eficientes para a classificação de proteínas em famílias. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
GARIVIER, A.; LEONARDI, F.. Context tree selection: A unifying view. Stochastic Processes and their Applications, v. 121, n. 11, p. 2488-2506, . (09/09411-8)
GALVES, ANTONIO; GALVES, CHARLOTTE; GARCIA, JESUS E.; GARCIA, NANCY L.; LEONARDI, FLORENCIA. CONTEXT TREE SELECTION AND LINGUISTIC RHYTHM RETRIEVAL FROM WRITTEN TEXTS. Annals of Applied Statistics, v. 6, n. 1, p. 186-209, . (09/09411-8)