Busca avançada
Ano de início
Entree

Reamostragem e seleção de modelos para cadeias estocásticas com memória de alcance variável

Processo: 09/09494-0
Linha de fomento:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de outubro de 2009
Vigência (Término): 30 de setembro de 2011
Área do conhecimento:Ciências Exatas e da Terra - Probabilidade e Estatística - Estatística
Pesquisador responsável:Jefferson Antonio Galves
Beneficiário:Matthieu Pierre Lerasle
Instituição-sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Modelagem de dados

Resumo

Técnicas de reamostragem vêm sendo utilizadas com sucesso para a implementação prática de métodos estatísticos. Recentemente, resultados não assintóticos foram obtidos teoricamente, em particular em seleção de modelos, o que levou a grandes melhorias nas aplicações práticas. Nós propomos o estudo rigoroso de alguns métodos de reamostragem para cadeias estocásticas com memória de tamanho variável. Estas cadeias, introduzidas por Rissanen em 1983, vêm recebendo uma atenção crescente na literatura estatística, não só pelo seu interesse teórico, como por suas capacidades práticas de modelagem de dados científicos em diversas áreas, indo da biologia à linguística. Do ponto de vista estatístico, dada uma amostra, a questão fundamental é a estimação eficiente da menor árvore de contextos associada a uma cadeia com memória de alcance variável que melhor se ajusta à amostra. Vários métodos têm sido propostos para atingir este objetivo, mas todos eles dependem de constantes desconhecidas ou de propriedades desconhecidas do estimador. Métodos de reamostragem parecem particularmente adequados no enfrentamento prático deste tipo de dificuldade. Além de seu interesse intrínseco como tema de pesquisa teórica em Estatística, este projeto tem uma face interdisciplinar e aplicada, motivada pelo desafio de recuperar padrões rítmicos em textos escritos de uma língua natural. Estudos preliminares indicam que árvores de contextos podem servir como indicadores das classes rítmicas cuja existência é conjecturada na literatura linguística. Um objetivo prático deste projeto é aplicar os novos resultados teóricos como ferramentas de análise de amostras de dados linguísticos, tentando obter novas evidências, teoricamente embasadas, corroborando a conjectura de existência de classes rítmicas de línguas naturais. (AU)

Publicações científicas (5)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
LERASLE, MATTHIEU; TAKAHASHI, DANIEL Y. Sharp oracle inequalities and slope heuristic for specification probabilities estimation in discrete random fields. BERNOULLI, v. 22, n. 1, p. 325-344, FEB 2016. Citações Web of Science: 3.
GALLO, S.; LERASLE, M.; TAKAHASHI, D. Y. Markov Approximation of Chains of Infinite Order in the (d)over-bar-metric. Markov Processes and Related Fields, v. 19, n. 1, p. 51-82, 2013. Citações Web of Science: 4.
LERASLE, MATTHIEU. Optimal model selection in density estimation. ANNALES DE L INSTITUT HENRI POINCARE-PROBABILITES ET STATISTIQUES, v. 48, n. 3, p. 884-908, AUG 2012. Citações Web of Science: 11.
LERASLE, MATTHIEU. OPTIMAL MODEL SELECTION FOR DENSITY ESTIMATION OF STATIONARY DATA UNDER VARIOUS MIXING CONDITIONS. ANNALS OF STATISTICS, v. 39, n. 4, p. 1852-1877, AUG 2011. Citações Web of Science: 8.
LERASLE, MATTHIEU; TAKAHASHI, DANIEL Y. An oracle approach for interaction neighborhood estimation in random fields. ELECTRONIC JOURNAL OF STATISTICS, v. 5, p. 534-571, 2011. Citações Web of Science: 4.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.