Busca avançada
Ano de início
Entree

Uso de técnicas adaptativas em aprendizagem por reforço

Processo: 11/17096-5
Modalidade de apoio:Bolsas no Exterior - Pesquisa
Data de Início da vigência: 30 de julho de 2012
Data de Término da vigência: 29 de julho de 2013
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo Luis de Azevedo da Rocha
Beneficiário:Ricardo Luis de Azevedo da Rocha
Pesquisador Anfitrião: José Nelson Amaral
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Instituição Anfitriã: University of Alberta, Canadá  
Assunto(s):Inteligência artificial   Aprendizado computacional
Palavra(s)-Chave do Pesquisador:Adaptive Techniques | Computational Intelligence | Computational Learning | reinforcement learning | System Software | Machine Intelligence

Resumo

Esta proposta de pesquisa tem por objetivo investigar o uso de técnicas adaptativas em associação a aprendizado de máquina por reforço e aplicar esta ideia na otimização de código em compiladores. Com isso, busca-se melhorar os aspectos de otimização de código em compiladores, uma área que conta com esforços de pesquisa relativamente recentes, e ampliar o uso de técnicas adaptativas em inteligência computacional. Aprendizagem em compiladores tem sido usada para construir o escalonamento de instruções para os blocos básicos, para melhorar na seleção de transformações de código que deve ser aplicado a um determinado procedimento, para aprender uma boa estratégia de "loop unrolling", entre outros. Além disso aprendizagem por reforço está sendo utilizado em áreas relacionadas, por exemplo, Ipek et al. propuseram um controlador de memória que pode tomar melhores decisões sobre as ações que deve realizar com base em uma fila de entrada e também no que o controlador tem aprendido com suas decisões anteriores (Ipek 2008). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DA CUNHA RODRIGUES, ELISANGELA SILVA; RODRIGUES, FABRICIO AUGUSTO; DE AZEVEDO DA ROCHA, RICARDO LUIS; CHANG, T. Computational Complexity of Adaptive Algorithms. 2012 THIRD INTERNATIONAL CONFERENCE ON THEORETICAL AND MATHEMATICAL FOUNDATIONS OF COMPUTER SCIENCE (ICTMF 2012), v. 38, p. 6-pg., . (11/17096-5)