Busca avançada
Ano de início
Entree

Benchmarking de algoritmos de controle de RL para loco-manipulação em robôs quadrúpedes

Processo: 25/03705-2
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de setembro de 2025
Data de Término da vigência: 31 de agosto de 2027
Área de conhecimento:Engenharias - Engenharia Mecânica
Pesquisador responsável:Marcelo Becker
Beneficiário:Letícia Ivaoka Shimizu
Instituição Sede: Escola de Engenharia de São Carlos (EESC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Aprendizado computacional   Robôs móveis   Robótica
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Aprendizagem por reforço | Robôs Andadores | robôs móveis | Robótica | Robotica Terrestre | Automação, Mecatrônica e Robótica

Resumo

Com o avanço no controle de locomoção, atrelado à maior mobilidade e agilidade em terrenos acidentados, os robôs com pernas, em especial os quadrúpedes, se tornaram viáveis para aplicação em diversas áreas, como industrial, agrícola e petroquímica. Entretanto, esses robôs se limitam a atividades de navegação e inspeção, uma vez que possuem baixa capacidade de interação com o ambiente. Uma forma de solucionar esse problema é através do acoplamento de um manipulador à base do robô. O interesse nessa solução aumenta quando se considera a possibilidade do controle unificado da base e do manipulador. Essa abordagem permite que o robô se utilize da base para potencializar o movimento do manipulador, seja em alcance ou em força, além de gerar movimentos coordenados. Contudo, o controle simultâneo de todas as juntas resulta em um sistema complexo, devido às forças de contato e ao alto número de graus de liberdade. Dessa forma, diversas estratégias de controle estão sendo estudadas para solucionar essa questão. Uma dessas abordagens é o controle baseado em aprendizagem. Os modelos de aprendizagem têm recebido crescente interesse, devido à robustez do sistema resultante e ao sucesso de implementação na área de locomoção. Portanto, este projeto de mestrado se propõe a integrar o manipulador de 6 GDL Z1 ao robô quadrúpede B2 e, em seguida, testar diferentes soluções de loco-manipulação do sistema conjunto através de métodos de aprendizagem por reforço (ou RL, do inglês Reinforcement Learning), visando a abertura de uma válvula industrial. O projeto propõe ainda um estudo comparativo entre diferentes algoritmos e arquiteturas de rede presentes na literatura para verificar qual o mais efetivo para a aplicação desejada. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)