| Processo: | 25/03705-2 |
| Modalidade de apoio: | Bolsas no Brasil - Mestrado |
| Data de Início da vigência: | 01 de setembro de 2025 |
| Data de Término da vigência: | 31 de agosto de 2027 |
| Área de conhecimento: | Engenharias - Engenharia Mecânica |
| Pesquisador responsável: | Marcelo Becker |
| Beneficiário: | Letícia Ivaoka Shimizu |
| Instituição Sede: | Escola de Engenharia de São Carlos (EESC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Assunto(s): | Aprendizado computacional Robôs móveis Robótica |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | Aprendizagem por reforço | Robôs Andadores | robôs móveis | Robótica | Robotica Terrestre | Automação, Mecatrônica e Robótica |
Resumo Com o avanço no controle de locomoção, atrelado à maior mobilidade e agilidade em terrenos acidentados, os robôs com pernas, em especial os quadrúpedes, se tornaram viáveis para aplicação em diversas áreas, como industrial, agrícola e petroquímica. Entretanto, esses robôs se limitam a atividades de navegação e inspeção, uma vez que possuem baixa capacidade de interação com o ambiente. Uma forma de solucionar esse problema é através do acoplamento de um manipulador à base do robô. O interesse nessa solução aumenta quando se considera a possibilidade do controle unificado da base e do manipulador. Essa abordagem permite que o robô se utilize da base para potencializar o movimento do manipulador, seja em alcance ou em força, além de gerar movimentos coordenados. Contudo, o controle simultâneo de todas as juntas resulta em um sistema complexo, devido às forças de contato e ao alto número de graus de liberdade. Dessa forma, diversas estratégias de controle estão sendo estudadas para solucionar essa questão. Uma dessas abordagens é o controle baseado em aprendizagem. Os modelos de aprendizagem têm recebido crescente interesse, devido à robustez do sistema resultante e ao sucesso de implementação na área de locomoção. Portanto, este projeto de mestrado se propõe a integrar o manipulador de 6 GDL Z1 ao robô quadrúpede B2 e, em seguida, testar diferentes soluções de loco-manipulação do sistema conjunto através de métodos de aprendizagem por reforço (ou RL, do inglês Reinforcement Learning), visando a abertura de uma válvula industrial. O projeto propõe ainda um estudo comparativo entre diferentes algoritmos e arquiteturas de rede presentes na literatura para verificar qual o mais efetivo para a aplicação desejada. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |