Busca avançada
Ano de início
Entree

Interação de longa duração para aprendizado de comportamentos interativos utilizando deep reinforcement learning

Processo: 18/25782-5
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de novembro de 2019
Vigência (Término): 30 de junho de 2022
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Roseli Aparecida Francelin Romero
Beneficiário:José Pedro Ribeiro Belo
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Robótica   Robôs sociais   Aprendizagem profunda   Comportamento   Interação homem-máquina

Resumo

A robótica social representa um ramo da interação humano-robô que visa desenvolver robôs para atuar em ambientes não estruturados em parceria direta com seres humanos. É esperado que robôs sociais tenham a capacidade de interagir com seres humanos compreendendo sinais sociais e respondendo apropriadamente, a fim de promover uma interação “natural'' e socialmente aceitável entre humanos e robôs. O objetivo desta tese é a elaboração de um módulo para robôs sociais capaz de aprender automaticamente comportamentos interativos de seres humanos e, a partir disto, reagir de forma natural e adequada a estes comportamentos. Para atingir este objetivo, serão exploradas técnicas de aprendizado por reforço e aprendizagem profunda (deep reinforcement learning), além de aspectos específicos de interação de longa duração que permitirão ao robô memorizar interações passadas. Além disto, o sistema será agregado à arquitetura Cognitive Model Development Environment (CMDE), desenvolvida no Laboratório de Aprendizado de Robôs (LAR) da USP-São Carlos, direcionada para modelar aplicações que envolvam robótica social. Desta forma, esta tese contribui com a arquitetura adicionando um módulo de aprendizado de comportamentos interativos. Além disto, a validação do sistema será feita por meio de uma aplicação que permita uma análise de longo prazo, isto é, interação de longa duração com o robô, o qual irá armazenar interações e ações executadas, associadas ao reconhecimento do humano. (AU)