Resumo
Esta pesquisa propõe uma estrutura de SLAM 3D dinâmico multiagente de vocabulárioaberto que aproveita modelos avançados de visão-linguagem (VLMs) e grandes modelos delinguagem (LLMs) para aprimorar a compreensão da cena robótica e o planejamento detarefas em ambientes dinâmicos e não estruturados. Ao integrar a segmentação 2D devocabulário aberto com dados de profundidade e multissensores…