RESIST: Computação In-Network Resiliente

Processo:	23/00764-2
Modalidade de apoio:	Auxílio à Pesquisa - Regular
Data de Início da vigência:	01 de fevereiro de 2024
Data de Término da vigência:	31 de janeiro de 2026
Área do conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Acordo de Cooperação:	MCTI/MC

Pesquisador responsável:	Alberto Egon Schaeffer Filho
Beneficiário:	Alberto Egon Schaeffer Filho

Instituição Sede:	Instituto de Informática. Universidade Federal do Rio Grande do Sul (UFRGS). Ministério da Educação (Brasil). Porto Alegre , SP, Brasil

Pesquisadores associados:	Israat Haque

Bolsa(s) vinculada(s):	24/23855-6 - Desenvolvimento de sistema para replicação e restauração de estado usando linguagem de alto-nível, BP.TT 24/05527-1 - Desenvolvimento de mecanismo para suporte a diferentes modelos de consistência, BP.TT

Assunto(s):	Plano de dados Resiliência Redes de computadores
Palavra(s)-Chave do Pesquisador:	In-network computing \| plano de dados \| Programabilidade \| resiliência \| Redes de Computadores

Resumo

Recentemente, a possibilidade de utilização de dispositivos de encaminhamento programáveis (switches P4) para permitir não somente o encaminhamento de pacotes mas também a realização de computação dentro da própria rede deu origem ao paradigma denominado computação em rede (in-network computing ou INC). Computação em rede permite descarregar partes da funcionalidade de um sistema distribuído para dentro de um plano de dados programável. Exemplos de funcionalidades INC que podem ser descarregadas de servidores tradicionais para a rede incluem, por exemplo, cache em rede, agregação de dados, e controle de concorrência. A habilidade de executar computação na rede traz diversos benefícios, como redução no tempo de processamento de requisições e a possibilidade de realizar pre-processamento e agregação para reduzir a quantidade de dados trafegados na rede. No entanto, os elementos do plano de dados estão sujeitos a falhas que podem causar interrupções à operação dos INCs descarregados na rede e assim comprometer a resiliência dessas aplicações. Essas falhas podem causar a perda de informações essenciais e interromper a operação de sistemas que dependem da funcionalidade da rede. Esse projeto tem como objetivo principal investigar e conceber soluções para prover tolerância a falhas baseada em replicação e recuperação consistente do comportamento de aplicações INC executando em planos de dados programáveis, de modo a tornar tais aplicações mais resilientes. Dentre as contribuições adicionais almejadas por esse projeto destacam-se: suporte a diferentes noções de consistência para fornecer semânticas distintas de correção ao comportamento de INCs; especificação de uma linguagem de alto-nível para especificação de estratégias de restauração de estado; e modelos e heurísticas para alocação de INCs e suas réplicas de forma ótima no plano de dados. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Mais itens Menos itens

TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):

Mais itens Menos itens

VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

NUNES, DIEGO CARDOSO; COELHO, BRUNO LOUREIRO; PARIZOTTO, RICARDO; SCHAEFFER-FILHO, ALBERTO EGON. No Worker Left (Too Far) Behind: Dynamic Hybrid Synchronization for In-Network ML Aggregation. INTERNATIONAL JOURNAL OF NETWORK MANAGEMENT, v. N/A, p. 18-pg., 2024-07-24. (23/00764-2, 20/05152-7)

URL curto