Bolsa 12/23300-7 - Computação em grid, Unidade de processamento gráfico - BV FAPESP
Busca avançada
Ano de início
Entree

Modelo BSP em Placas Gráficas

Processo: 12/23300-7
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de março de 2013
Data de Término da vigência: 28 de fevereiro de 2018
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Alfredo Goldman vel Lejbman
Beneficiário:Marcos Tulio Amaris González
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Bolsa(s) vinculada(s):15/19399-6 - Aprendizagem Automática para predizer desempenho e tempo de corrida de aplicações heterogêneas com dados de entrada incertos, BE.EP.DR
Assunto(s):Computação em grid   Unidade de processamento gráfico   Algoritmos   Computação de alto desempenho
Palavra(s)-Chave do Pesquisador:Algoritmos paralelos | Computacão de Alto Desempenho | Computação em grade | Gpgpu | Modelo BSP | Unidade de Processamento Gráfico | Sistemas Distribuidos e Computação em Paralelo

Resumo

Neste documento é apresentada uma proposta em um tópico específico de Computação de Alto Desempenho em Ciências da Computação. As GPUs foram inicialmente construídas para computação gráfica, no entanto, os dispositivos GPU de hoje são capazes de desempenhar melhor alguns processos paralelos do que as CPUs multinúcleo ou supercomputadores, devido a sua intrínseca arquitetura paralela de hardware. Há cerca de cinco anos, emergentes interfaces de programação de aplicativos (APIs) e linguagens de programação introduziram o conceito de Propósito Geral em GPU ou GPGPU. Pesquisadores da área criam aplicações com um alto nível de paralelismo de dados e tarefas que são capazes de rodar tanto em CPUs e GPUs. O modelo BSP (Bulk Synchronous Parallel) é um modelo de ponte para computação em paralelo introduzido por Valiant em 1990. As propriedades da interligação da rede são capturados por alguns parâmetros da arquitetura para o modelo de BSP em um algoritmo paralelo. No entanto, algoritmos executados em ambientes massivamente paralelos podem enfrentar vários inconvenientes. Os problemas podem surgir, por exemplo, devido ao equilíbrio da carga ou a latência de comunicação. O objetivo geral deste projeto irá se o desenvolvimento de modelos para executar eficientemente algoritmos com o modelo BSP em placas gráficas e será focado na avaliação e caracterização dos principais problemas que podem afetar negativamente a implementação de eficientes algoritmos BSP em GPUs. Os algoritmos implementados com base nos modelos propostos serão projetados para arquiteturas massivamente paralelas, tais como clusters de computadores, sistemas multicore, infra-estruturas grid, e em particular para supercomputadores com GPUs.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (7)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
AMARIS, MARCOS; CAMARGO, RAPHAEL; CORDEIRO, DANIEL; GOLDMAN, ALFREDO; TRYSTRAM, DENIS. Evaluating execution time predictions on GPU kernels using an analytical model and machine learning techniques. JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, v. 171, p. 13-pg., . (19/26702-8, 15/19399-6, 21/06867-2, 12/23300-7)
BRUEL, PEDRO; AMARIS, MARCOS; GOLDMAN, ALFREDO. Autotuning CUDA compiler parameters for heterogeneous applications using the OpenTuner framework. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE, v. 29, n. 22, p. 15-pg., . (12/23300-7)
AMARIS, MARCOS; LUCARELLI, GIORGIO; MOMMESSIN, CLEMENT; TRYSTRAM, DENIS; RIVERA, FF; PENA, TF; CABALEIRO, JC. Generic Algorithms for Scheduling Applications on Hybrid Multi-core Machines. EURO-PAR 2017: PARALLEL PROCESSING, v. 10417, p. 12-pg., . (12/23300-7)
BRUEL, PEDRO; AMARIS, MARCOS; GOLDMAN, ALFREDO. Autotuning CUDA compiler parameters for heterogeneous applications using the OpenTuner framework. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE, v. 29, n. 22, SI, . (12/23300-7)
AMARIS, MARCOS; LUCARELLI, GIORGIO; MOMMESSIN, CLEMENT; TRYSTRAM, DENIS. Generic algorithms for scheduling applications on heterogeneous platforms. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE, v. 31, n. 15, . (12/23300-7)
GENG, TONGSHENG; AMARIS, MARCOS; ZUCKERMAN, STEPHANE; GOLDMAN, ALFREDO; GAO, GUANG R.; GAUDIOT, JEAN-LUC. A Profile-Based AI-Assisted Dynamic Scheduling Approach for Heterogeneous Architectures. INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING, v. 50, n. 1, . (12/23300-7)
GONCALVES, ROGERIO; ANIMIS, MARCOS; OKADA, THIAGO; BRUEL, PEDRO; GOLDMAN, ALFREDO; BUI, TX; SPRAGUE, RH. OpenMP is Not as Easy as It Appears. PROCEEDINGS OF THE 49TH ANNUAL HAWAII INTERNATIONAL CONFERENCE ON SYSTEM SCIENCES (HICSS 2016), v. N/A, p. 10-pg., . (12/23300-7)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
GONZÁLEZ, Marcos Tulio Amaris. Predição de desempenho de aplicações executadas em GPUs usando um modelo analítico simples e técnicas de aprendizado de máquina. 2018. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI) São Paulo.

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.