Paralelização automática de laços para arquiteturas multicore

Cristianno Martins Vieira

Texto completo
Autor(es):	Cristianno Martins Vieira Número total de Autores: 1
Tipo de documento:	Dissertação de Mestrado
Imprenta:	Campinas, SP.
Instituição:	Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:	2010-08-11
Membros da banca:	Sandro Rigo; Ricardo Ribeiro dos Santos; Guido Costa Souza de Araújo
Orientador:	Sandro Rigo
Resumo
Embora muitos programas possuam uma forma regular de paralelismo, que pode ser expressa em termos de laços paralelos, muitos exemplos importantes não a possuem. Loop skewing é uma transformação que remodela o espaço de iteração dos laços para que seja possível expressar o paralelismo implícito através de laços paralelos. Como consequência da complexidade em se modificar o espaço de iteração dos laços, e de possíveis problemas causados por transformações deste tipo - como o possível aumento na taxa de miss em caches -, no geral, elas não são largamente utilizadas. Neste projeto, implementamos a transformação loop skewing sobre o compilador da linguagem C presente no GCC (GNU Compiler Collection), de forma a permitir a assistência pelo programador. Utilizamos a ferramenta Graphite como base para a implementação da otimização, apenas representando-a como uma transformação afim sobre um objeto matemático multidimensional chamado polítopo. Mostramos, através de um estudo detalhado sobre o modelo matemático denominado modelo politópico, que laços com estruturas específicas - perfeitamente aninhados, com limites e acesso á memória descritos por funções afins - poderiam ser representados como polítopos, e que transformações aplicadas a estes seriam espelhadas no código gerado a partir desses polítopos. Dessa forma, qualquer transformação que possa ser estruturada como uma transformação afim sobre um polítopo, poderá ser implementada. Mostramos, ainda, durante a análise de desempenho, que transformações deste tipo são viáveis e, apesar de algumas limitações impostas pela infraestrutura do GCC, aumentam relativamente o desempenho das aplicações compiladas com ela - obtivemos um ganho máximo de aproximadamente 115% para o uso de quatro threads em uma das aplicações executadas. Verificamos o impacto do uso de programas já paralelizados manualmente sobre a plataforma, e obtivemos um ganho máximo de 11% nesses casos, mostrando que ainda aplicações paralelizadas podem conter paralelismo implícito (AU)

Processo FAPESP:	08/52922-0 - Paralelizacao automatica e semi-automatica de lacos para arquiteturas multicore.
Beneficiário:	Cristianno Martins Vieira
Modalidade de apoio:	Bolsas no Brasil - Mestrado

URL curto