A busca pela melhoria de performance pode ser alcançada por
diversas técnicas, cuja a técnica de programação concorrente já é bastante consolidada
e utilizada no mercado. Entretanto, adicionar concorrência possui um custo
adicional de conhecimento e a escolha da tecnologia pode ser benéfica ou um
entrave na utilização dessa estratégia. Diversos estudos reveleram que o OpenMP
é um dos frameworks mais fáceis de serem utilizados, porém ainda há dúvidas
sobre a sua performance em relação aos outros. Este trabalho apresenta os
resultados através da mudança do paradigma sequencial para a programação
concorrente, considerando o aumento do número de threads e diferentes formas de
balanceamento de carga entre os processadores. Por fim,
para conhecer de fato a eficiência do OpenMP, este estudo realizou uma implementação
híbrida utlizando três estratégias de melhoria de perfomance: (i) programação
concorrente, (ii) vetorização intrísica usando extensões SSE3 do processador
Intel e (iii) técnicas de blocagem para medir o speedup e eficiência em
comparação aos frameworks Pthreads e Java Threads.
terça-feira, 13 de novembro de 2012
terça-feira, novembro 13, 2012
Jaguaraci Silva
Processamento de Alto Desempenho
No comments
Related Posts:
Análise de Performance na Obtenção de Produtos de Matrizes Resumo: O produto de matrizes é um tema profundamente pesquisado, pois sugere uma maior facilidade na comparação de performance de programas com a utilização da álgebra linear e algumas métricas para esse fim. Neste traba… Read More
Análise de Desempenho Usando Técnicas de Vetorização, Blocagem e Programação Concorrente A busca pela melhoria de performance pode ser alcançada por diversas técnicas, cuja a técnica de programação concorrente já é bastante consolidada e utilizada no mercado. Entretanto, adicionar concorrência possui um… Read More
Uma Análise de Vetorização Automática do Compilador GCC Resumo: Existem três formas principais de se fazer uso de unidades de vetorização nos processadores atuais: (i) pela programação em código de montagem, (ii) através da programação de funções intrínsecas em linguagens de a… Read More
Assinar:
Postar comentários (Atom)
0 comments:
Postar um comentário