Automatic Fusions of CUDA-GPU Kernels for Parallel Map
Název česky | Automatické fúze CUDA-GPU kernelů pro paralelní map |
---|---|
Autoři | |
Rok publikování | 2011 |
Druh | Článek ve sborníku |
Konference | Second International workshop on highly-efficient accelerators and reconfigurable technologies (HEART) |
Fakulta / Pracoviště MU | |
Citace | |
www | http://www.fi.muni.cz/~xfilipov/s4-1.pdf |
Obor | Informatika |
Klíčová slova | GPU, CUDA, kernels fusion, map, mapped function |
Popis | Když implementujeme mapování funkce na dnešních GPU, musíme ladit několik protichůdných faktorů ovlivňujících distribuci výpočtů do jednotlivých GPU kernelů. Schéma dekompozice-fúze radí dekomponovat výpočetní problém tak, aby byl řešen pomocí několika jednoduchých funkcí implementovaných jako samostatné kernely a některé z těchto funkcí následně spojit do komplexnějších kernelů a zlepšit tak paměťovou lokalitu. V tomto článku prezentujeme prototyp kompilátoru automatizujícího fázi fúze a experimentálně ověřujeme přínos fúzí generovaných kompilátorem a časovou efektivitu kompilátoru. |
Související projekty: |