GPGPU向け細粒度スレッド機構

GPUは行列計算や画像処理のように均質な並列性を持つ問題に対して効果的であることが知られていますが、不均質な並列性を持つ問題に対してGPUを用いることはほとんど試みられていません。本プロジェクトの目標はGPGPU向けの細粒度かつ入れ子のスレッド実行機構を作ることです。それによってGPU内部でスレッドを生成するような並列プログラムを簡単に記述できるようにし、より広汎なプログラムがGPUによって高速化されることを目指します。

第一歩として、高効率なGPGPU向け並列オブジェクト割当て機構DynaSOArを用いたスレッド実行モデルを提案します。そして実行性能やオーバーヘッドの分析と、最適化手法やコンパイル手法を検討します。

👉 Implementation @ github