超並列計算機用自動並列化コンパイラに関する共同研究

閲覧数: 2
ダウンロード数: 0
このエントリーをはてなブックマークに追加

超並列計算機用自動並列化コンパイラに関する共同研究

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
タイトル(他言語):
Auto-Parallelizing Compiler for Massive Parallel Computers
責任表示:
荒木 啓二郎(九州大学・大学院・システム情報科学研究科・教授)
ARAKI Keijiro(九州大学・大学院・システム情報科学研究科・教授)
本文言語:
日本語
研究期間:
1994-1996
概要(最新報告):
平成8年度は、自動並列化コンパイラのための視覚化、依存を含むループの最小実行時間を静的に見積もる手法、分散メモリ型並列計算機に対する自動並列化コンパイラ、性能指向型自動並列化コンパイラの4サブテーマを中心に研究を行なった。また、本国際共同研究のまとめを行ない、報告書を作成した。 1.自動並列化コンパイラのための視覚化システム 本国際共同研究では、最終的な目標の一つとして、自動並列化コンパイラのフロントエンド部とバックエンド部の統合がある。本研究グループでは、それらの共通の中間表現として、相手側研究グループで提案された階層的タスク・グラフを有力な候補として考えていたが、これは実際のプログラムに適用されると、非常に複雑かつ大規模なデータ構造となり、人間が直観的に理解するのに適さない。 そこで、本研究グループでは、並列化支援視覚化システムNaraViewを開発した。NaraViewは並列プログラムのプログラム構造、データ依存、制御依存、ソース・プログラムの4種類の構造を、三次元的に視覚化するものであり、並列化支援のためのシステムとして使われるだけでなく、自動並列化コンパイラ研究のための強力な解析ツールとしても利用可能である。 NaraViewのプログラム構造視覚化は、自動並列化コンパイラの中間表現として使われる階層的タスク・グラフを3次元的に視覚化したものである。この機能により、並列プログラムの時間的な流れ、並列性、ループ・ネストの階層を一目で理解することができる。また、NaraViewのデータ依存視覚化は、ループ中でアクセスされる配列を含む変数を二次元的に表し、ループのどのイタレーションで、どのようなアクセスが行なわれるか、その結果どのようなデータ依存が生じるか、といったことを一目で理解するための機能である。 2.依存を含むループの最小実行時間の見積り 平成7年度には、データとプログラムの両方を同時に分割する手法に関する研究を行なったが、これを実際のスケジューリングに適用するには、ループの最小実行時間の見積りが必要であった。特に、ループ中の異なるイタレーション間でデータ依存がある場合は、ループを展開して実行ステップを数えなければならない。しかしながら、ループを展開する手法は計算コストが高く、ループ全体を対象とするスケジューリングに適用するには問題があった。 そこで、本研究グループでは、このような場合、ループを展開することなく、その最小実行時間を見積もる手法を開発した。これは、ループ・ボディのみから、ループ・タスク・グラフと呼ばれるタスク・グラフを作成し、各データ依存を表す辺にイタレーションごとの重複度を重さとして与え、そこからループ実行の最短経路を求めるのに線形計画法を利用したものである。実験の結果、その解は非常に高速に求まり、その計算時間はループの繰り返し数に無関係であることが分かった。 3.分散メモリ型並列計算機に対する自動並列化コンパイラ 本研究は分散共有メモリ型並列計算機に対する自動並列化コンパイラの開発が主目的で、その技術をメッセージ・バッシング型並列計算機に適用することを予定していたが、本研究成果は、最近注目されているワークステーション・クラスタを含む、より一般的な分散メモリ型並列計算機にも適用可能であることが判明した。そこで、平成8年度には、共有メモリ型並列計算機を対象とした並列プログラムを、分散メモリ型並列計算機を対象とした形に変換する自動分散化コンパイラを新たに開発した。現在、本研究の成果の一つであるデータ分割配置の手法を、この自動分散化コンパイラに組み込み、全体として逐次プログラムを並列/分散システム上で効率良く稼働可能な並列プログラムに変換することのできる、自動並列分散化コンパイラの検討を行なっている。 4.性能指向型自動並列化コンパイラの研究 本研究サブテーマでは、与えられた並列計算機と並列プログラムに対して、最大の性能が得られるような並列性抽出手順を導き出すことに焦点を置いている。一般に並列性抽出手順の複雑さは、当該並列性抽出手法の順列組合せとなるため、各手順での評価時間が極めて小さくなければならない。平成7年度には、マイクロ秒のオーダーで当該性能予測を行なう並列計算機に対する解析モデルを構築したが、平成8年度には当該研究を論文としてまとめ、さらに無効化放送型のキャッシュ・コヒーレンス・プロトコルを対象としていた当該解析モデルを、書き込み放送型のプロトコルに適用可能となるように拡張した。 5.研究成果報告書の作成 平成6年度〜8年度の3年間にわたる本国際共同研究の研究成果をまとめ、研究成果報告書を日本語版、英語版の二種類で作成した。 続きを見る
本文を見る

類似資料:

6
「プログラム実行の局所性」の活用法に関する検討 by 林田, 隆則; Hayashida, Takanori; 村上, 和彰; Murakami, Kazuaki
6.
「プログラム実行の局所性」の活用法に関する検討 by 林田, 隆則; Hayashida, Takanori; 村上, 和彰; Murakami, Kazuaki