atpress

PLAYSTATION3で動作する世界最高速の密行列LU分解プログラムを公開

技術・開発
2008年5月27日 09:30
FacebookTwitterLine
報道関係者各位
プレスリリース                      2008年5月27日
                   東京工業大学客員教授 小長谷 明彦

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  PLAYSTATION3で動作する世界最高速の密行列LU分解プログラムを公開
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

2008年Cellスピードチャレンジ(実行委員長:吉瀬 謙二(東京工業大学))の規定
課題部門で最優秀賞を受賞した東京工業大学小長谷研究室チーム(里城 晴紀)の
プログラムを先進的計算基盤システムシンポジウムSACSIS2008
(6月11日~13日、於 つくば国際会議場)にて公開します。

2回目となるマルチコアプログラミングコンテストCellスピードチャレンジ
では、日本全国から88チームが参加するレベルの高いスピードチャレンジと
なりました。規定課題部門のテーマは密行列のLU分解に基づく連立一次方程式の
求解で、これはスーパーコンピュータの世界一を決めるHPL(High-Performance
Linpack Benchmark)にも採用されており、今回、Cell Broadband Engineを搭載
するPLAYSTATION3でどこまで性能を引き出せるかが注目されていました。

LU分解の解法としては、更新する列の右側を参照するright-looking法
(通常のガウス法)と左側を参照するleft-looking法が知られています。一般に、
left-looking法は参照するデータの局所性が強いという利点がありますが、
ブロック並列化した場合には通信回数が増えるという欠点があります。
このため、分散メモリ型並列計算機の並列プログラミングではright-looking法
を用いるのがこれまでの定石でありました。今回、小長谷研究室チームでは、
あえてleft-looking法を採用し、各SPE(Synergistic Processor Element,
単体性能25.6GFLOPS, 3.2GHz時)のメモリへのアクセス回数を最小化することに
より、SPEを7基搭載するPLAYSTATION3において、理論ピーク性能179.2GFLOPSの
76.9パーセント(従来記録はIBMの75.9パーセント)にあたる137.8GFLOPSを達成
しました。

今回のコンテストでは、密行列のサイズに32×32の倍数という制約を加えて
いたため、逐次実行部分となる32×32の密行列のLU分解をいかにして高速化
するかが鍵となりました。小長谷研究室チームでは、新規にPDS(Plan Do See)
サイクルと呼ばれるCell Broadband Engineのためのプログラム最適化戦略
(この成果でCellスピードチャレンジ自由課題部門の第2位を受賞)を開発し、
シミュレータと実機との性能差から性能を制限する要因(メモリアクセスの
ボトルネック、パイプラインハザードなど)を推察することで最適化コードの
開発に成功しました。

【本件に関するお問い合わせ先】
担当 : 小長谷 明彦(東京工業大学客員教授)
TEL  : 03-5734-2826
E-mail: kona@bio.cs.titech.ac.jp
URL  : http://www.bio.cs.titech.ac.jp/

<参考URL>
Cellスピードチャレンジ2008: http://www.hpcc.jp/sacsis/2008/cell/
SACSIS2008: http://www.hpcc.jp/sacsis/2008/

“PLAYSTATION”は株式会社ソニー・コンピュータエンタテインメントの
登録商標です。
“Cell Broadband Engine”は株式会社ソニー・コンピュータエンタテインメント
の商標です。

カテゴリ

配信企業へのお問い合わせ

取材依頼・商品に対するお問い合わせはこちら。
プレスリリース配信企業に直接連絡できます。

プレスリリース配信サービスページ