東京大学情報基盤センター 平成20年度公募型プロジェクト報告会

1
アルゴリズム・アプリグループ会合
• 2015年8月13日(木)13:00-15:00
• 東大情報基盤センター3F大会議室 他
• 出席者
–
–
–
–
–
中島,片桐,大島(東大)
高橋(筑波),藤井(工学院),尾崎(芝工大)
遠隔(理研AICS):今村,八代
遠隔(北大):岩下,深谷
遠隔(京大):伊田
2015/08/14
2
[c/o S.Matsuoka]
2015/08/14
3
ポストムーアEra (1/2)
• Moore⇒Post Moore
– (これまで)18~24ヶ月で単位面積あたりトランジスタ量が2倍⇒
その勢いでプロセッサ速度も増加
– 2025年頃:単位面積当り=ノード当りFLOPS頭打ち
• 消費電力
• 良いニュース
– 三次元積層によりメモリバンド幅は一時的に最大1桁程度増加,
メモリ容量も増加する(最大1桁)
• 楽観的・悲観的な2つのシナリオが考えられる
– HDへの書き込み速度,容量増加,不揮発性メモリ
– ネットワーク⇒光ネットワーク
– FPGAの高度化
2015/08/14
4
ポストムーアEra (2/2)
• システムとしての計算能力を高めるためには,基本的に
はノード数を増やしていくしかない
– 消費電力の制限,FPGAの導入が有望かも知れない,Grid …
• レイテンシは減らない
• あらゆる局面で階層が深化する
– メモリ:XY方向とZ方向では異なる
– キャッシュ,メモリ,ネットワーク
• このような状況に対応したソフトウェア,アルゴリズム,ア
プリケーションを整備していくことが必要
– 単純にB/F値が増える,というわけには行かない
• アーキテクチャグループmeetingのキーワード(8月11日)
– ニアメモリ・プロセッシング,Near threshold level
supercomputing,Approximate computing
2015/08/14
5
科研新学術領域:2015年秋提案
• ポストポスト京,ポストムーアeraを指向したシステムソフト
ウェア,数値アルゴリズム,アプリケーションの開発
• 構成
‒ アーキテクチャ(天野(慶応)):ハードを作るのが目的ではない
‒ システムソフトウェア(松岡(東工大))
‒ アルゴリズム・アプリケーション(中島(東大))
• 若手中心
‒ 2025年度には松岡さんと中島は63歳・・・
‒ 計画班:現在40前後の人が中心となっていくべき
2015/08/14
6
アルゴリズム・アプリグループの構成案
• 計画班を余り多くできないかも知れないが・・・
• アルゴリズム+疎行列(岩下(北大))
‒ 伊田(京大),藤井(工学院)
 連携:深谷(北大),高橋(同大),美船(京大),鷲尾(東大),曽我部(名
大)
• 自動チューニング+密行列(片桐)
‒ 今村(理研),山本(電通大),高橋(筑波大),尾崎(芝工大)
 連携:直野(日立),田中(工学院),黒田(愛媛),佐藤(NIFS),長尾(東
大)
• アプリ実装(中島)
‒ 小野(理研),八代(理研),市村(東大ERI)
 連携:羽角・佐藤(東大AORI),堀・古村(東大ERI),藤堂・常行(東大理)
2015/08/14
7
アルゴリズムとしての動向
• 陰解法が息を吹き返す(廃れていたとは全く思わないが)
• 結局のところ通信,特に同期を削減したアルゴリズム
‒ 非同期通信,階層化:レイテンシを隠す
– 階層化された通信・計算:密行列,FFT(?),hCGA(下図)
– Out-of-core的手法:HD,メモリ,キャッシュ:大容量キャッシュ
• 精度保証
• FPGAを使いこなす
– if文がたくさんあるもの
• FTは松岡さんに任せる
• 計算量よりデータ移動重視
– と言うが・・・
– その恩恵はあるのか ?
– 2つのシナリオ
Fine
Level=1
Level=2
Level=m-3
Level=m-3
Level=m-2
Coarse
Coarse grid solver on a
single MPI process (multithreaded, further multigrid)
2015/08/14
8
個人的にやりたいこと,やるべきこと
• Parallel-in-Time(来週AICSでセミナーあり)
‒ 非定常問題の高速化:時間方向のconcurrency
‒ 空間+時間方向のマルチグリッド
 従来の時間積分法はPoint-wiseのJacobi,Gauss-Seidel等に相当
 XBraid:Lawrence Livermore National Laboratory
‒ 悪条件問題,非線形,H-Matrix
‒ Moving Mesh,AMR
• 性能評価モデル構築 for AT
‒ アーキテクチャ検討との連携上,これは必要
2015/08/14
9
アプリ実装計画班(1/2)
• ターゲットアプリ
– 大気・海洋:佐藤・羽角(東大・AORI):NICAM,COCO
– 地震・防災:堀・古村・市村(東大・地震研):Seism3D,他
– 物性・材料:常行・藤堂(東大・物理),吉本(東大・情理):ALPS,
他
• 主たる構成
–
–
–
–
中島(東大):Parallel-in-Time(大して何もできない(涙))
小野(理研):可視化
八代(理研):大気海洋,カプラー
市村(東大・地震研):非線形Multi-Physics FEM
• 連携
– 佐藤,羽角(東大AORI),堀,古村(東大ERI)
– 常行・藤堂(東大・物理)
2015/08/14
10
アプリ実装計画班(2/2)
• 開発・実装・評価
– 可視化,カプラー:階層性を考慮
• 実装・評価
– 疎行列ソルバー,密行列ソルバー,FFT
• FPGA
– 複雑なオペレーション
– アーキテクチャ,システムグループとの協力(塙,大島)
• 実証
– KNL(ポストT2K):MCDRAM+DDR
– ネットワークの階層性については現状でもある程度可能か?
• 想定される公募班
– 佐野(東北大):FPGA+アプリケーション
– 吉本(東大・情理):物性(第一原理)
– 松村(北大):海洋モデル
2015/08/14
11
議論,要摺り合わせ事項
• Fault Tolerance/Resilienceはシステム側で
• 検証方法・環境
– 2020年頃までに出てくるシステムでやる
– FPGAもシミュレータ
• メモリバンド幅については楽観的,悲観的な2シナリオを
考える必要あり
– 非構造格子はPost Mooreで少し良くなるかも(楽観的な場合)
• ATは疎行列も守備範囲
• レイテンシを隠蔽するアルゴリズム
– out-of-core的手法の積極的活用
• ビッグデータ向け:松岡BD-CRESTの成果活用
– グラフ,ソートにATを入れる(片桐)
• ポストペタCRESTの成果活用,機能拡張を陽に謳うべき
2015/08/14
12
大気・海洋分野(佐藤)
• 新しい話は八代さん,松村さん(北大)に任せよう!
• NICAM,COCOは半陰解法
– COCO:完全にポアソン方程式を解いているのは松村版のみ
• Parallel-in-time
– 四次元データ同化との関連
2015/08/14
13
地震・防災(市村)
• 非線形動的固体力学:地盤,建物,分岐アリ:FPGA有効
• (ボクセル型+四面体)有限要素法,GMG+混合精度
(混合メッシュかも)
– AMGを使いたい
– 安定性:収束する範囲でやっているがもっと色々やりたい
• Element-by-Elementの適用
– マトリクスの準備に時間がかかる
– 収束が速い,相対的にコスト高い:質量マトリクスで安定化
•
•
•
•
メッシュ生成:細分化(ボクセル+四面体)⇒京で1兆DOF
可視化:表面のみ
連成問題:地盤+構造物:吸収条件等を考慮:力ずく
Parallel-in-TimeはGB@SC15向けにやる予定だった
– 古村さんは非線形問題を陰解法でやりたいと言うだろう
2015/08/14
14
物性・材料(常行,藤堂)(1/2)
• とにかくアプリの種類が多い・・・
• 行列も様々
–
–
–
–
意外に疎行列が多い,固有値問題:CG,前処理無し
密行列の対角化もある
強相関:密行列のSVDで解いている⇒LRAの適用?
非エルミート:非平衡の電流,強相関系第一原理等:少数派
• FFT
– 大規模問題では使われなくなりつつある⇒差分法,有限要素法
– 小規模・精度を要するケース:大規模問題で使えれば嬉しい
– ポアソン方程式を解くのにも使われているがあまり支配的でない。
• Parallel-in-Time
– Pararealの話は聞いたことある:予測子修正子法みたいなやつ
– 使えればそれはとても有効
2015/08/14
15
物性・材料(常行,藤堂)(2/2)
• ポスト処理
– 物性値の計算,ナノ構造体の電気伝導
– グローバルな問題になる:行列積の計算が必要(密・疎?)
• 可視化:大規模な第一原理計算では見てもわからなくなる,
部分的に取り出すことは必要
• 定量的なモデリング手法
– 大規模な計算結果をポスト処理する,Fitting,疎視化
• FPGA
– ALPS
• 若手
– 吉本さん(東大),岩田さん(東大),重田さん(筑波)
– 全体を見通せる人が居ると良いのだが
2015/08/14