1 アルゴリズム・アプリグループ会合 • 2015年8月13日(木)13:00-15:00 • 東大情報基盤センター3F大会議室 他 • 出席者 – – – – – 中島,片桐,大島(東大) 高橋(筑波),藤井(工学院),尾崎(芝工大) 遠隔(理研AICS):今村,八代 遠隔(北大):岩下,深谷 遠隔(京大):伊田 2015/08/14 2 [c/o S.Matsuoka] 2015/08/14 3 ポストムーアEra (1/2) • Moore⇒Post Moore – (これまで)18~24ヶ月で単位面積あたりトランジスタ量が2倍⇒ その勢いでプロセッサ速度も増加 – 2025年頃:単位面積当り=ノード当りFLOPS頭打ち • 消費電力 • 良いニュース – 三次元積層によりメモリバンド幅は一時的に最大1桁程度増加, メモリ容量も増加する(最大1桁) • 楽観的・悲観的な2つのシナリオが考えられる – HDへの書き込み速度,容量増加,不揮発性メモリ – ネットワーク⇒光ネットワーク – FPGAの高度化 2015/08/14 4 ポストムーアEra (2/2) • システムとしての計算能力を高めるためには,基本的に はノード数を増やしていくしかない – 消費電力の制限,FPGAの導入が有望かも知れない,Grid … • レイテンシは減らない • あらゆる局面で階層が深化する – メモリ:XY方向とZ方向では異なる – キャッシュ,メモリ,ネットワーク • このような状況に対応したソフトウェア,アルゴリズム,ア プリケーションを整備していくことが必要 – 単純にB/F値が増える,というわけには行かない • アーキテクチャグループmeetingのキーワード(8月11日) – ニアメモリ・プロセッシング,Near threshold level supercomputing,Approximate computing 2015/08/14 5 科研新学術領域:2015年秋提案 • ポストポスト京,ポストムーアeraを指向したシステムソフト ウェア,数値アルゴリズム,アプリケーションの開発 • 構成 ‒ アーキテクチャ(天野(慶応)):ハードを作るのが目的ではない ‒ システムソフトウェア(松岡(東工大)) ‒ アルゴリズム・アプリケーション(中島(東大)) • 若手中心 ‒ 2025年度には松岡さんと中島は63歳・・・ ‒ 計画班:現在40前後の人が中心となっていくべき 2015/08/14 6 アルゴリズム・アプリグループの構成案 • 計画班を余り多くできないかも知れないが・・・ • アルゴリズム+疎行列(岩下(北大)) ‒ 伊田(京大),藤井(工学院) 連携:深谷(北大),高橋(同大),美船(京大),鷲尾(東大),曽我部(名 大) • 自動チューニング+密行列(片桐) ‒ 今村(理研),山本(電通大),高橋(筑波大),尾崎(芝工大) 連携:直野(日立),田中(工学院),黒田(愛媛),佐藤(NIFS),長尾(東 大) • アプリ実装(中島) ‒ 小野(理研),八代(理研),市村(東大ERI) 連携:羽角・佐藤(東大AORI),堀・古村(東大ERI),藤堂・常行(東大理) 2015/08/14 7 アルゴリズムとしての動向 • 陰解法が息を吹き返す(廃れていたとは全く思わないが) • 結局のところ通信,特に同期を削減したアルゴリズム ‒ 非同期通信,階層化:レイテンシを隠す – 階層化された通信・計算:密行列,FFT(?),hCGA(下図) – Out-of-core的手法:HD,メモリ,キャッシュ:大容量キャッシュ • 精度保証 • FPGAを使いこなす – if文がたくさんあるもの • FTは松岡さんに任せる • 計算量よりデータ移動重視 – と言うが・・・ – その恩恵はあるのか ? – 2つのシナリオ Fine Level=1 Level=2 Level=m-3 Level=m-3 Level=m-2 Coarse Coarse grid solver on a single MPI process (multithreaded, further multigrid) 2015/08/14 8 個人的にやりたいこと,やるべきこと • Parallel-in-Time(来週AICSでセミナーあり) ‒ 非定常問題の高速化:時間方向のconcurrency ‒ 空間+時間方向のマルチグリッド 従来の時間積分法はPoint-wiseのJacobi,Gauss-Seidel等に相当 XBraid:Lawrence Livermore National Laboratory ‒ 悪条件問題,非線形,H-Matrix ‒ Moving Mesh,AMR • 性能評価モデル構築 for AT ‒ アーキテクチャ検討との連携上,これは必要 2015/08/14 9 アプリ実装計画班(1/2) • ターゲットアプリ – 大気・海洋:佐藤・羽角(東大・AORI):NICAM,COCO – 地震・防災:堀・古村・市村(東大・地震研):Seism3D,他 – 物性・材料:常行・藤堂(東大・物理),吉本(東大・情理):ALPS, 他 • 主たる構成 – – – – 中島(東大):Parallel-in-Time(大して何もできない(涙)) 小野(理研):可視化 八代(理研):大気海洋,カプラー 市村(東大・地震研):非線形Multi-Physics FEM • 連携 – 佐藤,羽角(東大AORI),堀,古村(東大ERI) – 常行・藤堂(東大・物理) 2015/08/14 10 アプリ実装計画班(2/2) • 開発・実装・評価 – 可視化,カプラー:階層性を考慮 • 実装・評価 – 疎行列ソルバー,密行列ソルバー,FFT • FPGA – 複雑なオペレーション – アーキテクチャ,システムグループとの協力(塙,大島) • 実証 – KNL(ポストT2K):MCDRAM+DDR – ネットワークの階層性については現状でもある程度可能か? • 想定される公募班 – 佐野(東北大):FPGA+アプリケーション – 吉本(東大・情理):物性(第一原理) – 松村(北大):海洋モデル 2015/08/14 11 議論,要摺り合わせ事項 • Fault Tolerance/Resilienceはシステム側で • 検証方法・環境 – 2020年頃までに出てくるシステムでやる – FPGAもシミュレータ • メモリバンド幅については楽観的,悲観的な2シナリオを 考える必要あり – 非構造格子はPost Mooreで少し良くなるかも(楽観的な場合) • ATは疎行列も守備範囲 • レイテンシを隠蔽するアルゴリズム – out-of-core的手法の積極的活用 • ビッグデータ向け:松岡BD-CRESTの成果活用 – グラフ,ソートにATを入れる(片桐) • ポストペタCRESTの成果活用,機能拡張を陽に謳うべき 2015/08/14 12 大気・海洋分野(佐藤) • 新しい話は八代さん,松村さん(北大)に任せよう! • NICAM,COCOは半陰解法 – COCO:完全にポアソン方程式を解いているのは松村版のみ • Parallel-in-time – 四次元データ同化との関連 2015/08/14 13 地震・防災(市村) • 非線形動的固体力学:地盤,建物,分岐アリ:FPGA有効 • (ボクセル型+四面体)有限要素法,GMG+混合精度 (混合メッシュかも) – AMGを使いたい – 安定性:収束する範囲でやっているがもっと色々やりたい • Element-by-Elementの適用 – マトリクスの準備に時間がかかる – 収束が速い,相対的にコスト高い:質量マトリクスで安定化 • • • • メッシュ生成:細分化(ボクセル+四面体)⇒京で1兆DOF 可視化:表面のみ 連成問題:地盤+構造物:吸収条件等を考慮:力ずく Parallel-in-TimeはGB@SC15向けにやる予定だった – 古村さんは非線形問題を陰解法でやりたいと言うだろう 2015/08/14 14 物性・材料(常行,藤堂)(1/2) • とにかくアプリの種類が多い・・・ • 行列も様々 – – – – 意外に疎行列が多い,固有値問題:CG,前処理無し 密行列の対角化もある 強相関:密行列のSVDで解いている⇒LRAの適用? 非エルミート:非平衡の電流,強相関系第一原理等:少数派 • FFT – 大規模問題では使われなくなりつつある⇒差分法,有限要素法 – 小規模・精度を要するケース:大規模問題で使えれば嬉しい – ポアソン方程式を解くのにも使われているがあまり支配的でない。 • Parallel-in-Time – Pararealの話は聞いたことある:予測子修正子法みたいなやつ – 使えればそれはとても有効 2015/08/14 15 物性・材料(常行,藤堂)(2/2) • ポスト処理 – 物性値の計算,ナノ構造体の電気伝導 – グローバルな問題になる:行列積の計算が必要(密・疎?) • 可視化:大規模な第一原理計算では見てもわからなくなる, 部分的に取り出すことは必要 • 定量的なモデリング手法 – 大規模な計算結果をポスト処理する,Fitting,疎視化 • FPGA – ALPS • 若手 – 吉本さん(東大),岩田さん(東大),重田さん(筑波) – 全体を見通せる人が居ると良いのだが 2015/08/14
© Copyright 2024 ExpyDoc