スーパーコンピューティングへの招待 東京大学情報基盤センター 概 要 • • • • 計算科学とスーパーコンピュータ SMASH スーパーコンピュータについて Oakleaf-FX 2 科学 • 理論(Theoretical Science)と実験 (Experimental Science)が2本の柱 • 計算科学(Computational Science) – 第3の柱(The third pillar of science),第3の科学 – 計算機シミュレーション • 第4の科学 – 大規模データに基づく予測と発見 – データ:実験・観測,計算から生成 3 計算科学(Computational Science) • 大型計算機(スーパーコンピュータ,スパコン)を 駆使して,実験が不可能な現象,事象をモデル により表現 – 宇宙科学,地球科学 – 人体シミュレーション – ナノサイエンス,マテリアルサイエンス • 解明されていないことは多い – 実測データが無いと検証できないこともある • 観測・実験との協力の重要性 – 計算機のパワー不足 • 最高速のスパコンでもまだまだ足りない分野はある 4 科学技術計算の手法 • 空間を細かい格子(メッシュ),粒子に分割 – 細かい(粒子が多い)ほど精度高い,計算量多い 有限要素法 差分法 有限体積法 Finite Element Method FEM Finite Difference Method FDM Finite Volume Method FVM 境界要素法 個別要素法 Boundary Element Method BEM Discrete Element Method DEM 5 有限要素法の例:横ずれ断層 • 変化量の大きいところでは細かい格子(メッシュ)が必要 6 台風のシミュレーション 解像度100km 解像度50km 解像度5km 〔画像提供:(独)海洋研究開発機構〕 2003年台風10号のシミュレーション 「地球シミュレータ」の利用 〔画像提供:(独)海洋研究開発機構〕 地球温暖化予測シミュレーション - 大気海洋結合大循環モデル MIROC - 現状の問題規模 大気格子数: 640x320x56(水平解像度約60 km) 海洋格子数: 1280x916x48(水平解像度約20 km) 20世紀気候再現+21世紀予測の 200 年計算を数ケース - これまで… 地球シミュレータで上記計算に数ヶ月程度を要した - 京(地球シミュレータの約100倍の計算能力)によって… 水平解像度 3 倍程度の計算が同じ程度の時間で可能に - 今後… 局所的な気候変動に関する適切な情報を提供するため、水平 解像度・ケースとも現状の 10 倍以上が必要 → 京の 100 倍程度の計算機が必要か(?) 〔資料提供:羽角博康教授(東京大学大気海洋研究所)〕 大気海洋結合モデルのイメージ図(上下の図はそれぞれ、温暖化予測結果 における地上気温上昇と水位) 〔資料提供:羽角博康教授(東京大学大気海洋研究所)〕 地上気温上昇 水位 〔資料提供:羽角博康教授(東京大学大気海洋研究所)〕 「京」コンピュータによるマルチスケール 心臓シミュレーション ek macro to micro u , u , X on e k S k , gk micro to macro 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 マクロ(臨床医学) ミクロ(基礎医学) 分子生物学の発展 膨大なアウトプット …….. ICa INaCaIca ……….. ICa,b 2+ Ca JSR NSR IK1 IK INaK INa INa, I Na GNa m3 h j (V Eb Na ) ・ ・ ・ ・ マルチスケール解析 (数理的手法) 世界初の試み 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 マルチスケール心臓シミュレーション 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 「京」コンピュータによるマルチスケール 心臓シミュレーション 概念図 64万コア コア5 コア4 コア3 コア2 コア1 通信 1,000コア 細胞間の直接的通信は発生しない 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 「京」コンピュータによるマルチスケール 心臓シミュレーション:数学モデル 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 「京」コンピュータによって・・・ • 生理学的に正しい心臓拍動のシミュレーションが可能 – 心臓では実際は興奮波が心筋壁内を伝播する。 – T2K東大(8,000コア)では再現できないが,京コンピュータでは 再現できる • 京コンピュータ(全系)を使っても1心拍の計算には2日程 度の計算時間がかかる – 10万自由度細胞 x 64万個 = 1,280億自由度 8,000細胞 T2K東大 8,000コア 640,000細胞 京コンピュータ 64万コア 〔資料提供:東京大学 久田・杉浦・鷲尾・岡田研究室,富士通(株)〕 • この他,2-3例(物作り系)追加予定 18 数値流体力学 (Computational Fluid Dynamics) • 航空機,自動車周囲・エンジン内空気の流れ計算→空気 抵抗軽減,省エネにつながる フリー画像の利用 大規模データ処理 • ゲノムの解読 • 衛星観測データ • 大規模テキスト処理 – Google 等 フリー画像の利用 • • • • 計算科学とスーパーコンピュータ SMASH スーパーコンピュータについて Oakleaf-FX 21 並列計算機によるシミュレーション に必要なこと • サイエンスから計算機ハードウェアま で幅広い知識が必要(SMASH) – – – – – Science Modeling Algorithm Software Hardware 科学,現象 微分方程式,計算モデル 数学アルゴリズム プログラム 計算機本体 • 各階層は独立した専門分野 • 一人で全てやるには限界がある – 協力が大切 – 協力のためには「自分の専門外について のある程度の知識」がなければならない Science Modeling Algorithm Software Hardware 22 • SMASHの5層を説明したい:背景に画像 • Science 科学,現象 – 色々な現象,シミュレーション結果 • Modeling 微分方程式,計算モデル – FEMとかの絵 • Algorithm 数学アルゴリズム – 数式,フローチャート • Software プログラム – プログラム,データ • Hardware 計算機本体 – 計算機 23 CO2地下貯留シミュレーション SMASHによる協力の実例 • CO2を地下(1km以深)に貯留:温暖化ガス削減に寄与 • 地球シミュレータ2 • 大成建設,海洋研究開発機構,NEC,東大情報基盤 センター,Lawrence Berkeley国立研究所による共同 研究・協力 • 2010年度地盤工学会地盤環境賞受賞 〔画像提供:山本肇博士(大成建設)〕 • Science(科学・現象) – 地下深部における超臨界状態のCO2の挙動(大成建設) • Modeling(微分方程式) – 三次元多相流れ(液体・気体)方程式+三次元物質移動方程式 • Modeling(計算モデル) – 有限体積法によるプログラムTOUGH2(Lawrence Berkeley) • 大規模な連立一次方程式(107元以上)を解いている部分が全体の90% 以上 • Algorithm(数学アルゴリズム) – 高速な連立一次方程式求解アルゴリズム(東大) • Software(プログラム) • Hardware(計算機本体) – 地球シミュレータ2(海洋研究開発機構,NEC) – TOUGH2の改良・高速化(Lawrence Berkeley, 東大,NEC) Science Modeling Algorithm Software Hardware CO2が地下水に溶けていく様子 正確な予測のためには細かいメッシュが必要⇒大規模な計 算モデル,連立一次方程式 粗いメッシュ 細かいメッシュ 〔画像提供:山本肇博士(大成建設)〕 • Science(科学・現象) – 地下深部における超臨界状態のCO2の挙動(大成建設) • Modeling(微分方程式) – 三次元多相流れ(液体・気体)方程式+三次元物質移動方程式 • Modeling(計算モデル) – 有限体積法によるプログラムTOUGH2(Lawrence Berkeley) • 大規模な連立一次方程式(107元以上)を解いている部分が全体の90% 以上 • Algorithm(数学アルゴリズム) – 高速な連立一次方程式求解アルゴリズム(東大) • Software(プログラム) • Hardware(計算機本体) – 地球シミュレータ2(海洋研究開発機構,NEC) – TOUGH2の改良・高速化(Lawrence Berkeley, 東大,NEC) Science Modeling Algorithm Software Hardware • 連立一次方程式の高速解法:50倍以上の高速化に貢献 – 1年かかっていた計算が 1週間でできる! – 同じ期間で50倍のケースを実行できる→科学・技術への発展 に寄与 計算科学・スーパーコンピューティングを 担う人材になるためには • 色々と勉強しなければならないことは多い:SMASH – 何にでも興味を持つことは大切 – 広く,浅い「何でも屋」が良いわけではない • T字型人間 – 一つ,深く掘り下げた専門分野を持っている – 関連した分野についても,ある程度の知識・知見を持っている • 協力が必要 – T字型人間が集まることによって,集団としての力は更に大き くなる • どの分野の専門家になるにしても「数学」は必須,「数 学」をちゃんと勉強しておこう! 例えば:3人のT字型人間 • A君 – 宇宙の起源を解明したい – その道具として世界一速いスーパーコンピュータが必要 • B君 – 世界一速いコンピュータを作りたい – 作ったコンピュータで今まで解けなかった問題が解けると嬉しい • Cさん – 数学的な理論の構築が大好き – 自分の考えた理論で今まで解けなかった問題が解けると嬉しい T字型人間の協力(Co-Design) S M A君 宇 宙 物 理 学 A Cさん 数 値 ア ル ゴ リ ズ ム S H B君 計 算 機 科 学 T字型人間の協力(Co-Design) S M A S H それぞれのTの字の縦棒が深く,横棒が広いほど 大きな成果が出る A君 宇 宙 物 理 学 Cさん 数 値 ア ル ゴ リ ズ ム B君 計 算 機 科 学 T字型人間の協力(Co-Design) S M A S H 3人の人が全て幸せになることも重要・・・例えば,A君のシ ミュレーションに取り組むことCさんが新しい手法を発見した り,B君が更に優れたコンピュータを開発できたり。 A君 宇 宙 物 理 学 Cさん 数 値 ア ル ゴ リ ズ ム B君 計 算 機 科 学 • • • • 計算科学とスーパーコンピュータ SMASH スーパーコンピュータについて Oakleaf-FX 35 スーパーコンピュータの歴史 • 計算機単体の処理速度は1.5年に2倍の割合で増加 – Moore’s Law:集積度が18ヶ月から24ヶ月で2倍(最近は鈍化) • 並列計算機の発達 – 今やPCも並列計算機:マルチコア – 100万個以上の計算機を接続している場合もある • 1983年:1 GFLOPS,1996年:1 TFLOPS,2002年:36 TFLOPS,2005年:280TFLOPS,2008年: 1,000TFLOPS – MFLOPS: Millions of FLoating Point OPerations per Second. (1秒間に106回の浮動小数点処理) – GFLOPS: 109回, TFLOPS: 1012回, PFLOPS: 1015回 • 電力消費量,信頼性が問題 36 TOP 500 List http://www.top500.org/ • 年2回更新 • LINPACKと言われるベンチマークテストを実施 する。 – 密行列を係数とする連立一次方程式を解く • 実際のアプリケーションではこれほどの性能は 出ない – 実アプリケーションに即したベンチマークを使用する 提案もある(HPCG) 37 • PFLOPS: Peta (=1015) Floating OPerations per Sec. • Exa-FLOPS (=1018) will be attained in 2020 http://www.top500.org/ 38 41st TOP500 List (June, 2013) Site Computer/Year Vendor National Supercomputing Center in Tianjin, China Oak Ridge National 2 Laboratory, USA Lawrence Livermore 3 National Laboratory, USA 1 4 RIKEN AICS, Japan 5 Argonne National Laboratory, USA 6 TACC, USA 7 Forschungszentrum Juelich (FZJ), Germany 8 DOE/NNSA/LLNL, USA Leibniz Rechenzentrum, Germeny 10 National Supercomputing Tianhe-1A Heterogeneous Node 2010 NUDT Center in Tianjin, China ITC/U. Tokyo Japan Rmax Rpeak Tianhe-2A Intel Xeon E5-2692, TH 33863 3120000 Express-2, IXeon Phi2013 NUDT (= 33.9 PF) Titan 560640 17590 Cray XK7/NVIDIA K20x, 2012 Cray Sequoia 1572864 17173 BlueGene/Q, 2011 IBM K computer, SPARC64 VIIIfx , 705024 10510 2011 Fujitsu Mira 786432 85867 BlueGene/Q, 2012 IBM Stampede 462462 5168 Xeon E5-2680/Xeon Phi, 2012 Dell JuQUEEN 458752 5009 BlueGene/Q, 2012 IBM Vulcan 393216 4293 BlueGene/Q, 2012 IBM SuperMUC 147456 2897 iDataPlex/Xeon E5-2680 2012 IBM 9 26 Cores Oakleaf-FX SPARC64 IXfx, 2012 Fujitsu Power 54902 17808 27113 8209 20133 7890 11280 12660 10066 3945 8520 4510 5872 2301 5033 1972 3185 3423 186368 2566 4701 4040 76800 1043 1135 1177 Rmax:実効性能(TFLOPS) Rpeak:ピーク性能(TFLOPS),Power: kW http://www.top500.org/ 39 スーパーコンピュータの将来(1/2) • 技術的問題 – 消費電力 – スケーラビリティ(多数のコアを同時に動かす場合の計算性能) • ペタスケールシステム(現在の世界最大級) – 2MW(年2億円,空調込み),O(105~106)コア • エクサスケールシステム(ペタスケールの1,000倍級) – 2018年~2020年頃 – 単純に1,000倍すると・・・ • 2GW(年2,000億円!), O(108~109)コア – 消費電力を20MW(すなわち100倍の効率)程度に収められるよ うな技術の達成のために様々な研究開発が進められている • 演算装置,メモリ,ネットワーク・・・ 40 スーパーコンピュータの将来(2/2) • コンピュータそのものだけでなく,計算モデル,計算手法を 改良していくことが必要 • 様々な分野(計算機科学,応用数学,科学・工学)の研究 者,技術者の協力が必要 – エクサスケールシステムは,現在のような「何でもできる」汎用的 なプロセッサでは達成不可能と言われている – 解く問題のために必要な機能を備えた計算機を開発していくこと が必要 41 • • • • 計算科学とスーパーコンピュータ SMASH スーパーコンピュータについて Oakleaf-FX 42 • この後にFX10のビデオをつなぐ(設置部分は 高速に) 43
© Copyright 2024 ExpyDoc