HOKUSAI-G GreatWave シス テムの概 概要 1.1 シ システム構 構成 HOK KUSAI-GreatWave システムは、 シ 超並列演算システム ム、アプリケ ケーション ン演算サ ーバ群(大容量メモ モリ演算サ サーバ、GP PU 演算サー ーバ)と、シ システムの利 利用入口と となるフ ロントエンドサー ーバ、用途の異なる 2 つのスト トレージ(オ オンライン ・ストレー ージ、階 層型ストレージ)か から構成さ されるシステ テムです。 図 0-1 システム ム構成図 超並列 列演算シス ステム(MPC C)は、FUJ ITSU Supe ercomputer PRIMEH PC FX100 0 で構成 します。 。FX100 は高性能プ は プロセッサ(S SPARC64 XIfx)と高速 速メモリを を採用し、1 ノード あたり 32 コア/CPU で 1TF FLOPS(倍精 精度)の理論 論演算性能と 480GB//s の高いメ メモリバ ンド幅を有します す。超並列演算システ テムは 1,08 80 ノード(総 総理論演算 算性能 1PFLOPS、 総主記憶 憶容量 33..7TB)で構成 成され、6 次元メッシ シュ/トーラ ラスインタ ターコネクト ト(Torus 1 Fusion インターコ コネクト 2* 2 )により、 、ノード間 間は 12.5GB B/s×双方向 向で高速か かつ低レ イテンシに密結合 合されます。 *1 Torus Fusion インタ ターコネクト 2 は、富士通の の高速インター ーコネクトの呼 呼称です。 Copyrright (C) RIK KEN, Japan.. All rights reserved. r 1 大容量メモリ演算サーバ(ACSL)は、PRIMERGY RX4770 M1 を 2 ノードで構成し ます。1 ノードの理論演算性能は 1.2TFLOPS、主記憶容量は 1TB です。GPU 演算サ ーバ(ACSG)は、SGI C2108-GP5 を 30 ノードで構成します。1 ノードの理論演算性 能は 883.2GFLOPS、主記憶容量は 64GB です。GPU 演算サーバ(ACSG)の各ノード にはアクセラレータ(NVIDIA Tesla K20X)を 4 枚搭載します(本運用までに搭載)。各ノ ードは、InfiniBand FDR(6.8GB/s×双方向)で接続され、高速なノード間通信とファイ ル共有を実現します。 ストレージ環境は、オンライン・ストレージ(OFS)、階層型ストレージ(HSM)で構 成します。 オンライン・ストレージ(OFS)は、各ユーザーのホームディレクトリや課題グルー プ用の共有ディレクトリなど、広帯域でオンライン性のあるファイルシステムであ り、超並列演算システム、アプリケーション演算サーバ群およびフロントエンドサー バから参照可能です。利用可能容量は合計 2.2PB です。 階層型ストレージ(HSM)は、長期保存が必要な大容量のデータ・ファイルを格納す るファイルシステムであり、1 次ストレージ(キャッシュディスク)300TB、2 次ストレ ージ(テープライブラリ装置)7.9PB(非圧縮)を用意しています。ユーザーはテープライ ブラリ装置を操作することなく、データのテープ書込み・読み出し操作が可能となり ます。 HOKUSAI-GreatWave システムへのアクセスは、ssh/scp によるアクセスと HTTPS アクセス(利用者ポータル、プログラミング支援ツール)が可能です。ユーザーはフロ ントエンドサーバ上にて、プログラムの編集、コンパイル/リンク、バッチジョブの操 作、インタラクティブジョブの実行、チューニング、デバッグ等の作業を行うことが 可能です。 Copyright (C) RIKEN, Japan. All rights reserved. 2 1.2 ハ ハードウェ ェア概要 1.2.1 超 超並列演算 算システム(MPC) 演算 算性能 CP PU: SPARC C64™XIfx (1.975GHzz) 1,080 台(1,080CP 台 U, 34,560 コア) 理論 論ピーク性 性能: 1.092PFLOPS ( 1.975GHz z×16 演算×32 コア× ×1,080CP PU) メモ モリ メモ モリ容量: 33.7TB(32 3 2GB×1080 0 台) メモ モリバンド ド幅: 480GB B/s/CPU メモ モリバンド ド幅/FLOP: 0.47Byte//FLOP イン ンターコネ ネクト(Tofu u インターコ コネクト 2) 2 6次 次元メッシ シュ/トーラス 通信 信性能:ノー ード間 12.5 5GB/s×双 双方向 1.2.2 アプリケーション演 演算サーバ バ(ACS) アプリケーショ ョン演算サーバは、大 大容量メモリ演算サー ーバ(ACSL))と GPU 演算サー 演 バ(ACS SG)で構成されます。 1.2.2.1 1 大容量メ メモリ演算サ サーバ(ACS L) 演算 算性能 CP PU: Intel Xe eon E7-4880v2 (2.50 0GHz) 2 台(8CPU, 台 12 20 コア) 理論 論ピーク性 性能: 2.4TFLOPS (2.5 5GHz×8 演算×15 演 コア×8CPU コ U) メモ モリ メモ モリ容量: 2TB(1TB 2 × 2 台) メモ モリバンド ド幅: 85.3G GB/s/CPU メモ モリバンド ド幅/FLOP: 0.28Byte//FLOP 内蔵 蔵ディスク ク ディスク容量 量: 3.6TB ((300GB × 2 + 1.2TB B) × 2 台) 台 ンターコネ ネクト イン FD DR InfiniBand 通信 信性能:ノー ード間 6.8G GB/s×2 本 本×双方向 Copyrright (C) RIK KEN, Japan.. All rights reserved. r 3 1.2.2.2 GPU 演算サーバ(ACSG) 演算性能 CPU: Intel Xeon E5-2670 v3 (2.30GHz) 30 台(60CPU, 720 コア) 理論ピーク性能: 26.4TFLOPS (2.3GHz×16 演算×12 コア×60CPU) 主記憶 メモリ容量: 1.8TB(64GB × 30 台) メモリバンド幅: 68.2GB/s/CPU メモリバンド幅/FLOP: 0.15Byte/FLOP 内蔵ディスク ディスク容量: 18TB ((300GB × 2) × 30 台) インターコネクト FDR InfiniBand 通信性能:ノード間 6.8GB/s×双方向 アクセラレータ NVIDIA Tesla K20X ×4 枚/ノード Copyright (C) RIKEN, Japan. All rights reserved. 4 1.3 ソフトウェア構成 HOKUSAI-GreatWave システムで利用可能なソフトウェア一覧を以下に示します。 表 0-1 ソフトウェア一覧 項目 超並列演算システム(MPC) アプリケーション フロントエンドサーバ 演算サーバ群(ACS) XTCOS(FX100 用 OS) Red Hat Enterprise Linux 6 Red Hat Enterprise Linux 6 (Linux kernel version 2.6) (Linux kernel version 2.6) (Linux kernel version 2.6) コ ン Technical Computing インテル Parallel Studio XE Technical Computing パ イ Language(Fujitsu) Composer Edition(Intel) Language(Fujitsu) OS インテル Parallel Studio XE ラ Composer Edition(Intel) ラ イ Technical Computing ブ ラ Language(Fujitsu) リ - BLAS, LAPACK, ScaLAPACK, MPI, SSLII, インテル MKL - BLAS, LAPACK, ScaLAPACK, インテル MPI C-SSLII, SSLII/MPI、高速 4 Language(Fujitsu) インテル MKL インテル MPI IMSL Fortran ライブラリ 倍精度基本演算ライブラリ ア プ Technical Computing Gaussian, Amber, ADF, GaussView, リ ケ ANSYS(multiphysics) ANSYS(preppost) ー シ GOLD/Hermes, MATLAB, ョン Q-Chem Gaussian 超並列演算システム(SPARC)とアプリケーション演算サーバ群(Intel)は異なる CPU アーキテクチャですが、フロントエンドサーバにて両システムのプログラム開 発が可能です。 Copyright (C) RIKEN, Japan. All rights reserved. 5 1.4 R RICC ハー ードウェア ア概要 PC ク クラスタは は、超並列 PC P クラス スタ (Massively Parallel Cluster)) [486 台(3 3888 コ ア)の計 計算ノード]] と多目的 的 PC クラス スタ(Multi--purpose Parallel P Cl uster)[100 台(800 コア)の の計算ノード]で構成さ されます。 1.4.1 超 超並列 PC C クラスタ 演算性能 Intel Xeon X5570 (2.93GHz) 486 台 (952CPU U, 3888 コア) 理論ピーク性能 能: 2.93GHz × 4 演算 算 × 4 コア コ × 972 2CPU = 455.6 TFLOP PS 主記憶 憶容量 5.8TB(12GB × 486 台) 幅: 25.58GB B/s = 1066 6MHz (DDR R3-1066) × 8Byte × 3chann nel メモリバンド幅 Byte//FLOP: 0.5 54 (Btye/Fllop) = 25.5 58GB/s / (2.93GHz z × 4 演算 算 × 4 コア) ディスク容量 272T TB((147GB B × 3 + 73GB) × 4 436 台 + (147GB × 6 + 73GB B) × 50 台) 台 インターコネク クト(DDR InfiniBand)) 台の計算ノ ノードに DD DR InfiniBa を 一つの計算 算用ネット トワーク 486 台 and HCA を搭載し、 として接 接続されて ており、計算用ネット トワーク内は、双方向 向通信可能 能で片方向 16Gbps の性能が が得られる るよう構成されていま ます。 1.4.2 多目的 PC C クラスタ 演算性能 570 (2.93G GHz) 100 台 (200CPU, 800 コア ア) + NV VIDIA Tesla a C2075 Intel Xeon X55 アクセラレー ータ 100 台 GPU ア 理論ピーク性能 能:2.93GHz z × 4 演算 算 × 4 コア ア × 100CPU = 9.33 TFLOPS 1.03 TFL LOPS (単精 精度) × 100 = 103 TFLOPS T 主記憶 憶容量 2.3 T TB(24GB × 100 台)) メモリバンド幅 幅: 25.58GB B/s = 1066 6MHz (DDR R3-1066) × 8 Byte × 3chan nnel Byte//FLOP: 0.5 54 (Btye/Fllop) = 25.5 58GB/s / (2.93GHz z × 4 演算 算 × 4 コア) ディスク容量 25.0 TB ( 250G GB × 100 0 台) インターコネク クト(DDR InfiniBand)) 台の計算ノ ノードに DD DR InfiniBa を 一つの計算 算用ネット トワーク 100 台 and HCA を搭載し、 として接 接続されて ており、計算用ネット トワーク内は、双方向 向通信可能 能で片方向 16Gbps の性能が が得られる るよう構成されていま ます。 Copyrright (C) RIK KEN, Japan.. All rights reserved. r 6 1.4.3 フロントエ エンド計算機 フロントエンド ド計算機は、RICC を を利用する場 場合に最初 初にログイン ンするホス ストであ り、PC C クラスタ タのプログラ ラム開発・ ・実行環境を提供しま ます。 フロントエンド ド計算機はログインサ サーバ × 4 台で構成 成されてお り、冗長化 化された 高信頼な なフロント トエンド計算機システ テムを構成しています す。 1.4.4 非 非並列ジョ ョブ用データ処理 SS SD 搭載クラ ラスタ RICC C から利用 用できる非並 並列ジョブ ブ用データ処 処理 SSD 搭載クラス 搭 スタ(以下、非並列 ジョブ用 用クラスタ タ)は、主に非並列か かつ実行中に高速な I/O が必要な なジョブの のための 環境を提 提供します す。 ローカルディス スク領域 SSD 360GB (3 30GB / コア ア) データ転送用イ インターコネクト QDR R InfiniBand d Copyrright (C) RIK KEN, Japan.. All rights reserved. r 7 1.5 RICC ソフトウェア構成 RICC システムで利用可能なソフトウェア一覧を以下に示します。 表 0-2 ソフトウェア一覧 項目 超並列 PC クラスタ 多目的 PC クラスタ 非並列ジョブ用 フロントエンド (MPC) (UPC) クラスタ(SSC) 計算機 OS Red Hat Enterprise Linux 5 (Linux kernel version 2.6) コンパイラ 富士通コンパイラ インテル Parallel Studio XE Composer Edition for Fortran and C++ Linux ライブラリ 富士通数学ライブラリ - BLAS, LAPACK, ScaLAPACK, MPI, SSLII, C-SSLII, SSLII/MPI インテル MKL - BLAS, LAPACK, ScaLAPACK アプリケー ション GOLD/Hermes Gaussian, Amber, Gaussian, Amber, ADF, Q-Chem ADF, Q-Chem, GaussView GOLD/Hermes Copyright (C) RIKEN, Japan. All rights reserved. 8
© Copyright 2024 ExpyDoc