システム概要

HOKUSAI-G
GreatWave シス テムの概
概要
1.1 シ
システム構
構成
HOK
KUSAI-GreatWave システムは、
シ
超並列演算システム
ム、アプリケ
ケーション
ン演算サ
ーバ群(大容量メモ
モリ演算サ
サーバ、GP
PU 演算サー
ーバ)と、シ
システムの利
利用入口と
となるフ
ロントエンドサー
ーバ、用途の異なる 2 つのスト
トレージ(オ
オンライン ・ストレー
ージ、階
層型ストレージ)か
から構成さ
されるシステ
テムです。
図 0-1 システム
ム構成図
超並列
列演算シス
ステム(MPC
C)は、FUJ ITSU Supe
ercomputer PRIMEH PC FX100
0 で構成
します。
。FX100 は高性能プ
は
プロセッサ(S
SPARC64 XIfx)と高速
速メモリを
を採用し、1 ノード
あたり 32 コア/CPU で 1TF
FLOPS(倍精
精度)の理論
論演算性能と 480GB//s の高いメ
メモリバ
ンド幅を有します
す。超並列演算システ
テムは 1,08
80 ノード(総
総理論演算
算性能 1PFLOPS、
総主記憶
憶容量 33..7TB)で構成
成され、6 次元メッシ
シュ/トーラ
ラスインタ
ターコネクト
ト(Torus
1
Fusion インターコ
コネクト 2*
2 )により、
、ノード間
間は 12.5GB
B/s×双方向
向で高速か
かつ低レ
イテンシに密結合
合されます。
*1 Torus Fusion インタ
ターコネクト 2 は、富士通の
の高速インター
ーコネクトの呼
呼称です。
Copyrright (C) RIK
KEN, Japan.. All rights reserved.
r
1
大容量メモリ演算サーバ(ACSL)は、PRIMERGY RX4770 M1 を 2 ノードで構成し
ます。1 ノードの理論演算性能は 1.2TFLOPS、主記憶容量は 1TB です。GPU 演算サ
ーバ(ACSG)は、SGI C2108-GP5 を 30 ノードで構成します。1 ノードの理論演算性
能は 883.2GFLOPS、主記憶容量は 64GB です。GPU 演算サーバ(ACSG)の各ノード
にはアクセラレータ(NVIDIA Tesla K20X)を 4 枚搭載します(本運用までに搭載)。各ノ
ードは、InfiniBand FDR(6.8GB/s×双方向)で接続され、高速なノード間通信とファイ
ル共有を実現します。
ストレージ環境は、オンライン・ストレージ(OFS)、階層型ストレージ(HSM)で構
成します。
オンライン・ストレージ(OFS)は、各ユーザーのホームディレクトリや課題グルー
プ用の共有ディレクトリなど、広帯域でオンライン性のあるファイルシステムであ
り、超並列演算システム、アプリケーション演算サーバ群およびフロントエンドサー
バから参照可能です。利用可能容量は合計 2.2PB です。
階層型ストレージ(HSM)は、長期保存が必要な大容量のデータ・ファイルを格納す
るファイルシステムであり、1 次ストレージ(キャッシュディスク)300TB、2 次ストレ
ージ(テープライブラリ装置)7.9PB(非圧縮)を用意しています。ユーザーはテープライ
ブラリ装置を操作することなく、データのテープ書込み・読み出し操作が可能となり
ます。
HOKUSAI-GreatWave システムへのアクセスは、ssh/scp によるアクセスと HTTPS
アクセス(利用者ポータル、プログラミング支援ツール)が可能です。ユーザーはフロ
ントエンドサーバ上にて、プログラムの編集、コンパイル/リンク、バッチジョブの操
作、インタラクティブジョブの実行、チューニング、デバッグ等の作業を行うことが
可能です。
Copyright (C) RIKEN, Japan. All rights reserved.
2
1.2 ハ
ハードウェ
ェア概要
1.2.1 超
超並列演算
算システム(MPC)
 演算
算性能
CP
PU: SPARC
C64™XIfx (1.975GHzz) 1,080 台(1,080CP
台
U, 34,560 コア)
理論
論ピーク性
性能: 1.092PFLOPS ( 1.975GHz
z×16 演算×32 コア×
×1,080CP
PU)
 メモ
モリ
メモ
モリ容量: 33.7TB(32
3
2GB×1080
0 台)
メモ
モリバンド
ド幅: 480GB
B/s/CPU
メモ
モリバンド
ド幅/FLOP: 0.47Byte//FLOP
 イン
ンターコネ
ネクト(Tofu
u インターコ
コネクト 2)
2
6次
次元メッシ
シュ/トーラス
通信
信性能:ノー
ード間 12.5
5GB/s×双
双方向
1.2.2 アプリケーション演
演算サーバ
バ(ACS)
アプリケーショ
ョン演算サーバは、大
大容量メモリ演算サー
ーバ(ACSL))と GPU 演算サー
演
バ(ACS
SG)で構成されます。
1.2.2.1
1 大容量メ
メモリ演算サ
サーバ(ACS L)
 演算
算性能
CP
PU: Intel Xe
eon E7-4880v2 (2.50
0GHz) 2 台(8CPU,
台
12
20 コア)
理論
論ピーク性
性能: 2.4TFLOPS (2.5
5GHz×8 演算×15
演
コア×8CPU
コ
U)
 メモ
モリ
メモ
モリ容量: 2TB(1TB
2
× 2 台)
メモ
モリバンド
ド幅: 85.3G
GB/s/CPU
メモ
モリバンド
ド幅/FLOP: 0.28Byte//FLOP
 内蔵
蔵ディスク
ク
ディスク容量
量: 3.6TB ((300GB × 2 + 1.2TB
B) × 2 台)
台
ンターコネ
ネクト
 イン
FD
DR InfiniBand
通信
信性能:ノー
ード間 6.8G
GB/s×2 本
本×双方向
Copyrright (C) RIK
KEN, Japan.. All rights reserved.
r
3
1.2.2.2 GPU 演算サーバ(ACSG)
 演算性能
CPU: Intel Xeon E5-2670 v3 (2.30GHz) 30 台(60CPU, 720 コア)
理論ピーク性能: 26.4TFLOPS (2.3GHz×16 演算×12 コア×60CPU)
 主記憶
メモリ容量: 1.8TB(64GB × 30 台)
メモリバンド幅: 68.2GB/s/CPU
メモリバンド幅/FLOP: 0.15Byte/FLOP
 内蔵ディスク
ディスク容量: 18TB ((300GB × 2) × 30 台)
 インターコネクト
FDR InfiniBand
通信性能:ノード間 6.8GB/s×双方向
 アクセラレータ
NVIDIA Tesla K20X ×4 枚/ノード
Copyright (C) RIKEN, Japan. All rights reserved.
4
1.3 ソフトウェア構成
HOKUSAI-GreatWave システムで利用可能なソフトウェア一覧を以下に示します。
表 0-1 ソフトウェア一覧
項目
超並列演算システム(MPC)
アプリケーション
フロントエンドサーバ
演算サーバ群(ACS)
XTCOS(FX100 用 OS)
Red Hat Enterprise Linux 6
Red Hat Enterprise Linux 6
(Linux kernel version 2.6)
(Linux kernel version 2.6)
(Linux kernel version 2.6)
コ ン
Technical Computing
インテル Parallel Studio XE
Technical Computing
パ イ
Language(Fujitsu)
Composer Edition(Intel)
Language(Fujitsu)
OS
インテル Parallel Studio XE
ラ
Composer Edition(Intel)
ラ イ
Technical Computing
ブ ラ
Language(Fujitsu)
リ
- BLAS, LAPACK,
ScaLAPACK, MPI, SSLII,
インテル MKL
- BLAS, LAPACK,
ScaLAPACK,
インテル MPI
C-SSLII, SSLII/MPI、高速 4
Language(Fujitsu)
インテル MKL
インテル MPI
IMSL Fortran ライブラリ
倍精度基本演算ライブラリ
ア プ
Technical Computing
Gaussian, Amber, ADF,
GaussView,
リ ケ
ANSYS(multiphysics)
ANSYS(preppost)
ー シ
GOLD/Hermes, MATLAB,
ョン
Q-Chem
Gaussian
超並列演算システム(SPARC)とアプリケーション演算サーバ群(Intel)は異なる
CPU アーキテクチャですが、フロントエンドサーバにて両システムのプログラム開
発が可能です。
Copyright (C) RIKEN, Japan. All rights reserved.
5
1.4 R
RICC ハー
ードウェア
ア概要
PC ク
クラスタは
は、超並列 PC
P クラス
スタ (Massively Parallel Cluster)) [486 台(3
3888 コ
ア)の計
計算ノード]] と多目的
的 PC クラス
スタ(Multi--purpose Parallel
P
Cl uster)[100 台(800
コア)の
の計算ノード]で構成さ
されます。
1.4.1 超
超並列 PC
C クラスタ
 演算性能
Intel Xeon X5570 (2.93GHz) 486 台 (952CPU
U, 3888 コア)
理論ピーク性能
能: 2.93GHz × 4 演算
算 × 4 コア
コ × 972
2CPU = 455.6 TFLOP
PS
 主記憶
憶容量
5.8TB(12GB × 486 台)
幅: 25.58GB
B/s = 1066
6MHz (DDR
R3-1066) × 8Byte × 3chann
nel
メモリバンド幅
Byte//FLOP: 0.5
54 (Btye/Fllop) = 25.5
58GB/s / (2.93GHz
z × 4 演算
算 × 4 コア)
 ディスク容量
272T
TB((147GB
B × 3 + 73GB) × 4
436 台 + (147GB × 6 + 73GB
B) × 50 台)
台
 インターコネク
クト(DDR InfiniBand))
台の計算ノ
ノードに DD
DR InfiniBa
を
一つの計算
算用ネット
トワーク
486 台
and HCA を搭載し、
として接
接続されて
ており、計算用ネット
トワーク内は、双方向
向通信可能
能で片方向 16Gbps
の性能が
が得られる
るよう構成されていま
ます。
1.4.2 多目的 PC
C クラスタ
 演算性能
570 (2.93G
GHz) 100 台 (200CPU, 800 コア
ア) + NV
VIDIA Tesla
a C2075
Intel Xeon X55
アクセラレー
ータ 100 台
GPU ア
理論ピーク性能
能:2.93GHz
z × 4 演算
算 × 4 コア
ア × 100CPU = 9.33 TFLOPS
1.03 TFL
LOPS (単精
精度) × 100 = 103 TFLOPS
T
 主記憶
憶容量
2.3 T
TB(24GB × 100 台))
メモリバンド幅
幅: 25.58GB
B/s = 1066
6MHz (DDR
R3-1066) × 8 Byte × 3chan
nnel
Byte//FLOP: 0.5
54 (Btye/Fllop) = 25.5
58GB/s / (2.93GHz
z × 4 演算
算 × 4 コア)
 ディスク容量
25.0 TB ( 250G
GB × 100
0 台)
 インターコネク
クト(DDR InfiniBand))
台の計算ノ
ノードに DD
DR InfiniBa
を
一つの計算
算用ネット
トワーク
100 台
and HCA を搭載し、
として接
接続されて
ており、計算用ネット
トワーク内は、双方向
向通信可能
能で片方向 16Gbps
の性能が
が得られる
るよう構成されていま
ます。
Copyrright (C) RIK
KEN, Japan.. All rights reserved.
r
6
1.4.3 フロントエ
エンド計算機
フロントエンド
ド計算機は、RICC を
を利用する場
場合に最初
初にログイン
ンするホス
ストであ
り、PC
C クラスタ
タのプログラ
ラム開発・
・実行環境を提供しま
ます。
フロントエンド
ド計算機はログインサ
サーバ × 4 台で構成
成されてお り、冗長化
化された
高信頼な
なフロント
トエンド計算機システ
テムを構成しています
す。
1.4.4 非
非並列ジョ
ョブ用データ処理 SS
SD 搭載クラ
ラスタ
RICC
C から利用
用できる非並
並列ジョブ
ブ用データ処
処理 SSD 搭載クラス
搭
スタ(以下、非並列
ジョブ用
用クラスタ
タ)は、主に非並列か
かつ実行中に高速な I/O が必要な
なジョブの
のための
環境を提
提供します
す。
 ローカルディス
スク領域
SSD 360GB (3
30GB / コア
ア)
 データ転送用イ
インターコネクト
QDR
R InfiniBand
d
Copyrright (C) RIK
KEN, Japan.. All rights reserved.
r
7
1.5 RICC ソフトウェア構成
RICC システムで利用可能なソフトウェア一覧を以下に示します。
表 0-2 ソフトウェア一覧
項目
超並列 PC クラスタ
多目的 PC クラスタ
非並列ジョブ用
フロントエンド
(MPC)
(UPC)
クラスタ(SSC)
計算機
OS
Red Hat Enterprise Linux 5 (Linux kernel version 2.6)
コンパイラ
富士通コンパイラ
インテル Parallel Studio XE Composer Edition for Fortran and C++ Linux
ライブラリ
富士通数学ライブラリ
- BLAS, LAPACK, ScaLAPACK, MPI, SSLII, C-SSLII, SSLII/MPI
インテル MKL
- BLAS, LAPACK, ScaLAPACK
アプリケー
ション
GOLD/Hermes
Gaussian, Amber,
Gaussian, Amber,
ADF, Q-Chem
ADF, Q-Chem,
GaussView
GOLD/Hermes
Copyright (C) RIKEN, Japan. All rights reserved.
8