Cray CS400-LC データシート

Cray® CS400-LC™ 仕様
実装方式 水冷タイプ、1ラックあたり最大60ノード搭載可能
プロセッサ 64-bit、Intel® Xeon® processor E5-2600 v3 プロセッサファミリー
メモリ搭載容量 ノードあたり最大 1,024 GB registered ECC DDR4 SDRAM 、16 x 64GB DDR4 SDRAM DIMM
External I/O interface
インターコネクト 1、10もしくは40 GbE イーサネット
拡張I/Oインタフェース QDRもしくはFDR InfiniBand 、ConnectIB またはQDR True Scale HCA
シングル、
デュアルレール fat tree、
または 3D トーラス Advanced Cluster Engine (ACE™)
システム管理
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
リモートによるHPCクラスタ管理スタック
GUIもしくはコマンドラインによるシステム管理
オペレーティングシステムのバージョン管理とロールバック機能
自動ロードバランシング&フェイルオーバー機能付冗長構成管理サーバ群
インターコネクト、サーバおよびストレージの自動検出及びステータスレポーティング機能
ハードウェア、
インターコネクトトポロジー構成エラーの自動検出機能
クラスタの論理グループ管理とパーティショニング、及び個々のクラスタのユニークソフトウェアのホスティング
リモートサーバ制御(電源オン、
オフ)、及びリモートサーバ管理(リセット、
リブート、
シャットダウン)
大規模システム向け高速ディスクレスブートとディスクレスノード用ルートファイルシステムの配布
冗長化電源、冷却ファン搭載管理ノードのフェイルオーバー機能
RAS機能 冗長化及びフェイルオーバーネットワーク (InfiniBand、1、10 GbE イーサネット )
すべての重要コンポーネントのホットプラグ機能と容易なアクセス
リソース管理と SLURM、Altair PBS Professional、IBM Platform LSF、Adaptive Computing Torque、Maui and Moab、and Grid
ジョブスケジューリング Engineをオプションにてサポート
ファイルシステム
Cray® Cluster Connect™ 、Cray® Sonexion®、NFS、Local FS (Ext3、Ext4 XFS) 、Lustre® 、Panasas® PanFS®
をグローバルファイルシステムとしてサポート
ディスクストレージ フルラインのFC接続ディスクアレイとSATA、SSDへの対応
オペレーティング システム Red Hat、SUSE または CentOS
性能解析ツール OPCC、Perfctr、IOR、PAPI/IPM、netperf等のオープンソースパッケージ
オプションでOpen MPI、MVAPICH2 及びIntel MPI Libraries
Cray Compiler Environment (CCE)、Cray LibSci、
コンパイラ、
ライブラリ、
ツール PGI、Intel クラスタ ツールキット 及びコンパイラ
OpenCL、DirectCompute Toolkits、GNU、DDT、TotalView、OFED プログラミング ツール 等
1ラックあたり最大38 kW
電源 200/208V 単相、
または三相 AC
オプションで480V ACも選択可能
水冷
冷却方式 前面吸気、後方排気(空冷部分)
水圧、
リーク検出機能装備
ラック寸法(H x W x D) 2,093 mm x 600 mm x 1,500 mm スタンダード 42U/19インチ ラック
ラック重量 782kg
クレイ・ジャパン・インク
〒 100-0011 東京都千代田区内幸町 1-2-2
日比谷ダイビル 15 階
Tel:03-3503-0901 Fax:03-3503-0905
URL http://www.cray.com/japan
© 2014 Cray Inc. All rights reserved. Specifications are subject to change without notice. Cray is a registered trademark of Cray Inc. All other trademarks mentioned herein are the properties of their respective owners. 20140929EMS
高効率なデータセンター環境を実現する
水冷型クラスタスーパーコンピュータ
CS400-LC™
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
チラーが不要なWarm Water Cooling
重要コンポーネントを2次ループによる冷却
自動監視機能によるリークディテクション
冷却の低コストPUE 1.1 を実現
80%以上の熱を冷却可能
Cray CS400 ソフトウェア 及び クラスタマネジメント
フレキシブルかつ高エネルギー効率を実現する
先進アーキテクチャー
Cray CS400-LC は 、fat tree もしくは 3Dトーラス接続により高いアプリケーション
パフォーマンスを実現するシステム構成を提供します。 システムは独自開発の2種
類の専用計算ノードと管理ノードを中心に構成されています。計算ノードはMPIも
しくはOpenMP等による並列処理において最大限のパフォーマンスが発揮できる
ようデザインされています。 管理ノードはアプリケーションの実行制御や共有ディ
スク、
システム管理で必要なスペックと機能で構成されています。
オペレーティングシステム
最新プロセッサを採用した計算ノード
Cray CS400-LCは独自設計のブレード型、サーバーをベースに最大512GBのDDR4
メモリ(2ソケットモデル)が搭載できるよう構成されています。 メモリコントローラ
ーは高い性能と品質を維持します。 また、各種コンポーネント業界標準の製品を
数多く採用し、導入後のシステムアップグレードにも柔軟に対応します。
Cray Programming 環境
Cray が ハ イ エ ン ド ス ー パ ー コ ン ピ ュ ー タ 用 に 開 発 し た Cray
Programming 環境が Cray CS400 システムに移植され、これらのソ
フトウェアはマシンの性能を最大限に発揮するように開発されま
した。
スケーラブルなインターコネクトパフォーマンス
システム間のインターコネクトはシングルもしくはデュアルレールのQDR、
もしくは
FDR InfiniBand で構成可能です。デュアルレールで接続する場合は計算ノードに
2つのInfiniBand HCAを搭載します。計算ノード上のInfiniBand I/O チャネルは低
レイテンシを実現するアダプターで構成されています。Scalable Unit (SU) 毎に最
適化されたシステムは大規模市システム構成時も業界標準のスイッチファブリック
を採用し、かつ fat tree もしくは3D Torus接続をサポートし、
スケーラブルなパフォ
ーマンスを提供しています。
GNU Toolchain
IBM Platform
MPI
MVAPICH2
OpenMPI
Debuggers
Rogue Wave
TotalView®
Allinea DDT, MAP
Intel® IDB
PGI PGDBG®
GNU GDB
Resource
Management /
Job Scheduling
SLURM
Adaptive Computing
Moab®, Maui, Torque
Altair PBS
Professional
IBM Platform™
LSF®
Grid Engine
File Systems
Lustre®
NFS
GPFS
Panasas PanFS®
Local
(ext3, ext4, XFS)
Cluster
Management
Operating
Systems and
Drivers
Drivers &
Network Mgmt.
NVIDIA® CUDA®
Cray Advanced Cluster Engine (ACE™) Management Software
Accelerator Software Stack & Drivers
Operating
Systems
OFED
Linux® (Red Hat, CentOS)
Cray 科学技術計算ライブラリ
Iterative Refinement Toolkit (IRT)
Cray LibSci_ACC providing accelerated BLAS and LAPACK routines for GPUs
Cray 性能解析、ポーティングツール
CrayPAT : a robust measurement and analysis tool
CrayPAT-light : a simplified interface to CrayPAT
Cray Apprentice2 : a visualization tool
Reveal: a porting tool
ACE
TM
Cray CS400 システムのために専用設計された HPC 向けシステム向け統合管理ソフトウェア
業界標準の冷却技術を採用することによりコスト削減を実現
水冷でありながら、サーバーブレードはホットスワップを実現し空冷モデルと変わらないメンテナンス性を確保
Intel® Xeon® プロセッサ
E5-2600 製品ファミリー
®
Server Cooler
PGI Cluster
Development
Kit®
Intel® MPI
Autotuned BLAS library、LAPACK、ScaLAPACK
データセンター内の冷却エネルギーを 50% 以上削減可能で低 PUE を実現
Low Pressure
Server Loop
Intel® Cluster Studio
Cray LibSci,
LibSci_ACC
Cray コンパイラ環境
CS400-LCの水冷方式は、常温水による熱交換方式(Warm Water Cooling)により
冷却設備にかかるコストを低減します。 サーバー内部の各コンポーネントをダイ
レクトに冷却する循環システムを採用し冷却にかかるコスト削減を容易に実現し
低PUEのHPCシステムをデーターセンターに設置可能になります。
Coolant Distribution Unit
(CDU)
Schedulers
File Systems
and
Management
Cray® PE on CS
Application
Libraries
Compilers for Fortran、C and C++ supporting OpenMP 3.1 and OpenACC 2.0
常温水での熱交換(Warm Water Cooling)ソリューションにより
低PUEを実現
Facility Water
HPC
Programming
Tools
Development &
Performance
Tools
ソフトウェア構成 :
Cray CS400-LC 専用
水冷サブラック
Outdoor Dry
Cooler
Cray HPC Cluster Software Stack
Cray CS400 システムはお客様のニーズに答え、RedHat、SuSE等幅広
いLinux Distributionに対応し、業界標準のソフトウェアスタックをサ
ポートします。
®
Intel Xeon プロセッサは、22nm3Dトラ
イゲートトランジスタマイクロアーキテク
チャに基づいて、Intel ® の最先端の工場
で製造され、前世代より帯域幅、密度の
増加、及び低電圧で高速なDDR4メモリ
技術をサポートしています。
CPUに内蔵されたPCI Express(PCIe)3.0
のポートはストレージ、ネットワーク接
続のための十分な容量と柔軟性を提供
し、I/O 帯域幅を向上させます。
Intel®プロセッサは、最も複雑で要求の厳
しいワークロードに適応し、エネルギー
効率とパフォーマンスを提供します。
機能と特徴
Advanced Cluster Engine (ACETM) はクレイが設計した HPCクラスタ専用のソフトウェアスタックです。
ACEは大規模HPCシステムを安定かつ容易に運用できるようデザインされています。ACEはGUI、
コマン
ドインターフェイスのどちらでも管理可能になっています。
またGUIはPC上からでもアクセス可能です。
ACE Software の主なサポート機能:
Applications
Cray HPC Cluster Software Stack
OS, Drivers, Management, File Systems, Schedulers, Programming Tools
Advanced Cluster Engine – Cluster Management Software
Turns Cray clusters into functional, usable, reliable and available computing systems
Compute
Cluster Management
• Hierarchical management
infrastructure
• Hierarchical cached root file
system
• Divides the cluster into
multiple logical partitions,
each with unique OS
personality
• Revision system with rollback
• Redundancy and failover
• Remote management and
remote power control
Cluster Management
• Automatic discovery
• Scalable, fast, diskless
booting - inherits partition
personality
Network
GUI AND CLI
• View/Change/Control
• Monitor health
• Plugin interface
•
•
•
•
Automatic discovery
Redundant paths
Load balancing
Failover
Storage
• High bandwidth to storage
Compute
Network
Storage
ネットワーク管理: InfiniBand を含めたネットワー
クの設定・管理・エラーの検出・リカバリー機能
サーバー管理: システムソフトウェアの展開、
ハードウェアの死活監視、BIOSの管理・アップデー
トを集中制御
クラスター管理: OSイメージの展開と世代管理、
ロールバック機能・論理グループの管理・監視
ジョブ管理: リソーススケジューリング、モニタリグ、
SLURM等のオープンソースジョブスケジューラの
管理ツールへの統合