Cray CS400-AC データシート

Cray® CS400-AC™ 仕様
実装方式 空冷タイプ、1ラックあたり最大80ノード搭載可能
プロセッサ
64-bit、Intel® Xeon® processor E5-2600 v3 プロセッサファミリー
Intel® Xeon Phi™コプロセッサ、及びNVIDIA® Tesla® GPU アクセラレーラ
メモリ搭載容量 ノードあたり最大 512GB DDR4 SDRAM (ブレードタイプ)、1.5TB DDR4 SDRAM (ラックマウントタイプ)
External I/O interface
インターコネクト 1、10もしくは40 GbE イーサネット
拡張I/Oインタフェース QDRもしくはFDR InfiniBand 、ConnectIB またはQDR True Scale HCA
シングル、
デュアルレール fat Tree、
または 3D トーラス Advanced Cluster Engine (ACE™)
システム管理
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
Ɣ
リモートによるHPCクラスタ管理スタック
GUIもしくはコマンドラインによるシステム管理
オペレーティングシステムのバージョン管理とロールバック機能
自動ロードバランシング&フェイルオーバー機能付冗長構成管理サーバ群
インターコネクト、サーバおよびストレージの自動検出及びステータスレポーティング機能
ハードウェア、
インターコネクトトポロジー構成エラーの自動検出機能
クラスタの論理グループ管理とパーティショニング、及び個々のクラスタのユニークソフトウェアのホスティング
リモートサーバ制御(電源オン、
オフ)、及びリモートサーバ管理(リセット、
リブート、
シャットダウン)
大規模システム向け高速ディスクレスブートとディスクレスノード用ルートファイルシステムの配布
冗長化電源、冷却ファン搭載管理ノードのフェイルオーバー機能
RAS機能 冗長化及びフェイルオーバーネットワーク (InfiniBand、1、10 GbE イーサネット )
すべての重要コンポーネントのホットプラグ機能と容易なアクセス
リソース管理と SLURM、Altair PBS Professional、IBM Platform LSF、Adaptive Computing Torque、Maui and Moab、and Grid
ジョブスケジューリング Engineをオプションにてサポート
ファイルシステム
Cray® Cluster Connect™ 、Cray® Sonexion®、NFS、Local FS (Ext3, Ext4 XFS) 、Lustre® 、Panasas® PanFS®
をグローバルファイルシステムとしてサポート
ディスクストレージ フルラインのFC接続ディスクアレイとSATA、SSDへの対応
オペレーティング システム Red Hat、SUSE または CentOS
性能解析ツール OPCC、Perfctr、IOR、PAPI/IPM、netperf等のオープンソースパッケージ
オプションでOpen MPI、MVAPICH2 及びIntel MPI Libraries
Cray Compiler Environment (CCE)、Cray LibSci、PGI、Intel クラスタ ツールキット 及びコンパイラ
コンパイラ、
ライブラリ、
ツール NVIDIA® CUDA® 、CUDA C/C++
OpenCL、DirectCompute Toolkits、GNU、DDT、TotalView、OFED プログラミング ツール 等
1ラックあたり最大38 kW
電源 200/208V 単相、
または三相 AC
オプションで480V ACも選択可能
空冷
冷却方式 風量:3000cfm;前面吸気、後方排気
オプションにて水冷式リアドアヒートエクスチェンジャー搭載可能
ラック寸法(H x W x D) 1,991mm x 600 mm x 1,200 mm スタンダード 42U/19インチ ラック
ラック重量 最大835kg
クレイ・ジャパン・インク
〒 100-0011 東京都千代田区内幸町 1-2-2
日比谷ダイビル 15 階
Tel:03-3503-0901 Fax:03-3503-0905
URL http://www.cray.com/japan
© 2014 Cray Inc. All rights reserved. Specifications are subject to change without notice. Cray is a registered trademark of Cray Inc. All other trademarks mentioned herein are the properties of their respective owners. 20140929EMS
高効率なデータセンター環境を実現する
空冷型クラスタスーパーコンピュータ
CS400-AC™
Ɣ 業界標準のテクノロジーを採用しフレキシブルな構成が可能
Ɣ 独自技術により、高密度実装と高いコストパフォーマンスを実現
Ɣ HPC専用の統合型クラスタ管理ソフトウェア
「Cray ACE」搭載
Cray CS400 ソフトウェア 及び クラスタマネジメント
フレキシブルかつ高エネルギー効率を実現する先進アーキテクチャー
Cray CS400-AC は 、fat tree もしくは 3Dトーラス接続により高いアプリケーションパフォーマ
ンスを実現するシステム構成を提供します。 システムは独自開発の2種類の専用計算ノードと
管理ノードを中心に構成されています。計算ノードはMPIもしくはOpenMP等による並列処理
において最大限のパフォーマンスが発揮できるようデザインされています。管理ノードはアプ
リケーションの実行制御や共有ディスク、システム管理で必要なスペックと機能で構成されて
います。
オペレーティングシステム
多彩なシステム構成を提供可能な計算ノード
Cray CS400-ACは独自設計のブレード型、
もしくはラックマウント型のサーバーをベースに最
大512GBのDDR4メモリ(2ソケットモデルの場合)が搭載できるよう構成されています。 メモリ
コントローラーは高い性能と品質を維持します。また、CPUだけではなく nVIDIA製GPUもしく
は、Intel® Xeon Phi™ に代表される各種アクセラレーターを搭載することによりハイブリッドコ
ンピューティング環境をご提供可能です。
また、各種コンポーネント業界標準の製品を数多く
採用し、導入後のシステムアップグレードにも柔軟に対応します。
Cray Programming 環境
Cray が ハ イ エ ン ド ス ー パ ー コ ン ピ ュ ー タ 用 に 開 発 し た Cray
Programming 環境が Cray CS400 システムに移植され、これらのソ
フトウェアはマシンの性能を最大限に発揮するように開発されま
した。
スケーラブルなインターコネクトパフォーマンス
システム間のインターコネクトはシングルもしくはデュアルレールのQDR もしくはFDR InfiniBand で構成可能です。デュアルレールで接続する場合は計算ノードに2つのInfiniBand HCA
を搭載します。計算ノード上のInfiniBand I/O チャネルは低レイテンシを実現するアダプター
で構成されています。Scalable Unit (SU) 毎に最適化されたシステムは大規模システム構成
時も業界標準のスイッチファブリックを採用し、かつ fat tree もしくは3D Torus接続をサポート
し、
スケーラブルなパフォーマンスを提供しています。
ブレードシャーシ
iSCB: Cray サブラック管理アプライアンス
10 ブレード (2P)
5CPU+GPU ブレード (2P)
リダンダントホットスワップファン
80Plus Platinum 電源
16 ブレード (2P)
8CPU+GPU ブレード (2P)
リダンダント ホットスワップファン
80Plus Platinum 電源
4P ブレード搭載モデル (SR8104)
Intel® Xeon® プロセッサ
®
®
● クレイ独自デザイン
全てのブレード製品共通のインタ
ーフェース
MVAPICH2
OpenMPI
Debuggers
Rogue Wave
TotalView®
Allinea DDT, MAP
Intel® IDB
PGI PGDBG®
GNU GDB
Resource
Management /
Job Scheduling
SLURM
Adaptive Computing
Moab®, Maui, Torque
Altair PBS
Professional
IBM Platform™
LSF®
Grid Engine
File Systems
Lustre®
NFS
GPFS
Panasas PanFS®
Local
(ext3, ext4, XFS)
Cluster
Management
Operating
Systems and
Drivers
Drivers &
Network Mgmt.
NVIDIA® CUDA®
Cray Advanced Cluster Engine (ACE™) Management Software
Accelerator Software Stack & Drivers
Operating
Systems
OFED
Linux® (Red Hat, CentOS)
Iterative Refinement Toolkit (IRT)
Cray LibSci_ACC providing accelerated BLAS and LAPACK routines for GPUs
Cray 性能解析、ポーティングツール
CrayPAT : a robust measurement and analysis tool
CrayPAT-light : a simplified interface to CrayPAT
高信頼電源コントロール
冷却ファンのモニタリングと制御
Reveal: a porting tool
電源ユニットモニタリング
GPU/MIC 電源制御
温度モニタリング
BIOS アップグレード
IPMI 2.0 を利用し BMC へアクセス可能
E5-2600 製品ファミリー
コプロセッサ
Intel®Xeon Phi®コプロセッサは、多くのIntel® Many Integrated Core (Intel® MIC) アーキテクチャは、一般的なプログラ
ミングモデルとツールを介して、開発者の生産性を向上させるインテル®Xeon®プロセッサーと相乗的に機能していま
す。インテル®Xeon Phi™コプロセッサは、一枚のカードで倍精度のピーク性能は1TFlopsを達成しています。
それはより
高性能なベクトル処理ユニットとマルチコアに比べ、同じ電力でより大きい浮動小数点パフォーマンスを提供します。イ
ンテル®Xeon Phi™コプロセッサは、優れた並列演算性能と高いメモリ帯域幅を実現し、Intel®Cluster Studioの XEから
フルサポートのデータスレッドとプロセスの並列性をサポートするオープンな標準に基づく高並列プログラミングを可
能にしています。
NVIDIA® Tesla® K20X/K40 GPU アクセラレータ
GNU Toolchain
IBM Platform
MPI
Autotuned BLAS library、LAPACK、ScaLAPACK
ノードモニタリング
Intel Xeon プロセッサは、22nm 3Dトライゲートトランジスタ
マイクロアーキテクチャに基づいて、Intel®の最先端の工場で製造され、前世代より帯域幅、密度の増加、及び低電圧で
高速なDDR4メモリ技術をサポートしています。CPUに内蔵されたPCI Express(PCIe)3.0のポートはストレージ、ネット
ワーク接続のための十分な容量と柔軟性を提供し、I/O 帯域幅を向上させます。Intel®プロセッサは、最も複雑で要求の
厳しいワークロードに適応し、エネルギー効率とパフォーマンスを提供します。
Intel® Xeon Phi™
PGI Cluster
Development
Kit®
Intel® MPI
Cray 科学技術計算ライブラリ
各計算ブレードのコンソールを一括管理
ACE
との 組合せで大規模 HPC システムを
効率よく管理可能
Intel® Cluster Studio
Cray LibSci,
LibSci_ACC
Cray コンパイラ環境
Linux で動作する ARM
ベースアプライアンス
● 独自開発の管理ソフトウェア
Schedulers
File Systems
and
Management
Cray® PE on CS
Application
Libraries
Compilers for Fortran、C and C++ supporting OpenMP 3.1 and OpenACC 2.0
● 組み込み
SR8116 Subrack(8U)
HPC
Programming
Tools
Development &
Performance
Tools
ソフトウェア構成 :
サブラック管理アプライアンス
SR5110 Subrack(5U)
Cray HPC Cluster Software Stack
Cray CS400 システムはお客様のニーズに答え、RedHat、SuSE等幅広
いLinux Distributionに対応し、業界標準のソフトウェアスタックをサ
ポートします。
NVIDIA® Tesla® K20X/K40 は、次世代 GPUアーキテクチャ Keplerをベースに設計されたGPUを搭載した最新のGPUコ
ンピューティングプロセッサボードです。前世代の Fermi アーキテクチャ GPUを搭載した製品と比較して、
ワット当たり
3倍の優れたパフォーマンスを実現し、地震データ処理、生化学シミュレーション、天気と気候モデリング、イメージ、ビデ
オ、信号処理、金融工学、計算物理学、CAE、CFD、およびデータ分析といった様々な分野に置いて、最高の計算性能と電
力効率を提供します。
Cray Apprentice2 : a visualization tool
ACE
TM
Cray CS400 システムのために専用設計された HPC 向けシステム向け統合管理ソフトウェア
機能と特徴
Advanced Cluster Engine (ACETM) はクレイが設計した HPCクラスタ専用のソフトウェアスタックです。
ACEは大規模HPCシステムを安定かつ容易に運用できるようデザインされています。ACEはGUI、
コマン
ドインターフェイスのどちらでも管理可能になっています。
またGUIはPC上からでもアクセス可能です。
ACE Software の主なサポート機能:
Applications
Cray HPC Cluster Software Stack
OS, Drivers, Management, File Systems, Schedulers, Programming Tools
Advanced Cluster Engine – Cluster Management Software
Turns Cray clusters into functional, usable, reliable and available computing systems
Compute
Cluster Management
• Hierarchical management
infrastructure
• Hierarchical cached root file
system
• Divides the cluster into
multiple logical partitions,
each with unique OS
personality
• Revision system with rollback
• Redundancy and failover
• Remote management and
remote power control
Cluster Management
• Automatic discovery
• Scalable, fast, diskless
booting - inherits partition
personality
Network
GUI AND CLI
• View/Change/Control
• Monitor health
• Plugin interface
•
•
•
•
Automatic discovery
Redundant paths
Load balancing
Failover
Storage
• High bandwidth to storage
Compute
Network
Storage
ネットワーク管理: InfiniBand を含めたネットワー
クの設定・管理・エラーの検出・リカバリー機能
サーバー管理: システムソフトウェアの展開、
ハードウェアの死活監視、BIOSの管理・アップデー
トを集中制御
クラスター管理: OSイメージの展開と世代管理、
ロールバック機能・論理グループの管理・監視
ジョブ管理: リソーススケジューリング、モニタリグ、
SLURM等のオープンソースジョブスケジューラの
管理ツールへの統合