仕様書 - 量子科学技術研究開発機構

原型炉研究開発に向けた
大規模シミュレーション研究用
MICクラスターの購入
仕様書
平成 28 年 9 月
国立研究開発法人量子科学技術研究開発機構
核融合エネルギー研究開発部門
プラズマ理論シミュレーショングループ
目次
1 件 名 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
2 目 的 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
3 購入品仕様 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
4 納 期 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
5 納入場所及び納入条件 ・・・・・・・・・・・・・・・・・・・・・・・・・
6 検収条件 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
7 かし担保責任 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
8 グリーン購入法の推進 ・・・・・・・・・・・・・・・・・・・・・・・・・
9 協 議 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
10 その他 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
添付資料
別添 1: 仕様品目の仕様詳細
別添 2: ソフトウェア、搬入、保守に関する仕様詳細
3
3
3
4
4
4
4
4
4
4
1
件名
原型炉研究開発に向けた大規模シミュレーション研究用 MIC クラスターの購入
2
目的
量子科学技術研究開発機構(以下、「量研機構」という。)プラズマ理論シミュレ
ーショングループ(以下、「当グループ」という。)では、数値トカマク(NEXT)
計画を推進している。この計画は、JT-60SA や ITER 計画をはじめ、原型炉開発計
画を支援するものである。NEXT 計画は、これまで日欧共同の幅広いアプローチ
(Broader Approach、以下、BA という。)活動の一環として運用されている計算
機シミュレーションセンター(Computational Simulation Centre、以下、CSC と
いう。)に設置された Helios 計算機を用いたシミュレーション研究を実施してい
る。しかし、同計算機のシャットダウンが 2016 年 12 月に予定されており、これ
まで Helios を利用して開発してきたコード資産を有効利用するためにも新しい計
算機環境整備が吃緊の課題である。また、当グループでは、既存コードの有効利
用とともに、今後の計算機動向も考慮し、Many Integrated Core (MIC)アーキテ
クチャにおいてコードを高速化する技術開発を推進している。このようなシミュ
レーション研究、コード開発を効率的に進めるために、最新のアーキテクチャを
用いて構成された MIC クラスターを購入する。
3
納入品目
(1) 装置本体(詳細な仕様については別紙1参照、相当品可)
クラスター構成:MIC 筐体、周辺機器
1式
MIC 筐体:2U ラックマウントサーバー(MIC ノード 4 台で構成)
1台
周辺機器:
・Omni-Path 24port スイッチ(詳細な仕様については別紙1参照)
1台
・Omni-Path インターフェースカード
4台
・Omni-Path 接続ケーブル
4本
・無停電電源装置(詳細な仕様については別紙1参照)
2台
(2) ソフトウェア(詳細な仕様については別紙2参照、相当品可)
・OS: CentOS 7.2 以上
・MPI : Intel MPI ライブラリー(特定ユーザーライセンス)
5 ライセンス
・ジョブスケジューラ:OpenLava 3.0 以上
・最適化支援ソフト:Intel VTune Amplifier(特定ユーザーライセンス)
1 ライセンス
(3) 提出書類
・関連マニュアル(MPI,ジョブスケジューラなど)
4 納期
1式
平成29年2月28日
5
納入場所及び納入条件
(1) 納入場所
青森県上北郡六ヶ所村尾駮字表舘2番地166
国立研究開発法人 量子科学技術研究開発機構
青森研究開発センター
計算機・遠隔実験棟 特殊設備室
(2) 納入条件
据え付け調整・試験後渡し
6
検収条件
受注者は「3 納入品目」に示した物品を納入し、別紙3にて指定された設置、調整
完了後、動作確認試験及び提出書類の合格をもって検収とする。
7 かし担保責任
検収後 3 年以内にかしが発見された場合、無償にて速やかに修理もしくは交換を
行うものとする。
8
グリーン購入法の推進
1) 本契約において、グリーン購入法(国等により環境物品等の調達等に関する法
律)に適用する環境物品(事務用品、OA 機器等)が発生する場合は、これを採
用するものとする。
2) 本仕様に定める提示資料(納入印刷物)については、グリーン購入法の基本方
針に定める「紙類」の基準を満たしたものであること。
9
協議
本仕様書に記載されている事項及び本仕様書に記載のない事項について疑義が生
じた場合は、量研機構と協議のうえ、その決定に従うものとする。
10
その他
受注者は、本作業により知り得た量研機構のプログラム及びデータ等に関する情
報及び量研機構の内部情報を量研機構の許諾なくして第三者に漏洩してはならな
い。
以上
別添1:納入品目の仕様詳細
I.
MIC 筐体についての仕様詳細
MIC 筐体は、複数のユーザーがログインし、高度に並列化されたプログラムを実行す
るため、できる限り高速かつコア数が多い CPU を搭載し、システム全体の演算性能を
高める必要がある。また、並列計算の際に通信時間がボトルネックになることをできる
限り回避するために、高速なノード間通信を実現する必要がある。そのため、以下のよ
うに仕様を定める。
1.
Intel 製 Many Integrated Core (MIC)チップ(Knights-Landing)を採用すること。
2.
Xeon Phi 7210(1.3GHz、64 コア) と同等以上の CPU をノードあたり 1 個以上有
する構成であること。
3.
1 筐体あたり 4 ノードで構成されていること。
4.
主メモリは DDR4/2133MHz 以上のアクセス速度を有する ECC 付きの 32GB 以
上のメモリモジュールをノードあたり 6 枚以上搭載すること。
5.
SATA 規格 1TB 以上のハードディスクがノードあたり 1 台以上搭載されているこ
と。管理兼用ノードには同等のバックアップディスクを付属すること。
6.
1000BASE-T 規格に準拠したネットワークインターフェースがノードあたり 2 ポ
ート以上搭載されていること。
7.
100 Gbps のデータレートをサポートした、インテル Omni-Path Host Fabric
Interface(HFI) をノードあたり1ポート以上備えていること。
8.
D-sub15 ピンの VGA 端子をノードあたり1ポート以上備えていること。
9.
USB3.0 のポートをノードあたり 2 つ以上備えていること。
10. メンテナンス時に対象のノードを識別するための UID ランプを備えていること。
11. 80PLUS PLATINUM 認証を取得した 2000W 以下の電源が 2 基以上搭載されて
おり、冗長化されていること。入力電圧は 100V に対応していること。
12. IPMI2.0 に準拠したハードウェア監視システムを有しており、IPMI 専用のネット
ワークインターフェースをノードあたり 1 ポート有していること。
13. 筺体は 2U の EIA 規格 19 インチラックマウント対応であること。
II. 周辺機器についての仕様詳細
A) Omni-Path スイッチ
1.
24 ポート以上の Omni-Path ファブリック・エッジ・スイッチを有しており、各
ノード間が QSFP28 パッシブタイプ銅線ケーブルで接続されていること。
2.
MPI を用いた並列計算が正常に動作すること。
B) Omni-Path インターフェース
1.
Omni-Path インターフェースが MIC に内蔵されていることが望ましい。
2.
内蔵されていない場合、インターフェースは MIC ノードに PCI-express で接続さ
れていること。
3.
各ノード間がスイッチを介して QSFP28 パッシブタイプ銅線ケーブルで接続され
ること。
4.
MPI を用いた並列計算が正常に動作すること。
B) 無停電電源装置
1.
EIA 規格 19 インチラックマウント対応であること。
2.
入力コネクタは NEMA 5-15P であること。
3.
入力電圧は 100V に対応していること。
4.
出力容量は 1500VA 以上であること。
5.
フロントエンドノード(1 台)、バックエンドノード(7 台)、ファイルサーバ(1 台)、
スイッチングハブ(1台)、InfiniBand スイッチ(1 台)を接続可能な出力容量を備え
ていること。
6.
停電時に安全にサーバーを自動でシャットダウンさせることが可能であること。
別添2:ソフトウェア,搬入,保守に関する仕様詳細
I.
ソフトウェア
1.
OS は CentOS 7.2(x86_64)と同等以上であること。
2.
当機構が所有しているインテル Parallel Studio XE 2016 Composer Edition for
Fortran & C++ Linux Floating 2-Pack をインストールすること。
3.
インテル MPI ライブラリー 2017 for Linux(特定ユーザーライセンス)を 5 ラ
イセンス提供すること。MPI を用いてコーディングされたプログラムが上記のコ
ンパイラを用いて正常にコンパイルが完了し、同モジュールでの並列計算が実行
できるよう設定を行うこと。
4.
インテル VTune Amplifier XE 2017 for Linux(特定ユーザーライセンス)を 1 ラ
イセンス提供すること。正常に動作する状態でインストールされていること。
5.
当機構の環境に合わせた IP アドレス等のネットワーク設定、NIS、NFS の設定を
行うこと。
6.
ジョブスケジューラとして OpenLAVA3.0 または同等のジョブスケジューラがイ
ンストールされていること(フェアシェアスケジューリングが設定可能であるこ
と)。
7.
下記の情報を GUI 機能により一元管理できる管理用ソフトウェアをインストール
していること。またシステムの不具合時には指定したメールアドレスに通知がで
きること。
・CPU 使用率
・メモリ使用率
・CPU 温度
・ローカルディスクの使用率
・CPU 温度異常
・ホストの死活状態
II. ジョブスケジューラの設定について
1.
すべての MIC ノードを並列計算で利用するように設定すること.
2.
各ノード間の通信は Omni-Path を介して行われるように設定すること。
3.
ジョブのキュー構成は以下のように設定すること.
(以下,キュー名:最大コア数,最大メモリ量,最長計算時間,プライオリティ)
p64 : 64 cores,192GB,12 時間,30
p256 : 256 cores,768GB,24 時間,30
4.
メモリ使用量が上記の最大量を超えるようなジョブが投入された場合には,同ジ
ョブがキルされ,すでに実行中のジョブへの影響を最小限に抑えるように設定す
ること.
5.
“p64, p256”のキューにはフェアシェアスケジューリングを設定すること.
6.
障害時のフェイルオーバーと障害復旧時のフェイルバックを,シームレスに行う
ことができること.
別添3:搬入、保守など検収条件に関する詳細
I.
搬入、据付、設置、調整
1.
全ての機器の当機構指定場所への、搬入、据付、設定、調整、その他経費は本契約
に含むこと。
2.
全てのソフトウェアは正常に動作する状態でインストールされていること。また、
全ての機器の動作確認を行うこと。
3.
搬入、据付、設定、調整については、当機構の業務に支障をきたさないよう、担当
者と協議の上その指示に従うこと。
4.
計算ノード(4 ノード)、スイッチングハブ(1台)、Omni-Path ファブリック・エッ
ジ・スイッチ (1 台)、無停電電源装置(2 台)は、当機構所有の EIA 規格に準拠した
42U の 19 インチラックに搭載すること。
5.
計算ノード(4 ノード)に当機構所有のファイルサーバをマウントし、アクセスでき
るよう設定を行うこと。
II. 保守・支援体制
1.
納入検査確認後 3 年間、通常の使用により故障した場合、オンサイトで無償修理
に応じること。
2.
日本国内での装置の運用を円滑にする為の技術的相談に速やかに応じられる体制
が整えられていること。
3.
平日の午前 9 時 30 分から午後 5 時 30 分までの間、電話、メールによる問合せ窓
口を用意すること。
III. その他要件
1.
設定、利用に関する日本語版説明書・マニュアルを紙又は電子媒体で1部提供する
こと。
2.
インテル Parallel Studio XE Cluster Edition に付属する HPL を用いたベンチマ
ークを 1 ノード 64 コアで実施し、1.6TFlops 以上の実効性能であることが確認で
きる出力ログを提案時に提出すること。
3.
提案者は組織活動、製品及びサービスの環境負荷の低減といった環境パフォーマ
ンスの改善を実施する仕組みが継続的に運用されるシステム(環境マネジメントシ
ステム)を構築するために要求される規格である ISO14001 認証を取得しているこ
と。もし取得していない場合には同等の環境マネジメントが行われることを示す
文書(ISO14001 認定がなされる程度)を提出すること。