元スライド

InTriggerクラスタ環境の構築
i-explosion
支援班
東京大学 近山・田浦研究室
東京工業大学 松岡研究室
東京工業大学 合田研究室
クラスタ環境の概要
研究に使える「共有資源」を提供
メンバ間での交流促進
成果の共有
大きなスケールでの、強力な実験
広域分散環境の構築
今後5年間
20~30拠点程度
50-100 CPU コア/拠点
運用中
東京(東大本郷キャンパス)に70ノード
千葉(NII西千葉分館)に70ノード
他の資源との連携によってさらなる拡大計画
TSUBAME
東大情報基盤センター
運用ポリシー
i-explosionメンバは誰でも利用可能
全ノードほぼ同一の構成とする
責任者は機能ごとに分担
各機能の責任者は、全ての拠点についてその
管理を行う
各機能ごとに、研究分野に近い責任者を選ぶ
(モニタリング・数値演算ライブラリなど)
環境の均一性が保たれる
新しい研究成果が素早くフィードバックされる
はこだて
アカウント管理
東京
京都
現在提供されている環境
一拠点70台の構成
マスターノード (NFS/NIS)
Lucieノード
(ゲートウェイ・コンパイル・再インストール用)
計算ノード
提供されているツール
モニタリング
Ganglia
VGXP
ミドルウェア
GXP : 並列シェル
MC-MPI : グリッド対応のMPI
広島
Aさん、
Bさん、
Cさん…
モニタリング
システム
Aさん
数値演算
ライブラリ
B研究室
拠点ごとではなく、機能ごとに責任者を定める
▲VGXPによるクラスタのモニタリング
▲Gangliaによる一ヶ月間の平均ロード
アカウント管理
アカウント管理を自動化
ユーザー情報をデータベースで管理
管理者画面を用いて、データベースの情報
とNISサーバの情報を同期
アカウント申請の流れ
申請はWebフォームを用いて行う
ログイン名
所属
SSH公開鍵
クラスタの紹介者
☆アカウントの作成には、アカウント管理者
からの紹介が必要
アカウント管理者
アカウント作成権限を持つ
管理者画面で申請を承認すると、全拠点でアカウ
ントが作成される
アカウント管理は複数人で分担
多人数のアカウントを作成する場合(研究室単位
など)は、その中の一人が管理権限を得て、各人の
アカウントを作成する
▼ 管理者画面 ▼
アカウント申請画面
アカウント作成の流れ
アカウント希望者
アカウント希望者
アカウント管理者
クラスタ環境を紹介
Webフォームで登録申請
管理者画面で
アカウントを承認
ユーザMLへ登録
[email protected]
▼ アカウント申請は以下のページから行えます ▼
https://www.logos.ic.i.u-tokyo.ac.jp/intrigger/registration/
Lucieによる環境構築
☆
Lucie を用いた環境の自動構築
(☆FAI(Debianの自動インストーラ)の拡張・東工大 松岡研で開発)
Lucie
サーバ
容易にOSの(再)インストールができる
ネットワーク越しにローカルディスクにインス
トール
通常はローカルディスクから起動
ファイル
OSと同時にインストールするパッケージを容易 サーバ
に選択できる
再インストール時に
ルートファイルシステムを
NFSマウント
通常起動時に
ホームディレクトリを
NFSマウント
計算ノード
▲各拠点でのマシン構成
• NFSROOTでDebianの
インストーラが起動
• ローカルディスクに
Debianをインストール
再インストール後の
再起動
再インストールの
ための再起動
• ローカルディスクから
Debianが起動
•通常のDebianマシンとして、
計算ノードに利用
▲Lucieでの計算ノードの状態遷移図
通常の
再起動