InTriggerクラスタ環境の構築 i-explosion 支援班 東京大学 近山・田浦研究室 東京工業大学 松岡研究室 東京工業大学 合田研究室 クラスタ環境の概要 研究に使える「共有資源」を提供 メンバ間での交流促進 成果の共有 大きなスケールでの、強力な実験 広域分散環境の構築 今後5年間 20~30拠点程度 50-100 CPU コア/拠点 運用中 東京(東大本郷キャンパス)に70ノード 千葉(NII西千葉分館)に70ノード 他の資源との連携によってさらなる拡大計画 TSUBAME 東大情報基盤センター 運用ポリシー i-explosionメンバは誰でも利用可能 全ノードほぼ同一の構成とする 責任者は機能ごとに分担 各機能の責任者は、全ての拠点についてその 管理を行う 各機能ごとに、研究分野に近い責任者を選ぶ (モニタリング・数値演算ライブラリなど) 環境の均一性が保たれる 新しい研究成果が素早くフィードバックされる はこだて アカウント管理 東京 京都 現在提供されている環境 一拠点70台の構成 マスターノード (NFS/NIS) Lucieノード (ゲートウェイ・コンパイル・再インストール用) 計算ノード 提供されているツール モニタリング Ganglia VGXP ミドルウェア GXP : 並列シェル MC-MPI : グリッド対応のMPI 広島 Aさん、 Bさん、 Cさん… モニタリング システム Aさん 数値演算 ライブラリ B研究室 拠点ごとではなく、機能ごとに責任者を定める ▲VGXPによるクラスタのモニタリング ▲Gangliaによる一ヶ月間の平均ロード アカウント管理 アカウント管理を自動化 ユーザー情報をデータベースで管理 管理者画面を用いて、データベースの情報 とNISサーバの情報を同期 アカウント申請の流れ 申請はWebフォームを用いて行う ログイン名 所属 SSH公開鍵 クラスタの紹介者 ☆アカウントの作成には、アカウント管理者 からの紹介が必要 アカウント管理者 アカウント作成権限を持つ 管理者画面で申請を承認すると、全拠点でアカウ ントが作成される アカウント管理は複数人で分担 多人数のアカウントを作成する場合(研究室単位 など)は、その中の一人が管理権限を得て、各人の アカウントを作成する ▼ 管理者画面 ▼ アカウント申請画面 アカウント作成の流れ アカウント希望者 アカウント希望者 アカウント管理者 クラスタ環境を紹介 Webフォームで登録申請 管理者画面で アカウントを承認 ユーザMLへ登録 [email protected] ▼ アカウント申請は以下のページから行えます ▼ https://www.logos.ic.i.u-tokyo.ac.jp/intrigger/registration/ Lucieによる環境構築 ☆ Lucie を用いた環境の自動構築 (☆FAI(Debianの自動インストーラ)の拡張・東工大 松岡研で開発) Lucie サーバ 容易にOSの(再)インストールができる ネットワーク越しにローカルディスクにインス トール 通常はローカルディスクから起動 ファイル OSと同時にインストールするパッケージを容易 サーバ に選択できる 再インストール時に ルートファイルシステムを NFSマウント 通常起動時に ホームディレクトリを NFSマウント 計算ノード ▲各拠点でのマシン構成 • NFSROOTでDebianの インストーラが起動 • ローカルディスクに Debianをインストール 再インストール後の 再起動 再インストールの ための再起動 • ローカルディスクから Debianが起動 •通常のDebianマシンとして、 計算ノードに利用 ▲Lucieでの計算ノードの状態遷移図 通常の 再起動
© Copyright 2024 ExpyDoc