Hinemos HAオプション ver.1.5 ご紹介

Hinemos HAオプション ver.1.5 ご紹介
株式会社NTTデータ 基盤システム事業本部
2014年6月27日 作成
Copyright © 2014 NTT DATA Corporation
Hinemos HAオプションとは
Copyright © 2014 NTT DATA Corporation
2
Hinemos HAオプションとは
Hinemosの耐障害性・信頼性を向上し
よりミッションクリティカルな領域でも
高水準の運用継続を可能とする
有償オプション製品です。
Copyright © 2014 NTT DATA Corporation
3
HAオプションの3つの特徴
障害発生時も
自動で運用継続
万が一障害が発生してしまった際にも
自動的に運用を継続できます。
特殊なハードウェアや
ソフトウェアが不要
設定が複雑なクラスタリングソフトや
高価な共有ディスクを使わず
HAクラスタを実現します。
Copyright © 2014 NTT DATA Corporation
障害発生時も
サービスを止めずに復旧可能
ユーザへの自動通知と既定の復旧手順により
サービスを止めない障害復旧が可能です。
4
障害発生時も自動で運用継続
万が一障害が発生してしまった際にも、自動的に運用を継続できます。
ネットワーク障害
サーバ障害
監視、ジョブ
ストレージ障害
自動切り替え
予期せぬハードウェアやソフトウェアの障害が発生した場合でも、
HAオプションはStandbyサーバに自動的に切り替えて、運用管理業務を継続します。
Copyright © 2014 NTT DATA Corporation
5
特殊なハードウェアやソフトウェアが不要
一般的なクラスタリングの場合
× 非常に高価な共有ディスクが必要
× 複雑なクラスタソフトの設定が必要
× 多くの検証が必要
高価な共有
ディスク装置
が必要だ・・・
クラスタソフト
による生存確認
複雑なクラスタソ
フトの設定・検証
が必要だ・・・
共有ディスク装置
Copyright © 2014 NTT DATA Corporation
6
特殊なハードウェアやソフトウェアが不要
HAオプションなら
◎ 高価な共有ディスクは不要
◎ 煩わしい設定が必要なクラスタソフトは不要
◎ 時間やコストのかかる検証が不要
共有
ディスク
不要
Copyright © 2014 NTT DATA Corporation
インストール
するだけ
7
障害発生時もサービスを止めずに復旧可能
ユーザへの自動通知と既定の復旧手順により
サービスを止めない障害復旧が可能です。
監視
ジョブ実行
を継続
データ
を同期
クラスタ構成の復旧において、運用管理業務を停止する必要はありません。
Copyright © 2014 NTT DATA Corporation
8
前提条件
Copyright © 2014 NTT DATA Corporation
9
HAオプションの導入イメージ
HAクラスタを構成する2台のマネージャサーバにそれぞれ
HinemosマネージャとHAオプションをインストールします。
管理対象ノード
マスタマネージャサーバ
クライアント
Hinemosマネージャ
パッケージ
HAオプション
パッケージ
Hinemosマネージャ
パッケージ
HAオプション
パッケージ
スレーブマネージャサーバ
HAオプションの対話型インストーラで設定を入力するだけで
簡単にクラスタ環境を構築できます。
Copyright © 2014 NTT DATA Corporation
10
ハードウェア・ネットワーク要件
•
UDPユニキャスト/マルチキャスト
• クラスタ制御用のLANでは、UDPユニキャスト/マルチキャスト通信が許可されている必要が
あります。
•
NIC
• 両系のマネージャサーバに最低2本ずつのNICが必要となります。
•
VIP
• フロントエンドネットワーク、バックエンドネットワークにそれぞれ、VIP用のIPアドレスが必要と
なります。
•
物理ディスクデバイス名
• Hinemosマネージャのインストール先の物理ディスクデバイス名が両系のマネージャサーバで
一致している必要があります。
Copyright © 2014 NTT DATA Corporation
11
機能
Copyright © 2014 NTT DATA Corporation
12
機能一覧
•
障害時自動フェイルオーバーによる運用継続
•
•
•
•
•
•
プロセス障害
ネットワーク障害
NIC障害
ディスク障害
システムダウン
フェイルオーバー中のメッセージロスト防止
• システムログ監視
• SNMPTRAP監視
•
クラスタ状態の通知
• 画面表示(イベント通知、ステータス通知)
• 外部への通知(メール、syslog)
• 処理の実行(コマンド通知)
Copyright © 2014 NTT DATA Corporation
13
障害時自動フェイルオーバーによる運用継続
障害が発生した場合にはスタンバイ側にフェイルオーバーし
運用管理サービスを継続します。
ネットワーク障害
Active→Stop
サーバ障害
ストレージ障害
Standby→Active
フェイルオーバー
Copyright © 2014 NTT DATA Corporation
14
フェイルオーバー中のメッセージロスト防止
フェイルオーバー中に受信したログのロストを防止します。
障害発生
フェイルオーバー開始
syslog
snmptrap
この期間に受信した
syslog/snmptrapも
ロストせずに監視
フェイルオーバー完了
フェイルオーバー
Copyright © 2014 NTT DATA Corporation
15
クラスタ状態の通知
クラスタ構成の障害を自動的に検知し、様々な方法で通知します。
メール通知
クライアント
画面での確認
他サーバへの
ログ転送
コマンド実行
Copyright © 2014 NTT DATA Corporation
16
アーキテクチャ
Copyright © 2014 NTT DATA Corporation
17
アーキテクチャ
•
Hinemos Manager(JavaVM)
• Hinemosの運用管理サービスを提供するアプリケーション
• S-VIP経由で、クライアントや管理対象ノードからの接続を受け付けます。
• マスタ・スレーブのうちアクティブ状態の系のみで起動されます。
•
PostgreSQL
• Hinemosの内部データベース
• PostgreSQLの同期レプリケーション機能により、D-VIP経由で、マスタ・スレーブのデータを
同期します。
• マスタ・スレーブのうち両系で起動されます。
•
HA Mediator(JavaVM)
• フェイルオーバー中のsyslog、SNMPTRAPの受信や、クラスタ状態の通知を司るアプリケー
ション
• マスタ・スレーブのうち両系で起動されます。
Copyright © 2014 NTT DATA Corporation
18
アーキテクチャ
Client
Client
Client
Agent
Agent
Agent
S-LAN
S-VIP
MS-PIP
SS-PIP
udp:514, tcp:514
udp:514, tcp:514
rsyslog
rsyslog
udp:24514
udp:162
udp:24514
HAMediator (JavaVM)
udp:162
HAMediator (JavaVM)
tcp:8080
Hinemos Manager (JavaVM)
JDBC
localhost
MD-PIP
SD-PIP
D-LAN
IC-LAN
tcp:24001
tcp:24001
PostgreSQL
PostgreSQL
Pacemaker
Pacemaker
Corosync
Corosync
Master
Copyright © 2014 NTT DATA Corporation
Slave
19
凡例
項目
説明
S-LAN
運用管理サービス、データベース同期(通常時)用のLAN
D-LAN
データベース同期(復旧操作時)用のLAN
IC-LAN
ハートビート通信用のLAN
MS-PIP
マスタのフロントエンドの実IPアドレス
MD-PIP
マスタのバックエンドの実IPアドレス
SS-PIP
スレーブのフロントエンドの実IPアドレス
SD-PIP
スレーブのバックエンドの実IPアドレス
S-VIP
運用管理サービス用の仮想IPアドレス
Copyright © 2014 NTT DATA Corporation
20
動作概要
Copyright © 2014 NTT DATA Corporation
21
通常運転時の動作
• Hinemos Manager(JavaVM)は、マスタ・スレーブのうち、アクティブ状態の系で起動します。
• PostgreSQLは、マスタ・スレーブの両系で起動します。
• HA Mediatorは、マスタ・スレーブの両系で起動します。(図では省略)
S-LAN
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
PostgreSQL
DISK
PostgreSQL
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
22
障害発生時の動作
発生した障害パターンに応じてフェイルオーバーを発生させ、
スタンバイ状態の系をアクティブ状態に変更し、動作を継続します。
S-LAN
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
障害発生
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
23
フェイルオーバー中の機能制限(Hinemosクライアント)
フェイルオーバー中に一時的に利用不可となる操作は下記の通りです。
•
•
画面表示の更新
設定内容の登録・変更・削除・実行
Hinemosマネージャ疎通確認タイミングによっては、 Hinemosマネージャとの接続が一時
的に切断される場合があります。
Copyright © 2014 NTT DATA Corporation
24
フェイルオーバー中の機能制限(監視)
フェイルオーバー中に一時的に停止する監視機能は下記の通りです。
•
•
•
•
•
•
•
•
•
•
Hinemosエージェント監視機能
HTTP監視機能
PING監視機能
SNMP監視機能
SQL監視機能
Windowsサービス監視機能
カスタム監視機能
サービス・ポート監視機能
プロセス監視機能
リソース監視機能
※フェイルオーバー完了後に再開されます。
Copyright © 2014 NTT DATA Corporation
25
フェイルオーバー中の機能制限(監視)
フェイルオーバー中も動作を継続する監視機能は下記の通りです。
•
•
•
•
システムログ監視
Windowsイベント監視
ログファイル監視
SNMPTRAP監視
※フェイルオーバー完了後に通知されます。
Copyright © 2014 NTT DATA Corporation
26
フェイルオーバー中の機能制限(ジョブ)
フェイルオーバー中に一時的に停止する動作は下記の通りです。
•
ジョブの制御(スケジュールされたジョブの開始、後続ジョブの開始など)
※フェイルオーバー完了後に再開されます。
フェイルオーバー中も継続する動作は下記の通りです。
•
既に開始されたジョブの実行
※ Hinemosエージェント側で終了したジョブの結果は、 フェイルオーバー完了後に
Hinemosマネージャに送信されます。
Copyright © 2014 NTT DATA Corporation
27
障害パターンごとの動作
Copyright © 2014 NTT DATA Corporation
28
JavaVMのプロセスダウン
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos
Manager
障害発生
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
29
PostgreSQLのプロセスダウン(マスタ)
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
障害発生
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
30
PostgreSQLのプロセスダウン(スレーブ)
縮退状態で片系運転を継続します。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
障害発生
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
31
ネットワーク障害(S-LAN)
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
障害発生
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
32
ネットワーク障害(D-LAN)
縮退状態で片系運転を継続します。スタンバイ側はSTONITHによりOS再起動されます。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
ssh/IPMI(reboot)
SS-PIP
Hinemos Manager
(JavaVM)
PostgreSQL
DISK
PostgreSQL
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
障害発生
IC-LAN
SD-PIP
DISK
Slave
33
NIC障害(マスタ/フロント)
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
S-VIP
S-VIP
MS-PIP
障害発生
SS-PIP
Hinemos Manager
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
34
NIC障害(マスタ/バック)
縮退状態で片系運転を継続します。スタンバイ側はSTONITHによりOS再起動されます。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
ssh/IPMI(reboot)
SS-PIP
Hinemos Manager
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
障害発生
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
35
NIC障害(スレーブ/フロント)
縮退状態で片系運転を継続します。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
SS-PIP
障害発生
Hinemos Manager
(JavaVM)
PostgreSQL
DISK
PostgreSQL
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
36
NIC障害(スレーブ/バック)
縮退状態で片系運転を継続します。スタンバイ側はSTONITHによりOS再起動されます。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
ssh/IPMI(reboot)
SS-PIP
Hinemos Manager
(JavaVM)
PostgreSQL
DISK
PostgreSQL
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
障害発生
DISK
Slave
37
ディスク障害(マスタ)
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
障害発生
DISK
Master
Copyright © 2014 NTT DATA Corporation
MD-PIP
D-LAN
IC-LAN
SD-PIP
DISK
Slave
38
ディスク障害(スレーブ)
縮退状態で片系運転を継続します。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
PostgreSQL
DISK
PostgreSQL
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
障害発生
DISK
Slave
39
システムダウン(マスタ)
スタンバイ側にフェイルオーバーします。
L3-Node
L3-IP
S-LAN
S-VIP
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
障害発生
(JavaVM)
Hinemos Manager
(JavaVM)
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
40
システムダウン(スレーブ)
縮退状態で片系運転を継続します。
L3-Node
L3-IP
S-LAN
S-VIP
MS-PIP
SS-PIP
Hinemos Manager
(JavaVM)
障害発生
PostgreSQL
PostgreSQL
DISK
MD-PIP
Master
Copyright © 2014 NTT DATA Corporation
D-LAN
IC-LAN
SD-PIP
DISK
Slave
41
その他
Copyright © 2014 NTT DATA Corporation
42
HAオプション ver.1.5とver.1.4までの差分
Ver.1.4まで
Ver.1.5
アーキテクチャ
JBoss
PostgresForest
Pacemaker
PostgreSQLレプリケーション
対応可能な障害
OS障害
ネットワーク障害
プロセス障害
OS障害
ネットワーク障害
プロセス障害
ディスク障害
Copyright © 2014 NTT DATA Corporation
43
Copyright © 2011 NTT DATA Corporation
Copyright © 2014 NTT DATA Corporation