CLUSTERPRO 7.0 LAN監視オプション編 - 日本電気

CLUSTERPRO® for Windows Ver 7.0
LAN監視オプション編
第5版
2004.05.21
改版履歴
版 数
第1版
改版年月日
2003. 05.28
改版ページ
第2版
2003. 08.01
第3版
2003.10.01
9
10,11
16
第4版
2003.11.14
9
2004.05.21
容
新規作成
10
第4版
内
全般
デスクトップとの対話を許可する場合の注意事項を追記
SNMPサービスのプロパティの設定内容について追記
見出し番号「3.3.1」を削除
障害検出時の ARMLOAD コマンドによる動作ポリシーについての記
述を追記
CLUSTERPROマネージャにアカウントを登録していない場合、監視
コマンドを指定ユーザで起動できない旨の記述を追加
PDF化に伴う図表記の不具合を修正
2
はじめに
『CLUSTERPROシステム構築ガイド』は、これからクラスタシステムを設計・導入しよう
としているシステムエンジニアや、すでに導入されているクラスタシステムの保守・運用管理を
行う管理者や保守員の方を対象にしています。
本構築ガイドは、「 CLUSTERPRO LAN 監視オプション for Windows R2.0」に対応してい
ます。
CLUSTERPRO®は日本電気株式会社の登録商標です。
Microsoft®, Windows®は米国 Microsoft Corporation の、米国およびその他の国における登録商標または商
標です。
その他のシステム名、社名、製品名はそれぞれの会社の登録商標または商標です。
3
CLUSTERPROドキュメント体系
CLUSTERPROのドキュメントは、CLUSTERPROをご利用になる局面や読者に応じて以下の通り分冊し
ています。初めてクラスタシステムを設計する場合は、システム構築ガイド【入門編】を最初にお読みくだ
さい。
(必須) 設計・構築・運用・保守
■ セットアップカード
製品添付の資料で、製品構成や動作環境などについて記載しています。
■ システム構築ガイド
【入門編】
(必須) 設計・構築・運用・保守
クラスタシステムをはじめて設計・構築する方を対象にした入門書です。
【システム設計編(基本/共有ディスク,ミラーディスク)】
(必須) 設計・構築・運用・保守
クラスタシステムを設計・構築を行う上でほとんどのシステムで必要となる事項をまとめたノウ
ハウ集です。構築前に知っておくべき情報、構築にあたっての注意事項などを説明しています。
システム構成が共有ディスクシステムかミラーディスクシステムかで分冊しています。
(選択) 設計・構築・運用・保守
【システム設計編(応用)】
設計編(基本)で触れなかった CLUSTERPRO のより高度な機能を使用する場合に必要となる事項を
まとめたノウハウ集です。
【クラスタ生成ガイド(共有ディスク,ミラーディスク)】
(必須) 設計・構築・運用・保守
CLUSTERPRO のインストール後に行う環境設定を実際の作業手順に沿って分かりやすく説明して
います。システム構成が共有ディスクシステムかミラーディスクシステムかで分冊しています。
(必須) 設計・構築・運用・保守
【運用/保守編】
クラスタシステムの運用を行う上で必要な知識と、障害発生時の対処方法やエラー一覧をまとめたド
キュメントです。
(必須) 設計・構築・運用・保守
【GUI リファレンス】
クラスタシステムの運用を行う上で必要な CLUSTERPRO マネージャなどの操作方法をまとめたリ
ファレンスです。
(選択) 設計・構築・運用・保守
【コマンドリファレンス】
CLUSTERPRO のスクリプトに記述できるコマンドやサーバまたはクライアントのコマンドプロン
プトから実行できる運用管理コマンドについてのリファレンスです。
(選択) 設計・構築・運用・保守
【API リファレンス】
CLUSTERPRO が提供する API を利用してクラスタシステムと連携したアプリケーションを作成す
る場合にお使いいただくリファレンスです。
(必須) 設計・構築・運用・保守
【ハードウェア構築編】
Express サーバ本体や共有ディスクなど、クラスタシステムのハードウェア構築に必要な仕様・諸元
についてまとめたドキュメントです。
(必須) 設計・構築・運用・保守
【ハードウェア現調編】
ハードウェアの設置環境や、接続・設定方法などについてまとめたドキュメントです。
(選択必須) 設計・構築・運用・保守
【PP 編】
この編に記載されている各 PP は、CLUSTERPRO と連携して動作することができます。
各 PP が、CLUSTERPRO と連携する場合に必要な設定や、スクリプトの記述方法、注意事項など
について説明しています。使用する PP については必ずお読みください。
(選択) 設計・構築・運用・保守
【注意制限事項集】
クラスタシステム構築時、運用時、異常動作等障害対応時に注意しなければならない事項を記載した
リファレンスです。必要に応じてお読みください。
4
【データベース監視オプション編 】
(選択) 設計・構築・運用・保守
データベース監視オプションを使用する際の説明を記載したリファレンスです。必要に応じてお読み
ください。
【インターネットサーバ監視オプション編】
(選択) 設計・構築・運用・保守
インターネットサーバ監視オプションを使用する際の説明を記載したリファレンスです。必要に応じ
てお読みください。
【LAN 監視オプション編】
(選択) 設計・構築・運用・保守
LAN 監視オプションを使用する際の説明を記載したリファレンスです。必要に応じてお読みくださ
い。
5
目次
1
LAN 監視. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
監視方法の概要 ....................................................................................................................... 7
1.1
スクリプトの記述 .................................................................................................................... 9
1.2
動作確認 ............................................................................................................................... 11
1.3
監視コマンドの動作確認 ................................................................................................. 11
1.3.1
1.3.2
SNMP サービスの設定確認 .............................................................................................. 12
2
監視コマンドからの情報出力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1
2.2
2.3
3
アラートメッセージ ............................................................................................................... 13
イベント ............................................................................................................................... 14
障害時のログ採取 .................................................................................................................. 14
LAN 監視コマンド . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1
LAN 監視コマンド一覧 ........................................................................................................... 15
監視チャート ......................................................................................................................... 15
3.2
コマンド表現形式 .................................................................................................................. 16
3.3
ARM_NETIF ............................................................................................................................... 17
4
アラートメッセージ一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.1
ARM_NETIF が出力するメッセージ ....................................................................................... 19
正常な動作を示すメッセージ ........................................................................................... 19
4.1.1
設定誤りなどで発生するメッセージ ................................................................................. 19
4.1.2
4.1.3
LAN 監視で異常を検出したときのメッセージ .................................................................. 20
システム異常などで発生するメッセージ .......................................................................... 20
4.1.4
5
ライセンス登録 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.1
5.2
6
ライセンス登録について ........................................................................................................ 22
ライセンスの注意事項 ........................................................................................................... 22
付録 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
スクリプト作成 ..................................................................................................................... 23
6.1
開始スクリプト ............................................................................................................... 23
6.1.1
終了スクリプト ............................................................................................................... 26
6.1.2
複数ネットワークアダプタの監視
6.2
........................................................................................... 29
6
1 LAN監視
1.1
監視方法の概要
CLUSTERPRO LAN 監 視 オ プ シ ョ ン で は 、 自 サ ー バ の ネ ッ ト ワ ー ク ア ダ プ タ の
LinkUp/LinkDown状態を監視するために、スクリプトに記述できるコマンドを提供しています。
本監視コマンドを実行すると、パラメータで指定された間隔でネットワークアダプタの監視処
理を行い、LinkDown状態が一定時間継続するまで、監視処理を続けます。ネットワークアダプ
タの異常を検出すると本監視コマンドは、終了します。
本監視コマンドは、CLUSTERPROのフェイルオーバグループのスクリプトに記述すること
で使用します。具体的には、ARMLOADコマンドで本監視コマンドを実行し、ARMKILL コマ
ンドで終了させます。
ネットワークアダプタの異常を検出すると監視コマンドが終了しますので、 ARMLOAD コマ
ンドのパラメータで、フェイルオーバやサーバシャットダウンなどの動作を行わせるようにしま
す。
監視動作概要図
CLUSTERPRO
ARMLOADコマンド
監視コマンド
ネットワークアダプタ
フェイルオーバグループ起動
監視コマンド起動
監視開始
異常検出
監視コマンドの終了を検出
障害
発生
監視コマンド終了
フェイルオーバグループ停止
A R M L O A D パラメータによりフェイルオーバやサーバシャットダウンなどが
実行されることによりフェイルオーバグループが停止する。
※ CLUSTERPROのリソース監視のパブリックLAN監視との相違
CLUSTERPRO標準機能のパブリックLAN 監視では、ネットワークの通信の異常を検出す
るのに対し、本監視コマンドでは、自サーバのネットワークアダプタのLinkDownを検出し
ます。監視コマンドは、指定したアドレスとの通信を監視するのではなく、指定したアドレ
スを持つネットワークアダプタを監視します。具体的には、自サーバのLAN ケーブルが抜け
た場合などに障害を検出することができるようになります。
パブリックLAN 監視 指定したアドレスと通信を行うことができるかどうかを監視
指定したアドレスを持つ自サーバのネットワークアダプタが通信を行
LAN 監視コマンド
うことができるかどうかを監視
7
【重要】
(1) 本監視コマンドは、ネットワークアダプタのLinkDownを監視することが目的であ
り、ネットワークアダプタが異常になった場合の調査や原因究明を行うものではあ
りません。障害が発生した場合、その詳細な原因は、Windowsのログなど他の手段
で原因を判断する必要があります。
(2) 本監視コマンドを実行する際は、SNMPサービスを起動させておいてください。
(3) 本監視コマンドは、Windows 2000 SP3以降で動作します。
8
1.2
スクリプトの記述
以下の点に注意して、スクリプトを作成してください。
・ ARMLOADコマンドによる動作ポリシー
障害検出時、サーバシャットダウン
/M
障害検出時、フェイルオーバグループのフェイルオーバを発生
/M /FOV
ARMLOADに/FOVパラメータを指定してフェイルオーバグループを起動した場合、障害
を検出した後フェイルオーバが発生しますが、さらにフェイルオーバ先のサーバで障害が
発生した場合、フェイルオーバ元のサーバにフェイルオーバグループが戻ってくる可能性
があります。このためフェイルオーバ発生後は、すみやかに障害発生原因を取り除いてく
ださい。フェイルオーバグループのフェイルオーバ動作については、本監視コマンドでは
なくARMLOADの上記パラメータにより制御します。
以下に、スクリプト記述例を示します。
START.BAT(異常検出時サーバシャットダウンさせたい場合)
:
ARMLOAD WATCHID /M LAN監視コマンド パラメータ
:
START.BAT(異常検出時フェイルオーバさせたい場合)
:
ARMLOAD WATCHID /M /FOV LAN監視コマンド パラメータ
:
STOP.BAT
:
ARMKILL WATCHID
:
スクリプト記述の具体例については、「6.1 スクリプト作成」を参照してください。
9
【重要】
(1)本監視コマンドはGUI画面を持たないため CLUSTERPRO Server サービスの“デスクトッ
プとの対話”を許可する必要はありません。
(2) CLUSTERPRO Server サービスに ” デスクトップとの対話” を許可するとスクリプトの進
行状況を画面にて確認することができ、スクリプトをデバッグする際に設定すると効果が
あります。ただし”デスクトップとの対話”を許可しているとサーバのログオフ時、本監視
コマンドが終了しフェイルオーバが発生することがあります。このため ”デスクトップとの
対話” を許可する場合、 ARMLOADコマンドにアドミニストレータアカウントを指定して
ください。アカウントは、 CLUSTERPROマネージャの「クラスタのプロパティ」で設定
しておいてください。CLUSTERPROマネージャで アカウントを登録していない場合、
CLUSTERPROマネージャのアラートビュー、サーバのイベントビューアに以下のエラー
メッセージが表示されます。
「グループxxx のアプリケーション (監視 ID=xxx) の起動に失敗しました。」
この場合、指定ユーザで監視コマンドを起動させようとしても監視コマンドは起動しませ
ん。
以下に、 ARMLOAD コマンドにアカウントを指定するスクリプト記述例を示します。
START.BAT(指定ユーザで監視コマンドを起動させる場合)
:
ARMLOAD WATCHID /U アカウント名 /M /FOV LAN監視コマンド パラメータ
:
ARMLOAD コマンド、アカウントの設定に関しては、それぞれ「システム構築ガイドコマン
ドリファレンス」、「システム構築ガイド GUIリファレンス」を参照してください。
10
1.3
動作確認
以下の操作を行い、フェイルオーバグループが正常に動作していることをCLUSTERPROマ
ネージャの画面で確認してください。
1.3.1 監視コマンドの動作確認
スクリプト内に監視コマンドを記述します。フェイルオーバグループを作成したのち、以下の
操作を行い、監視コマンドが正常に動作していることを確認してください。
1.3.1.1 グループの起動
選択したフェイルオーバグループを起動します。
起動したいフェイルオーバグループをメイン画面のツリービューで選択した後、 [操作]-[グルー
プの起動 ]を選択してください。
グループの起動で監視コマンドがCLUSTERPROマネージャに監視開始のメッセージを表示
しなかったり、逆にエラーメッセージを表示する場合、監視を開始しない要因として 以下の点が
考えられます。これらの点についてはエラーメッセージをもとに対処を行ってください。
・ ネットワークの設定やサーバの環境が適切でない場合
・ 監視コマンドのパラメータ値が適切でない場合
・ SNMP サービスの設定が適切でない場合
SNMP サービスの設定については「 1.3.2 SNMP サービスの設定確認」を参照してください。
1.3.1.2 グループの停止
選択したフェイルオーバグループを停止します。
停止したいフェイルオーバグループをメイン画面のツリービューで選択した後、 [操作]-[グルー
プの停止 ]を選択します。
フェイルオーバグループを起動する全てのサーバに対して、グループの起動とグループの停止
を確認してください。
1.3.1.3 グループの移動
サーバ間のフェイルオーバグループの移動を行います。
グループの起動を行い、次々と他のサーバにグループを移動させます。
移動したいフェイルオーバグループをメイン画面のツリービューで選択した後、 [操作]-[グルー
プの移動 ]を選択します。
グループの移動で監視コマンドがCLUSTERPROマネージャに監視開始のメッセージを表示
されていることを確認してください。
1.3.1.4 グループのフェイルオーバ
フェイルオーバを行います。
グループの起動を行い、そのサーバをスタートメニューからシャットダウンさせます。フェイ
ルオーバグループがフェイルオーバ先のサーバにフェイルオーバすることを確認します。
シャットダウンしたサーバは再起動後、サーバ復帰を行います。
1.3.1.5 障害検出確認
フェイルオーバグループを起動させ、監視を開始させます。
フェイルオーバグループを起動しているサーバにおいて、監視を行っているネットワークアダ
プタのLAN ケーブルを全て抜いて障害状態にします。サーバのシャットダウン、もしくはフェ
イルオーバグループのフェイルオーバが発生すれば、正しく障害を検出しています。
各サーバにおいて確認を行います。
障害検出の確認が終わったら、LAN ケーブルを元にもどしてください。
11
1.3.2 SNMPサービスの設定確認
監視オプションがネットワークアダプタの監視を行うためには、SNMP サービスのプロパティ
が適切に設定されている必要があります。このため以下に記載する確認内容を参照してSNMP
サービスのプロパティの設定を確認してください。
サービスマネージャから「SNMP Service」のプロパティを選択し「セキュリティ」タブを表
示させます。
以下の点を確認してください。
・ 「受け付けるコミュニティ名」のコミュニティの欄に「 public」、または監視オプション
の /N パラメータで指定する値が設定されており「読み取り」以上の権利が設定されてい
ること
・ 「すべてのホストから SNMP パケットを受け付ける」にチェックがされているか、あるい
は「これらのホストから SNMP パケットを受け付ける」にチェックがされている場合は、
SNMP パケットを受け付けるホストの欄にループバックアドレス( 127.0.0.1)が設定され
ていること
【重要】
(1)監視オプションを起動するすべてのクラスタノードで適切な設定になっていることを確認
してください。
(2)設定が適切でない場合は、上記に記載した確認内容を参照して設定を変更してください。
12
2 監視コマンドからの情報出力
監視コマンドは、監視状況をCLUSTERPROマネージャのアラートビュー上に表示します。
システムやI/Oの高負荷などで情報出力が行えなくなった場合、監視コマンドは、一時的に情報
出力処理を中断することがあります。その間のLAN 監視自体は、続行されます。
また、アラートビューに表示されるメッセージと同一の内容が監視コマンドを実行して いる
サーバのイベントにも出力されます。
2.1
アラートメッセージ
マネージャのアラートビューに表示
1行111バイト以内のメッセージを表示します。表示内容が長い場合は、複数行で表示されま
す。複数行表示の場合は、タイミングによって他のメッセージの表示が割り込まれることがあり
ます。アラートメッセージの IDは、0で固定です。イベントログの IDは表示されませんので注意
してください。
また、アラートビューに表示されるメッセージは、同時に CLUSTERPRO インストールフォ
ルダ配下のARM.LOGに同一内容を出力します。
アラートメッセージの詳細については、「 4 アラートメッセージ一覧」を参照してください。
【注意】
CLUSTERPROマネージャと通信を行っているネットワークに接続されているネット
ワークアダプタで異常が発生した場合、 CLUSTERPRO マネージャのアラートビュー
に障害メッセージが出力されないことがあります。
13
2.2
イベント
監視コマンドを実行しているサーバ上で、イベントビューアによりイベントを表示することが
できます。
監視オプションのイベントは、アプリケーションイベントで、ソース名が、「 CLUSTERPRO
AP WATCH」になります。
2.3
障害時のログ採取
監視コマンドの障害ログは、CLUSTERPROサーバの障害ログと同じフォルダ下に出力され
ます。ログの採取は、 CLUSTERPROのログ採取と同じ方法で採取します。「 CLUSTERPRO
システム構築ガイド 運用/保守編」を参照してください。
14
3 LAN監視コマンド
3.1
LAN監視コマンド一覧
LAN 監視オプションでは、スクリプトに記述するLAN 監視コマンドを提供しています。
スクリプト内でのみ使用可能なコマンド
コマンド
使用用途
参照ページ
ARM_NETIF.EXE ネットワークアダプタの監視を行います。
17
【重要】
監視コマンドは、フェイルオーバグループで使用するスクリプト内でのみ使用可能 です。他の
方法では、使用しないでください。他の方法で監視コマンドを実行した場合、コマンドプロンプ
トのウィンドウが表示されたり、タスクバー上にアイコンが表示されたりなどのアプリケーショ
ンが実行されたことを示す画面上の表示が一切ありません。そのため、不用意に実行させても実
行されているかどうかがわからず、トラブルの原因になります。なお、タスクマネージャなどで
プロセス一覧を表示させると、起動されているかどうかを確認することができます。
3.2
監視チャート
LAN 監視オプションは、以下のタイミングで障害を認識します。
←監 視 間 隔→
障害
監視処理
応 答( エラー )
リトライ1回目
リトライ2回目
※リトライ回数2回の場合
監視処理を行った時点でのLinkUp/LinkDown 状態により、LinkDown状態が継続しているか
どうかを判断します。そのため、監視間隔の間のLinkUp/LinkDownの状態変化に関しては考慮
しません。
また、指定した応答待ち時間内にLinkUp/LinkDownの状態を取得できなかった場合はエ ラー
とはみなしません(LAN 監視コマンドのパラメータによりエラーとみなすこともできます )。
←応答待ち時間→ ←監視間隔→
?
15
3.3
コマンド表現形式
コマンドの機能についての見方について説明します。機能説明は、以下の形式で行ないます 。
・ コマンドライン
ユーザが入力する実際のイメージを示します。
[] は、囲まれたパラメータが省略可能であることを示します。
| は、区切られたパラメータのいずれかを選択することを示します。
・ 説明
機能に関する説明です。
・ パラメータ
上記コマンドラインで示されたパラメータに関する説明です。
・ 補足
補足事項です。パラメータの設定の詳細などが説明されています。
・ 監視方法
監視方法に関する説明です。
・ 注意
コマンドを使用する際の注意事項です。
・ コマンド使用例
実際にコマンドを使用する際のスクリプトへの記述例です。
16
ARM_NETIF
LAN の監視を行います。
コマンドライン
ARM_NETIF
説明
パラメータ
[/A ネットワークアドレス] [/N コニュニティ名 ] [/E 障害検出種別]
[/I 監視間隔] [/C リトライ回数 ] [/R 応答待ち時間]
ネットワークアドレスを指定することで、監視を行うネ ットワークアダプタ
を特定し、SNMP を利用してLAN 監視を行います。LAN の異常を検出すると、
本監視コマンドは終了します。
/A ネットワークア 監視を行いたいネットワークアダプタのネットワークアド
ドレス
レスを指定します。
既定値 サーバ上の全てのネットワークアドレス。
/N コミュニティ名 SNMP のコミュニティ名を指定します。
既定値 public 。
補足
/E 障害検出種別
LinkUp/Down の検出時に通信障害などが発生したときの動
作を指定します。本パラメータを省略した場合、LinkDown
の障害とはみなしません。
障害検出種別には、 Aを指定することができます。
A
L i n k U p / D o w n の検出時の障害を LinkDown 障害と
みなす。
/I 監視間隔
LAN 監視の監視間隔(1∼10000)を秒数で指定します。
既定値 30。
/C リトライ回数
LAN 監視で障害を検出したときの リトライ回数(1 ∼10000)
を指定します。
既定値 5。
/R 応答待ち時間
LAN 監視処理の応答待ち時間(1 ∼10000) を秒数で指定しま
す。
既定値 60。
/Aパラメータについて
ネットワークアドレスは、以下の形式で記述します。
/A IP アドレス/ネットマスク
ネットマスクは、アドレス形式でもビット列長形式でも記述可能です。
複数指定する場合は、カンマで区切ります。最大16アドレス指定することが
できます。
指定する際は不要なスペースは記述しないでください。
記述例
/A 192.168.10.2/255.255.255.0,192.168.15.4/24
複数指定した場合、記述したネットワークアドレスに該当する全てのネット
ワークカードが同時に障害になった場合に異常とみなします(「5.2 複数
ネットワークアダプタの監視」参照)。また、本パラメータを省略した場合、
サーバ上の全てのネットワークアダプタが同時に障害になった場合に異常
とみなします。
17
/A,/N パラメータについて
上記パラメータで指定可能な文字列の長さは、 255 バイトまでです。実際に
有効な長さは、各パラメータによって異なりますが、本監視コマンドでは、
有効長の確認は行いません。
監視方法
本監視コマンドでは、以下の監視を行います。
SNMP サービスに対して、ネットワークアダプタのLinkUp/LinkDown 情報
の確認を行い、リトライ分、LinkDown 状態を連続して検出した場合、障害
とみなします。
注意1
本監視コマンドを動作させるフェイルオーバグループを起動した際に、
CLUSTERPROマネージャのアラートビューに、「 ARM_NETIF は、ネッ
トワークアダプタの監視を開始しました。」のメッセージが表示されたのち、
「ARM_NETIF は、ネットワークアダプタ xxxの監視を開始します。」が表
示されない場合は、/Aパラメータの設定値とネットワークアダプタに設定さ
れているネットワークアドレスが一致していないか、SNMP との通信で障害
が発生している可能性があります。SNMP との通信障害が発生している場合
は、/E Aパラメータを指定すれば、障害を検出することができます。
インタコネクト専用のネットワークアダプタを監視することは可能ですが、
運用上、フェイルオーバする必要がない場合は、インタコネクト専用のネッ
トワークアダプタは監視の対象外になるようにしてください。
Windows Server 2003においては、SNMP サービスのコミュニティ名が初期
状態で設定されていません。SNMP サービスのプロパティでコミュニティ名
を設定したのち、本監視コマンドをご利用ください。
注意2
注意3
コマンド使用例
ARMLOAD LANWATCH /M ARM_NETIF /A 192.168.10.0/255.255.255.0
通常、本監視コマンドは/AパラメータでパブリックLAN のネットワークアダ
プタを指定します。
18
4 アラートメッセージ一覧
監視コマンドが、CLUSTERPROマネージャのアラートビューに表示するメッセージの一覧です。
同一のメッセージが監視コマンドを実行しているサーバのイベントビューアにも表示されます。表中
のIDは、イベントログのイベントID を示します。
4.1
4.1.1
ARM_NETIFが出力するメッセージ
正常な動作を示すメッセージ
メッセージ
説 明
補 足
ID
ARM_NETIF は、ネットワークア ARM_NETIF が起動されたこと 本メッセージは、CLUSTERPROが表 1
ダプタの監視を開始しました。 を示します。
示する「グループxxxをサーバxxxで起 情報
動しました」などのメッセージより先に
表示されることがありますが、問題あり
ません。
ARM_NETIF は、ネットワークア ARM_NETIF がネットワークア 上記メッセージの後に本メッセージが 2
ダプタxxxの監視を開始します。 ダプタxxxの監視を開始したこと 表示されていない場合は、ネットワーク 情報
を示します。
アドレスが正しく設定されていないか、
SNMPとの通信障害が発生している可
能性があります。
ARM_NETIF は、ネットワークア ARM_NETIF が終了することを −
3
ダプタの監視を終了します。
示します。
情報
4.1.2
設定誤りなどで発生するメッセージ
メッセージ
説 明
対 処
ID
ARM_NETIF は、ネットワークア 直前に表示されているメッセージ 直前のメッセージを元に対処を行って 6
ダプタの監視を行いません。
内容が原因で監視を行わない状態 ください。
エラー
になったことを示します。
ARM_NETIF のライセンスが登 ライセンス登録が行われていな ライセンスマネージャからライセンス 9
録されていません。
いことを示します。
登録を行ってください。
エラー
ARM_NETIF の INF ファイルが インストールフォルダ下に該当 LAN 監視オプションの再インストー 6
見つかりません。
する INF ファイルが存在しませ ルが必要です。
エラー
ん。
INFファイルの削除は行わないでくだ
さい。
ARM_NETIF の INF ファイルの INF ファイル内の情報が不正に LAN 監視オプションの再インストー 6
内容が壊れています。
なっています。
ルが必要です。
エラー
INFファイルの内容の更新などは行わ
ないでください。
ARM_NETIF の コ マ ン ド パ ラ コマンドパラメータ内のダブル パラメータに不要なダブルクォーテー 7
メータの形式が不正なため、パラ クォーテーションの対応が不正 ションが入っていないか確認してくだ エラー
メータ解析を行うことができま になっています。
さい。
せん(コマンドパラメータ)。
ARM_NETIF のパラメータが不 ARM_NETIF のパラメータ値が 監視コマンドのパラメータ値を確認し 7
正なため、ネットワークアダプタ 形式的に不正であったことを示 てください。
エラー
の監視は行いません。
します。
SNMPサービスが存在しません。SNMPサービスが存在しないこと 実際にSNMPサービスが存在するかど 6
を示します。
うか確認してください。
エラー
SNMP サービスが開始されてい SNMPサービスが停止しているこ フェイルオーバグループの起動中にSN 5
ません。ARM_NETIF は、ネット とを示します。
MP サービスの停止・開始を行うと各 情報
ワークアダプタの監視を中断し
メッセージが表示されます。SNMPサー
ます。
19
メッセージ
説 明
ID
対 処
SNMP サービスが開始されまし SNMPサービスが再開されたこと ビス停止中は、監視処理を行いません。5
た。ARM_NETIF は、ネットワー を示します。
情報
クアダプタの監視を開始します。
ARM_NETIF は、Windows2000 WindowsNTサーバで本コマンド 本監視コマンドは、Windows2000 SP3 6
より古いOS では動作しません。 を起動したことを示します。
以上から動作可能です。
エラー
ARM_NETIF は、Windows2000 Windows2000 SP3未適用のサー
6
SP3以前では動作しません。
バで本コマンドを起動したことを
エラー
示します。
4.1.3
LAN監視で異常を検出したときのメッセージ
メッセージ
説 明
ID
対 処
ARM_NETIF は、ネットワークア ARM_NETIF が異常検出のため 本コマンドが終了します。
ダプタの監視を終了します。
終了することを示します。
4
ARM_NETIF は、ネットワークア 表示されているネットワークア 障害の原因を取り除いてください。
ダプタxxxのリンクダウンを検出 ダプタにおいて、LinkDownを検
しました。
出したことを示します。
8
警告
4.1.4
エラー
システム異常などで発生するメッセージ
メッセージ
説 明
対 処
ID
の 表示されているエラーコードを元に対 7
AP監視のモジュールファイル名 Win32API
の取得に失敗しました(エラー GetModuleFileNameのエラーを 処を行ってください。
エラー
コード nn)。
示します。エラーコードは、
GetLastErrorの値です。
AP監視のモジュールファイル名 モジュールファイル名がフルパ −
7
が不正です(モジュールファイル ス記述でありません。もしくは、
エラー
名)。
拡張子がありません。
は
、 CLUSTERPROのレジストリの 表示されているエラーコードを元に対 7
ARM_NETIF
CLUSTERPROのレジストリの オープンに失敗しました。
処を行ってください。
エラー
オープンに失敗しました(エラー
コード nn)。
は
、 Win32API の RegQueryValueEx 表示されているエラーコードを元に対 7
ARM_NETIF
CLUSTERPROのインストール のエラーを示します。エラーコー 処を行ってください。
エラー
フォルダ名の取得に失敗しまし ドは、GetLastErrorの値です。
た(エラーコード nn)。
ARM_NETIF は、コマンドパラ Win32APIのLocalAllocのエラー 表示されているエラーコードを元に対 7
メータの処理を行うための領域 を示します。エラーコードは、 処を行ってください。
エラー
確保に失敗しました(エラーコー GetLastErrorの値です。
ド nn)。
ARM_NETIF の初期処理時に OS Win32APIの GetVersionEx のエ 表示されているエラーコードを元に対 7
のバージョン情報の取得に失敗 ラーを示します。エラーコード 処を行ってください。
エラー
しました(エラーコード nn)。 は、GetLastErrorの値です。
SNMP サービスの情報取得に失 Win32APIのサービス情報取得 表示されているエラーコードを元に対 7
敗しました(エラーコード nn)。 関数のエラーを示します。エラー 処を行ってください。
エラー
コードは、 GetLastError の値で
す。
SOCKET の作成に失敗しました Win32API の socket 関 数 の エ 表示されているエラーコードを元に対 7
ラーを示します。エラーコード 処を行ってください。
(エラーコード nn)。
エラー
は、WSAGetLastErrorの値です。
20
メッセージ
説 明
対 処
ID
SOCKET のデータ送信に失敗し Win32APIのsend関数のエラー 表示されているエラーコードを元に対 7
ました(エラーコード nn)。
を示します。エラーコードは、 処を行ってください。
エラー
WSAGetLastErrorの値です。
SOCKET のデータ受信に失敗し Win32APIのrecv関数のエラー 表示されているエラーコードを元に対 7
ました(エラーコード nn)。
を示します。エラーコードは、 処を行ってください。
エラー
WSAGetLastErrorの値です。
SOCKET 通信に失敗しました(エ Win32API の select 関 数 の エ 表示されているエラーコードを元に対 7
ラーコード nn)。
ラーを示します。エラーコード 処を行ってください。
エラー
は、WSAGetLastErrorの値です。
SOCKET 通信でタイムアウトが Win32APIのselect 関数でタイ 応答待ち時間を長くするか、ネットワー 7
発生しました。
ムアウトを検出したことを示し ク障害が発生していないか確認してく エラー
ます。
ださい。
ネットワークアダプタ情報が不 SNMP サ ー ビ ス か ら 取 得 し た ネットワークドライバなどに異常がな 7
正です。
ネットワークアダプタ情報の内 いが確認してください。
エラー
容が正しくないことを示します。
ネットワークアダプタ情報の取 SNMP サービスからネットワー ネットワークドライバなどに異常がな 7
得に失敗しました (エラーコード ク ア ダ プ タ 情 報 を 取 得 で き な いが確認してください。
エラー
かったことことを示します。エ
nn)。
ラーコードは、SNMPサービスが
通知するエラーコードです。
21
5 ライセンス登録
5.1
ライセンス登録について
各監視コマンドを実行させるためには、監視オプションのライセンス登録を行っておく必要が
あります。
ライセンス登録の方法は、以下の2つがあります。
1.
2.
監視オプションのセットアップ時
監視オプションのセットアップを実行中、モジュールのインストール後、ライセンス登
録画面が自動的に表示されます。
スタートメニューからの起動
スタートメニューに監視オプションのメニューがありますので、そこから、「ライセン
ス マネージャ」を指定します。
ライセンス登録に関しては、「 CLUSTERPRO構築ガイド GUIリファレンス 」を参照してく
ださい。
ライセンス登録を行わなかった場合、監視コマンドは起動しますが、監視処理を行いません。
5.2
ライセンスの注意事項
以下の点に注意してください。
1.
2.
3.
4.
監視オプションは、1サーバライセンスですので、セットアップを行う各サーバでそれ
ぞれのライセンスキーを使用してライセンス登録を行う必要があります。
監視オプションのアンインストールを行うと、自動的にライセンスの削除が行われます
ので、通常は、「ライセンス マネージャ」からライセンス削除を行わないでください。
監視オプションのバージョンアップ時に上書きインストールを行うと、旧製品のライセ
ンスが自動的に削除されます。
2,3のようにライセンスの削除が実行される場合、クラスタを構成しているサーバは全て
正常状態、もしくはダウン後再起動状態である必要があります。1サーバでもダウン状
態であった場合、ライセンス削除を行うことができません。ライセンス削除を行うこと
ができない場合、その旨のメッセージボックスが表示され、処理を続行するかキャンセ
ルするかを選択することができます。処理を続行した場合、ライセンスは残ります。こ
の残ったライセンスを削除するには、あたらめて、監視オプションをセットアップした
後、全サーバを正常状態にした後、アンインストールを行う必要があります。なお、ラ
イセンスが残っていても、その製品を使用する予定がないのであれば、特に問題はあり
ません。
22
6 付録
6.1
6.1.1
スクリプト作成
開始スクリプト
START.BAT を修正します。
rem 業務通常処理
と
rem フェイルオーバ後の業務起動ならびに復旧処理
のコメントが記述されている後方の各プライオリティの処理部分の計4 箇所に監視コマンド
を起動するARMLOADコマンドを記述します。
下記のstart.batスクリプトを参考にしてください。
rem
rem
rem
rem
rem
rem
***************************************
*
start.bat
*
*
*
* title
: start script file sample *
* version : 001.01
*
***************************************
rem ***************************************
rem 起動要因チェック
rem ***************************************
IF "%ARMS_EVENT%" == "START" GOTO NORMAL
IF "%ARMS_EVENT%" == "FAILOVER" GOTO FAILOVER
IF "%ARMS_EVENT%" == "RECOVER" GOTO RECOVER
rem ActiveRecoveryManager 未動作
GOTO no_arm
rem ***************************************
rem 通常起動対応処理
rem ***************************************
:NORMAL
rem ディスクチェック
IF "%ARMS_DISK%" == "FAILURE" GOTO ERROR_DISK
rem *************
rem 業務通常処理
rem *************
rem
rem
rem
rem
rem
ARMRSPでリソースが異常状態のときに
フェイルオーバを発生させる
ARMRSPが異常状態になったとき、
ARMLOADでサーバシャットダウンを発生させる
(例)ARMLOAD watchID /R 9 /H 1 ARMRSP /A /PL 10.10.9.8 /PL 10.10.9.9
rem プライオリティ チェック
IF "%ARMS_SERVER%" == "OTHER" GOTO ON_OTHER1
23
rem
rem
rem
rem
*************
最高プライオリティ での処理
(例) ARMBCAST /MSG "最高プライオリティサーバで起動中です" /A
*************
ARMLOAD LANWATCH /M /FOV ARM_NETIF /A 192.168.10.0/255.255.255.0
①
GOTO EXIT
:ON_OTHER1
rem *************
rem 最高プライオリティ 以外での処理
rem (例) ARMBCAST /MSG "プライオリティサーバ以外で起動中です" /A
rem *************
ARMLOAD LANWATCH /M /FOV ARM_NETIF /A 192.168.10.0/255.255.255.0
②
GOTO EXIT
rem ***************************************
rem リカバリ対応処理
rem ***************************************
:RECOVER
rem
rem
rem
rem
*************
クラスタ復帰後のリカバリ処理
(例) ARMBCAST /MSG "Serverの復旧が終了しました" /A
*************
GOTO EXIT
rem ***************************************
rem フェイルオーバ対応処理
rem ***************************************
:FAILOVER
rem ディスクチェック
IF "%ARMS_DISK%" == "FAILURE" GOTO ERROR_DISK
rem *************
rem フェイルオーバ後の業務起動ならびに復旧処理
rem *************
rem
rem
rem
rem
rem
ARMRSPでリソースが異常状態のときに
フェイルオーバを発生させる
ARMRSPが異常状態になったとき、
ARMLOADでサーバシャットダウンを発生させる
(例)ARMLOAD watchID /R 9 /H 1 ARMRSP /A /PL 10.10.9.8 /PL 10.10.9.9
rem プライオリティ のチェック
IF "%ARMS_SERVER%" == "OTHER" GOTO ON_OTHER2
rem *************
24
rem 最高プライオリティ での処理
rem (例) ARMBCAST /MSG "最高プライオリティサーバで起動中です(フェイルオーバ後)" /A
rem *************
ARMLOAD LANWATCH /M /FOV ARM_NETIF /A 192.168.10.0/255.255.255.0
③
GOTO EXIT
:ON_OTHER2
rem *************
rem 最高プライオリティ 以外での処理
rem (例) ARMBCAST /MSG "プライオリティサーバ以外で起動中です(フェイルオーバ後)" /A
rem *************
ARMLOAD LANWATCH /M /FOV ARM_NETIF /A 192.168.10.0/255.255.255.0
GOTO EXIT
rem ***************************************
rem 例外処理
rem ***************************************
rem ディスク関連エラー処理
:ERROR_DISK
ARMBCAST /MSG "切替パーティションの接続に失敗しました" /A
GOTO EXIT
rem ARM 未動作
:no_arm
ARMBCAST /MSG "ActiveRecoveryManagerが動作状態にありません" /A
:EXIT
25
④
6.1.2
終了スクリプト
STOP.BAT を修正します。
rem 業務通常処理
と
rem フェイルオーバ後の業務起動ならびに復旧処理
のコメントが記述されている後方の各プライオリティの処理部分の計4 箇所に監視コマンド
を終了するARMKILLコマンドを記述します。
下記のstop.bat スクリプトを参考にしてください。
rem
rem
rem
rem
rem
rem
rem
***************************************
*
stop.bat
*
*
*
* title
: stop script file sample
*
* date
: 1999/11/30
*
* version : 001.01
*
***************************************
rem ***************************************
rem 起動要因チェック
rem ***************************************
IF "%ARMS_EVENT%" == "START" GOTO NORMAL
IF "%ARMS_EVENT%" == "FAILOVER" GOTO FAILOVER
rem ActiveRecoveryManager 未動作
GOTO no_arm
rem ***************************************
rem 通常終了対応処理
rem ***************************************
:NORMAL
rem ディスクチェック
IF "%ARMS_DISK%" == "FAILURE" GOTO ERROR_DISK
rem *************
rem 業務通常処理
rem *************
rem
rem
rem
rem
リソースの異常監視を終了
ARMLOADで起動したARMRSPの終了コマンド
watchIDはARMLOAD指定時のものを使用する
(例)ARMKILL watchID
rem プライオリティ チェック
IF "%ARMS_SERVER%" == "OTHER" GOTO ON_OTHER1
rem
rem
rem
rem
*************
最高プライオリティ での処理
(例)ARMBCAST /MSG "最高プライオリティサーバで終了中です" /A
*************
26
ARMKILL LANWATCH
①
GOTO EXIT
:ON_OTHER1
rem *************
rem 最高プライオリティ 以外での処理
rem (例)ARMBCAST /MSG "プライオリティサーバ以外で終了です" /A
rem *************
ARMKILL LANWATCH
②
GOTO EXIT
rem ***************************************
rem フェイルオーバ対応処理
rem ***************************************
:FAILOVER
rem ディスクチェック
IF "%ARMS_DISK%" == "FAILURE" GOTO ERROR_DISK
rem *************
rem フェイルオーバ後の業務起動ならびに復旧処理
rem *************
rem
rem
rem
rem
リソースの異常監視を終了
ARMLOADで起動したARMRSPの終了コマンド
watchIDはARMLOAD指定時のものを使用する
(例)ARMKILL watchID
rem プライオリティ のチェック
IF "%ARMS_SERVER%" == "OTHER" GOTO ON_OTHER2
rem
rem
rem
rem
*************
最高プライオリティ での処理
(例)ARMBCAST /MSG "最高プライオリティサーバで終了中です(フェイルオーバ後)" /A
*************
ARMKILL LANWATCH
③
GOTO EXIT
:ON_OTHER2
rem *************
rem 最高プライオリティ 以外での処理
rem (例)ARMBCAST /MSG "プライオリティサーバ以外で終了中です(フェイルオーバ後)" /A
rem *************
ARMKILL LANWATCH
④
GOTO EXIT
27
rem ***************************************
rem 例外処理
rem ***************************************
rem ディスク関連エラー処理
:ERROR_DISK
ARMBCAST /MSG "切替パーティションの接続に失敗しました" /A
GOTO EXIT
rem ARM 未動作
:no_arm
ARMBCAST /MSG " ActiveRecoveryManagerが動作状態にありません" /A
:EXIT
28
複数ネットワークアダプタの監視
6.2
CLUSTERPRO のサーバにパブリック LAN が複数設定されている場合、監視コマンドの記述の
方法により、各ネットワークアダプタの障害状態によるフェイルオーバ動作を指定することができま
す。
IP1(192.168.0.xx/255.255.255.0)
N EC
NEC
Express5800/130Dpro
Express5800/130Dpro
インタコネクト専用 LAN
IP2(192.168.1.xx/255.255.255.0)
ネットワーク
アダプタ
IP1
IP2
○
○
○
×
スクリプト記述
/A パラメータで複数指定 (※1)
ARMLOAD を複数記述(※2)
ARMLOAD ∼ ARM_NETIF /A IP1,IP2 ARMLOAD ∼ ARM_NETIF /A IP1
ARMLOAD ∼ ARM_NETIF /A IP2
フェイルオーバしない
フェイルオーバしない
フェイルオーバしない
フェイルオーバする
×
×
○
×
フェイルオーバしない
フェイルオーバする
○:正常
フェイルオーバする
フェイルオーバする
×:異常
※1
ARM_NETIF コマンドの/ A パラメータで複数のネットワークアドレスを記述した場合、全て
※2
のネットワークアダプタが異常になったときにフェイルオーバが発生します。
ARM_NETIF コマンドの/ A パラメータに 1 つのネットワークアドレスを記述した ARMLOAD
を複数記述した場合、いずれかのネットワークアダプタが異常になったときにフェイルオーバ
が発生します。
29