講演資料 - InterSystems

InterSystems Symposia 2012
Caché
トラブルシューティング
インターシステムズジャパン㈱
カ タ
カスタマーサポート部
サポ
部
サポートエンジニア
三浦昌仁
概要
• トラブルシューティングに利用するユーティリティの紹介
• 情報収集を行う為のもの
• 復旧/対処を行う為のもの
• サポートセンターによく寄せられる障害事例について
それらのトラブルシューティングについて解説
• ユーティリティによる障害の内容把握
• トラブルの原因解析
• トラブルへの対処
2
1
InterSystems Symposia 2012
トラブルシューティングに
トラブルシュ
ティングに
利用するユーティリティ
障害発生時の情報収集
• 現象の特定および原因調査の為に必要な情報
• 基本情報
• ^Buttonsユーティリティによる情報
• Cachéコンソールログファイル
• 追加情報
•
•
•
•
•
cstatユーティリティによる情報
g
CacheHungスクリプトによる情報
プロセスダンプ /プロセスコア
監査ログ情報
システム管理ポータルの各種メニュ/ユーティリティ
4
2
InterSystems Symposia 2012
^Buttonsユーティリティ
• トラブル発生時の様々な情報を取得する
• HTML形式ファイルにトラブル時の各種情報を記録
• 出力先
•
Install_Dir¥mgr¥顧客名YYYYMMDDHHMM.html
•
C:¥InterSystem¥Cache¥Mgr¥Mycompany201206070930.html
5
^Buttonsユーティリティの内容
• 基本情報
• 一般
6
•
ホスト名
•
Caché Direct サーバのバージョン情報
•
IP アドレス
•
Caché WebLink のバージョン情報
•
ユーザ名
•
各国言語サポート (NLS) 情報
•
レポート作成日時
•
データベース、ディスク空き容量情報
•
Caché のバージョンの文字列 ($ZVersion)
•
オペレーティングシステムのバージョン
•
Caché オブジェクトのバージョンの文字列
•
拡張システム情報
•
Caché ODBC/JDBC サーバのバージョン情報
• ライセンスキーファイル
• セキュリティ設定情報
• ライセンス使用数
• %SS (Cachéのプロセス一覧)
• 監査情報
• OSでのプロセスリスト
• Cachéコンソールログ
• シャドウイング設定情報
• Caché構成ファイル
• SysLog (Caché内部エラー)
3
InterSystems Symposia 2012
^Buttonsユーティリティの内容
• 詳細情報
• cstatスナップ情報
• ネットワークステータス
ネ ト
ク テ タ
• ipconfig /all (Windows システムのみ)
• netstat -an
• netstat -s
• ライセンスダンプ情報
• Cachéプロセスダンプファイルの一覧
• GloStatデータベースアクセス統計情報
7
^Buttonsユーティリティでの注意点
• SysInternalsユーティリティを事前インストール
• Windowsの場合、OSにない機能を補完する為に以下のツー
ルを使用
• PsInfo.Exe :詳細なシステム情報を表示
• PsList.Exe :OSレベルのプロセス一覧を取得
以下のURLからダウンロード
http://technet.microsoft.com/ja-jp/sysinternals/bb896649
• インストール方法
インスト ル方法
ダウンロードしたファイルを以下ディレクトリに展開
<Install_Dir>¥Bin¥
• Linuxでは不要(OSにより提供される為)
8
4
InterSystems Symposia 2012
^Buttonsユーティリティでの注意点
• cconsole.log のサイズが 5 MB 以上の場合、
出力ファイルに含まれない
• 以下のようなメッセージが出力ファイルに記録
以下のようなメッセ ジが出力ファイルに記録
• File /usr/cachesys/mgr/cconsole.log is too big to be appended to the Log File. A
copy has been left in the Directory.
• cstat 出力ファイルが 5 MB 以上の場合、
個別のファイルに保存
• 以下のようなメッセ
以下のようなメッセージが出力ファイルに記録
ジが出力ファイルに記録
• File /usr/cachesys/mgr/cstat201103151102.html is too big to be appended to the
Log File. A copy has been left in the Directory
• ファイルの圧縮後、弊社への送付をお願い致します
9
^Buttonsユーティリティの実行方法
• ターミナルからの実行
• USER>zn “%SYS”
• %SYS>D ^B
^Buttons
tt
• 管理ポータルからの実行
• 管理ポータル>システムオペレーション>診断レポート
• 実行完了まで数分要する
• 業務中実行してもシステムに負荷は与えない
業務中実行
もシ
ム 負荷は与えな
10
5
InterSystems Symposia 2012
^Buttonsユーティリティの実行方法
11
Cachéコンソールログ
• Cachéコンソールログの内容
Caché開始時/停止時の状態やCachéシステムより送られる
メッセージ/エラーを記録
•
•
•
•
Cachéシステムエラー
一般(情報)メッセージ
OSエラー
ネットワークエラー
• OS上のファイルとして以下のディレクトリに保存
• <Install_Dir>¥mgr¥cconsole.log
• MaxConsoleLogSizeの設定値のサイズにて次回の起動時に
cconsole.old にリネーム
12
6
InterSystems Symposia 2012
Cachéコンソールログ
• フォーマット
日付-時刻 (PID) n メッセージ
日付-時刻
付 時刻
PID:メッセージを出力したプロセスのPID
n : 深刻度レベルを示す数値
13
Cachéコンソールログ
• メッセージには重要度を示す数値が記録
• 数値の意味
• 0:情報 エラーではない
• 1:警告
警告 回復可能なエラー(Cachéプロセスやシステム停止/ハングに
復 能な
プ
停
グ
なるエラーではない)
• 2:深刻なエラー Cachéプロセスやシステムのハングの恐れ
• 3:致命的エラー Cachéシステムハングやシステム強制停止が発生
重要度の高いメッセージの例)
04/25/11-18:18:30:003 (1080) 2 <FILEFULL> in database c:¥intersystems¥cache¥mgr¥ttt¥
04/25/11-18:19:27:572 ((4344)) 2 The database in c:¥intersystems¥cache¥mgr¥ttt¥
y
g
has reached its
maximum size
• 重要度2(深刻なエラー)と3(致命的エラー)は以下のファイル
にもメッセージが記録
• <Install_Dir>¥mgr¥alerts.log
14
7
InterSystems Symposia 2012
cstatユーティリティ
• システムレベルの問題を調査するユーティリティ
• Cachéのハング、ネットワークトラブル、パフォーマンス
Cachéのハング、ネットワ クトラブル、パフォ マンス
問題、内部エラーなど
• 実行形式ファイルで以下の内容を出力
• Cachéが使用している共有メモリの内部構造や
内部テーブル
• 弊社サポートセンターにcstatの出力を圧縮して送付を
お願い致します
15
cstatユーティリティの実行
• cstatは問題発生時に弊社の指示により実行
• 実行コマンド
• Windowsの場合
cd/d <Install_Dir>¥Bin
コマンドオプション/d はドライブも変更する際に有用
cstat -s..¥Mgr -オプション >出力ファイル
• Linuxの場合
cd <Install_Dir>/bin
cstat –s../mgr
s /mgr -オプション
オプション >出力ファイル
または
ccontrol stat <Cachéインスタンス> -オプション >出力ファイル
• cstatオプションについては問題の種類により弊社より指示
• 出力結果をファイルに保存
16
8
InterSystems Symposia 2012
cstatユーティリティの実行例
17
CacheHungスクリプト
• Cachéがハングした場合、Caché外部から情報を取得する
OSレベルのスクリプト(^Buttonsの代替え)
• OS別に用意
• Windows : <Install_Dir>¥Bin¥cachehung.cmd
• Unix: <Install_Dir>/bin/CacheHung.sh
• Buttons と同様の情報を HTML形式のファイルへ取得
• 出力先
• <Install_Dir>¥mgr¥CaheHungYYYYMMDD_HHMM.html
例 C:¥InterSystem¥Cache¥Mgr¥CacheHung2012060_70930.html
18
9
InterSystems Symposia 2012
CacheHungスクリプトの実行例
19
CacheHungスクリプトの出力ファイル
20
10
InterSystems Symposia 2012
プロセスダンプ/プロセスコア
• 動作中のプロセスのメモリ内容が出力されたファ
イル
• プロセスダンプ(Windows)/プロセスコア(Linux)
• 以下の障害の原因解析に使用
• Caché内部でのプロセスハング
• Caché内部でのプロセスループ
21
プロセスダンプの取得方法(Windows)
• Caché2010.1.0以降
cstatユーティリティにて取得可能
cd/d <Install_Dir>¥bin
cstat –s..¥Mgr –d <pid>,<opt>
opt : 出力するダンプ形式
0 (既定値)フルダンプ , 1 パーシャルダンプ
•
実行例
C:¥Users¥miura>cd/d
C:¥Users¥miura
cd/d c:¥intersystems¥cache¥bin
c:¥InterSystems¥Cache¥bin>cstat -s..¥mgr -d 3312,1
cstat -s ..¥mgr -d 3312,1
Dump request level 1 sent to process 3312.
次のプロセスダンプが出力 C:¥intersystems¥cache¥mgr¥cachep3312.dmp
22
11
InterSystems Symposia 2012
プロセスダンプの取得方法 (Windows)
• Windows2008の場合
Windowsタスクマネージャ>プロセスタブ
>該当プロセス > 右クリック>ダンプファイルの作成
23
出力ファイル例
C:¥Users¥Administrator¥AppData¥Local¥Temp¥cache.DMP
プロセスダンプの取得方法(Windows)
• Windows2003かつCaché2010.1.0以前の場合
マイクロソフト提供のUserdump.exeを使用
http://support.microsoft.com/kb/241215/ja
userdump <pid>
• 実行例
C:¥Documents and Settings¥Administrator> userdump 3068
User Mode Process Dumper (Version 8.1.2929.5)
Copyright (c) Microsoft Corp. All rights reserved.
Dumping process 3068 (cache.exe) to
C:¥Documents and Settings¥Administrator¥cache.dmp...
The process was dumped successfully.
24
12
InterSystems Symposia 2012
プロセスコアの事前設定(Linux)
• プロセスコア生成を有効にする設定が必要
• (1)ファイル/etc/security/limits.confに以下の行を追加
*
soft core
unlimited
*
hard core
unlimited
• (2)ファイル/etc/profile の以下の行をコメント
# No core files by default
#ulimit -S -c 0 > /dev/null 2>&1 この行をコメントに
25
• (3) 上記設定後、 Cachéの再起動が必要
プロセスコアの取得方法(Linux)
• Caché2010.1.0以降の場合
cstat ユーティリティにて取得可能
ccontrol stat <Cachéインスタンス> -d <pid>,<opt>
opt : 出力するダンプ形式
0 (既定値)フルダンプ , 1 パーシャルダンプ
• 実行例
# ccontrol stat CACHE –dd 7324,1
7324 1
/usr/cachesys/bin/cstat -s /usr/cachesys/mgr -d 7324,1
Dump request level 1 sent to process 7324.
以下のプロセスダンプが出力
26
/usr/cachesys/mgr/user/core.7330
13
InterSystems Symposia 2012
プロセスコアの取得方法(Unix)
• Caché2010.1.0以前の場合
kill -11 <pid> コマンドにて取得
出力ファイルは、core.id
ただし、プロセスは消滅(強制停止)する
27
Cachéインスタンスのハングの原因となっている
プロセスのダンプ/コアの取得方法
• Caché2010.1.0以降の場合
cstatユーティリティにて取得可能
• 実行コマンド
• Windowsの場合
cd/d <Install-Dir>¥Bin
g -a0 -S9
cstat -s..¥Mgr
• Linuxの場合
ccontrol stat <Cachéインスタンス> -a0 -S9
28
14
InterSystems Symposia 2012
Cachéインスタンスのハングの原因となっている
プロセスのダンプ/コアの取得方法
• 実行例
29
監査ログ
• Cachéへのログインやプロセス終了状況の確認としても
有用
• 監査の有効およびシステムイ
監査の有効およびシステムイベントの構成
ントの構成
• 監査の有効
システム管理>セキュリティ>監査>監査を有効に
30
15
InterSystems Symposia 2012
監査ログ
• 監査イベントの有効
システム管理>セキュリティ>監査
システムイ ントを構成
>システムイベントを構成
–
–
–
–
–
%System/%Login/LoginFailure
%System/%Login/Terminate
%System/%Login/Login
%System/%Login/Logout
%System/%Security/Protect
y
y
31
監査ログ
• 監査データベースの閲覧
システム管理>セキュリティ>監査
>監査データベースの閲覧
32
16
InterSystems Symposia 2012
管理ポータルのユーティリティ
• システムダッシュボード
• プロセス
• ロック
• ライセンス使用量
33
情報収集の為の事前準備
• Windows
Sysinternalsユ ティリティの事前インスト ル
• Sysinternalsユーティリティの事前インストール
• Windows2003かつCaché2010.1.0以前の場合
Userdumpユーティリティの事前インストール
• Linux
• プロセスコア生成を有効にする設定
34
17
InterSystems Symposia 2012
障害の復旧処理
• トラブルシューティングでの復旧処理にて以下の処置を
行う場合がある
• Cachéプロセスの停止
• Cachéインスタンスの再起動
• Cachéインスタンスの強制停止
• OSの再起動
• ただし、これらの処理は、復旧後の原因調査の為、 情
報収集を行った後に実施
35
Cachéプロセスの終了
• 管理ポータル>プロセス >プロセスの詳細>終了
• 以下のユーティリティからもプロセスの終了が可能
• %SYS>do ^JOBEXAM または do ^RESJOB
• Cachéのユーティリティから終了できない場合はOSレベルのユー
ティティにてプロセスを停止する場合がある
• Windowsタスクマネージャ>プロセスの終了
36
• Linux kill -9 コマンド
18
InterSystems Symposia 2012
Cachéインスタンスの強制停止
• 以下の状態の場合、 Cachéインスタンスの強制停止にて復旧
• Cachéインスタンス全体がハング状態
• Caché起動処理/停止処理がハング状態
• 強制停止を行うコマンド
• Windowsの場合
cd/d <Install_Dir>¥Bin
css force <Cachéインスタンス>またはccontrol force <Cachéインスタンス>
• Linuxの場合
ccontrol force <Cachéインスタンス>
37
トラブルシューティングの
トラブルシュ
ティングの
実例
19
InterSystems Symposia 2012
障害別のトラブルシューティング
• プロセスの問題
• ループ/ハング
• ロックの問題
• ロック待ち/ロックテーブルフル
• データベースの問題
• ディスクフル/整合性エラー
• ジャーナルの問題
• ディスクフル
• Cachéインスタンスのハング
39
プロセスの問題
• プロセスがループしている
• プロセスがハング状態になっている
• ユーザプログラムのコーディングの問題
• Caché提供ルーチンの問題
• Caché内部またはOSの問題
40
20
InterSystems Symposia 2012
プロセスの問題(プロセスのループ)
• ループしているプロセスの特定
• Windowsタスクマネージャ/Linux topコマンドよりCPU
の使用率が高いプロセスを確認
• イメージ名/コマンドがCachéのプロセスのPID
41
プロセスの問題(プロセスのループ)
• ループ状態がどこで発生しているのか確認
• 管理ポータル>システムオペレーション>プロセス
• 該当するプロセスの行の [詳細]を選択
タスクマネージャ/Top に
て確認したPID
42
21
InterSystems Symposia 2012
プロセスの問題(プロセスのループ)
• プロセスの詳細
• 各種詳細情報が表示
ルーチンの実行行数
グローバル参照回数
ローカル変数の表示
実行中のルーチンの行
ソースコード内容
43
プロセスの問題(プロセスのループ)
• ループ状態がどこで発生しているのか確認
• 問題のプロセスが実行している以下の項目を確認
•
•
•
•
実行行数 増加しているか?
ルーチン Caché提供のものか?
実行ソースコード どのようなコマンドを実行しているか?
必要に応じてローカル変数情報
• ユ
ユーザプログラムのコーディングの問題かCaché内
ザプログラムのコ ディングの問題かCaché内
部の問題かの切り分け
44
22
InterSystems Symposia 2012
プロセスの問題(プロセスのループ)
• ユーザプログラムのコーディングの問題
• ルーチンがユーザ作成のもの
• 実行行数が増加している
• プログラムのコーディングの問題確認の為
プ グ ム
デ
グ 問題確認 為
ループしているルーチン、ローカル変数等の情報を取得
• 対処としてプロセスの終了
• Caché提供ルーチンの問題
• 実行ルーチンがCaché提供のもの
• 実行行数が増加している
• インターシステムズにて調査
• プロセス詳細情報 (ルーチン行、ローカル変数等)
• ^Buttons情報の取得
45
• 対処としてプロセスの終了
プロセスの問題(プロセスのループ)
• Caché内部またはOSの問題
• 実行行数が増加しない (Caché内部またはOS内部でループ)
• インタ
インターシステムズにて調査
システムズにて調査
• プロセス詳細情報(取得できない場合がある)
• ^Buttons情報の取得
• 必要であればプロセスダンプ/コアの取得
• 対処としてプロセスの終了
• Cachéユーティリティにより終了(できない場合がある)
• タスクマネージャ/kill コマンドによる強制停止
• Caché再起動
• OS再起動
46
23
InterSystems Symposia 2012
プロセスの問題(プロセスのハング)
• プロセスがハング(待ち状態)になっている
• 何に対する待ちであるかの確認
• 管理ポータル>システムオペレーション>プロセス
ポ
プ
>プロセスの詳細 より以下を確認
• 実行されたコマンド 実行行数が増加しない
• プロセス状態を確認
47
プロセス状態(プロセスのハング)
RUN
JOB
実行中
JOBコマンド実行中
OPEN
デバイスのオープン中
CLOSE デバイスのクローズ中
HANG
HANGコマンド実行中
USE
USEコマンド実行中
LOCK
ロックコマンド実行中
READ
デバイスから読み込み中
EXAM
ジョブ検査中
WRITE デバイスに書き込み中
GINCR
$increment実行中
SUSP
中断中
GBITSET ビット文字列設定中
GGET
グローバル読み込み中
GBITGET ビット値取得中
GSET
グローバル設定中
GORDER グローバル$Order
グロ バル$O d 実行中
GKILL
グロ バルKill中
グローバルKill中
GDEFINE グローバル$Data実行中
ZF
$ZF呼び出し実行中
GQUERY
グローバル$Query実行中
接尾子:
BROAD
メッセージ送信中
H – 停止処理中、 W – 待ち、 N – リモートネット
ワーク、 NH – ネットワークハーディニング、 S – 中断要求済み
GW – グローバルウェイト、
NR – ネット読み込み D – 消滅
48
24
InterSystems Symposia 2012
プロセスの問題(プロセスのハング)
• 主なハング時のプロセス状態
• HANGW Hangコマンドでの待ち
• OPENW Openコマンド待ち(ファイルなどの外部入出力装置のOpen待ち)
• LOCKW Lockコマンドでの待ち
• Lockの問題
• JOBW Jobコマンドでの待ち(バックグランドジョブの起動完了待ち)
• 新規プロセスが作成できない
• ライセンス数超過
• %ZSTART(プロセス起動時に実行するルーチン)での問題
• GxxxxW グローバルアクセスでの待ち 例) GSETW
• データベースの問題(データベース整合性エラー)
• ジャーナルの問題(ジャーナルディスクフル)
49
• Caché内部の問題
プロセスの問題(プロセスのハング)
• 対処方法
• 情報収集
• プロセス詳細情報(取得できない場合がある)
詳細情報(取得 きな 場合 ある)
• ^Buttons情報の取得
• 必要であればプロセスダンプ/コアの取得
• プロセスの終了
• Cachéユーティリティにより終了(できない場合がある)
• タスクマネージャ/kill コマンドによる強制停止
• Caché再起動
再起動
• OS再起動
50
25
InterSystems Symposia 2012
ロックの問題
• プロセスのロック待ち
• アプリケーションの問題
• ロックの所有者が何らかの理由で解放しない
• プロセス間でのデッドロック
• トランザクション処理の完了待ち
ロック解放はトランザクション完了まで延期
• ロックテーブルフル
• アプリケーションの問題
アプリケ ションの問題
• ロックテーブルのサイズ以上のロックが実施
51
ロックの問題(プロセスのロック待ち)
• ロックリソースおよび所有者の確認
• 管理ポータル>システムオペレーション>ロック
ロックリソース、所有者、ロックモード、ロック待ちプロセス
• 所有者のプロセスのルーチン
• 待ちのプロセスのルーチン
• アプリケーションのコーディングの確認
• 対処
• 所有者のプロセスの終了
52
26
InterSystems Symposia 2012
ロックの問題(ロックテーブルフル)
• ロックテーブルフルが発生した場合
• 新規ロックコマンドは待ち状態
• プロセス状態 LOCKW
• コンソールログに LOCK TABLE FULL のメッセージ
06/07-10:00:00 1 (1972) 2 LOCK TABLE FULL!!!
• ロックテーブルの情報より以下を確認
• 大量にロックを発行しているプロセス
• プロセス詳細情報よりルーチンの確認
• 大量にロックされているリソース
• アプリケーションのコーディングの確認
• 対処
53
• 所有者のプロセスの終了
• ロックテーブル拡張
データベースの問題
• データベース拡張によるディスクフル
• データベース整合性のエラー
デ タベ
整合性の ラ
54
27
InterSystems Symposia 2012
データベースの問題(ディスクフル)
• データベース拡張によりディスクドライブの空き容量がな
くなった場合
• データベースおよびディスク空き容量が0
デ タベ スおよびディスク空き容量が0 となる
管理ポータル>システムオペレーション>データベース>空き容量
• 新規ブロックを確保するSet, Mergeコマンドは<FILEFULL>エラー
• コンソールログに以下のエラー
05/30/12-17:39:27:649 (5712) 3 No space left on filesystem for database e:¥symposia¥
05/30/12-17:43:41:226 (7648) 2 <FILEFULL> in database e:¥symposia¥
55
データベースの問題(ディスクフル)
• 急激にデータベースが拡張したのか
• コンソールログにデータベース拡張の情報
06/02/12-22:55:57:011 (7152) 0 Starting Expansion for database e:¥symposia¥. 10 MB requested.
06/02/12-22:55:58:587 (7152) 0 Expansion completed for database e:¥symposia¥. Expanded by 10 MB.
• ジャーナルファイルの解析(ジャーナルプロファイルを利用)
• グローバルのサイズ確認
• ^%GSIZEユーティリティにてサイズが大きいグローバルの特定
使用ブロック数
(8KB/1Bl k)
(8KB/1Block)
56
28
InterSystems Symposia 2012
データベースの問題(ディスクフル)
• 対処
• 不要なグローバルを削除
• 拡張したデータベースファイルは再作成にてサイズ縮小
• ディスクフル防止の為、データベース最大サイズを設定する
構成>システム構成>ローカルデータベース>該当データベース「編集」
57
データベースの問題(整合性エラー)
• データベースファイルに整合性エラーが発生した場合
• 問題のあるグローバルへアクセスしたプロセスは
以下の状態となる
• <DATABASE>エラーが発生
• GxxxW状態でのハング
• Gxxx状態でCaché内部でループ
• Cachéインスタンス自体のハング
コンソールログに以下のエラーが記録される場合もある
グに
が記録される場合もある
01/18-18:48:17:212 (20270e9b) 0 Suspending system due to <DATABASE> error
01/18-18:48:17:218 (20277f02) 3 *** SERIOUS CACHE ERROR THAT COULD
CAUSE DATABASE DEGRADATION HAS OCCURRED.
TO PREVENT DEGRADATION THE WRITE DAEMON WILL NOT RUN ***
58
29
InterSystems Symposia 2012
データベースの問題(整合性エラー)
• 対処
• データベース整合性チェックの実施
• エラー発生グローバルの特定
管理ポータル>システムオペレーション>データベース>整合性チェック
対象のデータベースを選択
^Integrityユーティリティでも
出力結果を保存するファイル
整合性チェック可能
59
データベースの問題(整合性エラー)
• 整合性チェックの出力結果例
整合性エラーが有る場合
整合性エラーが無い場合
60
30
InterSystems Symposia 2012
データベースの問題(整合性エラー)
• データベースバックアップファイルのリストア
^DBRESTユーティリティ
およびジャ ナルファイルのリストアで復旧
• およびジャーナルファイルのリストアで復旧
^JRNRESTOユーティリティ
61
ジャーナルの問題(ディスクフル)
• ジャーナルファイルの増加によりディスクの空き容量がなくなり
ジャーナルファイルへの書き込みが不可となる
• ジャーナルファイルへのI/Oエラー時の動作設定パラメータ
“エラー発生時に凍結する”の設定値により以下の動作となる
管理ポータル>システム管理>構成>システム構成>ジャーナル設定
• いいえ(既定値)
ジャーナリングが無効になり、更新処理は続行
これ以降、更新処理がジャーナルされない
可用性は高いが、ジャーナルレコードの喪失
• はい
ジャーナルファイルへのI/O処理が回復するまでジャーナリングが
フリーズされ、更新処理もフリーズ
62
可用性は低いが、ジャーナルレコードの喪失を防止
31
InterSystems Symposia 2012
ジャーナルの問題(ディスクフル)
• 急激にジャーナルファイルが拡張したのか
コンソールログにジャーナルファイル拡張の情報
06/03/12-12:41:27:130 (3808) 0 CACHE JOURNALING SYSTEM MESSAGE
Automatic journal file roll to: c:¥intersystems¥cache¥mgr¥journal¥20120603.003
06/03/12-12:41:27:614 (3808) 0 CACHE JOURNALING SYSTEM MESSAGE
Automatic journal file roll to: c:¥intersystems¥cache¥mgr¥journal¥20120603.004
• ジャーナルファイルの解析(ジャーナルプロファイルを利用)
グローバルより原因となるアプリケーションの特定
管理ポータル>システムオペレーション>ジャーナル>プロファイル
63
ジャーナルの問題(ディスクフル)
• 対処
• ジャーナルファイルのディスクの空き容量を確保
• 古い世代のジャーナルファイルを別ディスクに移動等
• エラー発生時に凍結する”はい“の場合は、この時点で復旧
• エラー発生時に凍結する”いいえ“の場合
• ジャーナルファイルの切り替えにてジャーナルが有効
• なるべく早くデータベースバックアップの実施
• さらにシャドウイング構成の場合
シャドウサ バのデ タベ スの同期
シャドウサーバのデータベースの同期
•
プロダクションサーバよりデータベースを再複製
シャドウイングの再開始
• 予防として主ジャーナルディレクトリと二次ジャーナルディレクトリ
を設定
64
32
InterSystems Symposia 2012
Cachéインスタンスのハング
Caché インスタンスのハングでは以下のような状態に
なる
• OSレベルのプロセスは動作している
• Cachéのプロセスのみがハング
• 新規のCachéへのログインがハング
•
65
Cachéインスタンスのハング
対処
•
CacheHungスクリプトの実行
要
得
必要ならばプロセスダンプ/コアの取得
• cstat –S9 オプション
• Caché の強制停止
• css force / ccontrol force コマンド
• OSレベルでCaché のプロセスがすべて停止していることを
確認
• Windowsタスクマネージャ/ ps コマンド
• 必要に応じてOSレベルよりプロセス強制停止
またはOS再起動
•
•
66
33
InterSystems Symposia 2012
Cachéトラブルシューティングに関する
技術情報
• Caché Startup時のトラブル
Caché SYMPOSIA 2004 トラブルシュ
トラブルシューティングとFAQ
ティングとFAQ
http://www.intersystems.co.jp/events/2004/2004symposia/zip/TroubleShoot_FAQ.zip
• Caché SYMPOSIA 2009 トラブルシューティング
http://www.intersystems.co.jp/events/2009/2009symposia/pdf/b4 pdf
symposia/pdf/b4.pdf
67
ご質問?
68
34
InterSystems Symposia 2012
ありがとうございました
「InterSystems FAQ」のお知らせ
キーワードでのトピック検索が可能になり
キ
ド
トピ ク検索が 能になり
参照の多いトピックのご紹介や
関連トピックの相互参照機能などを追加いたしました。
より使いやすくなったFAQサイトを是非ご活用ください。
http://faq.intersystems.co.jp
InterSystemsでは、お客様の疑問や不明点を速やかに解消できるよう、
ウェブサイトにFAQを掲載し、定期的に内容を更新しています。
70
35