富士通 株式会社

セッション ID: T5-402
Exchange Server 2010 の
高可用デザイン及び
障害時回復手順のポイント
富士通 株式会社
プラットフォーム技術本部
MS ミドルウェア技術センター
堀内 啓士
セッションの目的とゴール
Session Objectives and Takeaways
セッションの目的
Exchange Server の高可用性機能を理解して頂く
障害発生時の振舞い、復旧手順を理解して頂く
セッションのゴール
可用性の高い Exchange Server 2010 のシステム
を構築する上で必要となる機能について説明
できるようになる。
可用性要件を満たす Exchange Server 2010
システムを設計できるようになる。
障害が発生した場合のシーケンス、復旧手順を
説明できるようになる。
3
自己紹介
アライアンス チームでの SI 商談をバックアップ
マーケティング 本部
MS ソリューション
推進部
お
客
様
4
最
適
ソ
リ
ュ
ー
シ
ョ
ン
営業
部門
SE
部門
活動推進
施策実施
業種/地域
営業
プラットフォーム
技術本部
ISV センター
テクニカル支援/情報提供
技術者育成支援
戦略協議・
立案・遂行
富士通アライアンス
営業本部
アジェンダ
Exchange Server 2010 の可用性
DAG 設定ポイント
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考: バックアップ
5
アジェンダ
Exchange Server 2010 の可用性
各ロールの可用性
Database Availability Group
DAG 設定ポイント
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考: バックアップ
6
各ロールの高可用性機能/1
メールボックス
(MBX)
サーバー ロール
Database Availability Group (DAG)
MSFC をベースとした非共有の冗長化
ログ レプリケーション、最大 16 多重化
ハブトランスポート
(HUB)
サーバー ロール
複数設置することで自動的に冗長化
負荷分散
クライアント
アクセス (CAS)
サーバー ロール
NLB またはハードウェア ロード
バランサー による IP ベースの冗長化
方式を利用
7
各ロールの高可用性機能/2
エッジトランス
ポート (EDGE)
サーバー ロール
NLB
MX レコード
ユニファイド
メッセージング
サーバー ロール
複数の UM サーバーを展開し、
VoIP ゲートウェイからラウンド ロビン
8
Exchange Server 2007 の高可用性機能
DB の 2 重化
 DB 部分のみ 2 重
化
 Local
Continuous
Replication
サーバーの 2 重化
 高信頼ストレージ
利用前提
 一般的な 2 重化
構成
 Single
Copy
Cluster
9
サーバーの 2 重化
内蔵 HDD 利用前提
安価にシステム
全体を 2 重化
 Cluster
Continuous
Replication
災害対策
 構成に制限がない
 手動切り替え
 Standby
Continuous
Replication
Site A
Site B
DAG (Database Availability Group)
1. シードと呼ぶ DB フルコピー
2. トランザクション ログ ファイルの複製
3. コピー先への再生
アクティブ
1. シード処理
パッシブ
3. 再生
2. 複製
10
シャドウ リダンダンシー
メール転送経路の冗長化
送信が完了するまでキューを保持
送信先の機能対応が必要
EDGE 1
[NG]
HUB
SMTP
シャドウキュー
にコピー
EDGE 2
[OK]
送信確認後、コピーを削除
11
MBX オンライン 移動
MBX の移動中でもメールの送受信が可能
Exchange Server 2010 単独、もしくは Exchange
Server 2007SP2 混在環境で利用可能
負荷再配分、メンテナンス等で利用可能
クライアント
MBX 1
CAS
MBX 2
12
Exchange Server 2010 の可用性
DAG 設計ポイント
仕様の確認
Quorum モデル
DAG 設計のポイント
構成例
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考: バックアップ
13
DAG 構成条件
ハードウェア要件なし
MSFC を利用するため、OS は Enterprise Edition
以上
Windows Server 2008 (SP2) Enterprise Edition 以上
Windows Server 2008 R2 Enterprise Edition 以上
Exchange Server の Edition はどちらでも可
メンバー数が偶数の場合、ミラーリング監視
サーバーを設置する
DAG 名=クラスター名=コンピューター名
250 msec 以下のレイテンシ
14
DAG 仕様
特徴
最大 16 多重 (アクティブ DB × 1 + パッシブ DB × 15)
データベース単位のフェールオーバー (≠サーバー単位)
多重度/最大構成
16 MBX サーバー/DAG
16 MBX サーバー × 100 DB/Member = 1,600 DB/DAG
トランザクション ログ コピー方法
高可用データベース コピー (HA database copies)
時間差データベース コピー (Lagged database copies)
トランザクション ログ転送オプション
経路指定、圧縮、暗号
15
関連オプション
ReplicationEnabled
MBX 1
MBX 2
LOG 1
LOG 1
アクティブ
パッシブ
NetworkCompression
NetworkEncryption
ReplicationPort
TruncationLagTime
ReplayLagTime
DB 1
DB 1
アクティブ
パッシブ
Set-MailboxDatabaseCopy ~ ReplayLagTime/TruncatelagTime
Set-DatabaseAvailabilityGroup ~ NetworkCompression/NetworkEncryption/ReplicationPort
16
Quorum モデル
ノード マジョリティ
ノード 及びファイル
共有 マジョリティ
【ノードマジョリティ】
偶数台の MBX サーバーで DAG を構成
MBX サーバー以外のファイル共有を
ノードとして扱う
MBX サーバー数 ÷ 2 台までの耐性
【ノード 及びファイル
共有 マジョリティ】
DAG
17
奇数台の MBX サーバーで DAG を構成
(MBX サーバー数–1) ÷ 2 台までの耐性
ファイル共有
DAG
Quorum モデル
MBX サーバーの残存数が過半数以上の場合継続稼働
許容される障害数を超える DB コピー数が必要
メンバー数
18
Quorum モデル
許容される障害数
2
ノードおよびファイル共有マジョリティ
1
3
ノード マジョリティ
1
4
ノードおよびファイル共有マジョリティ
2
5
ノード マジョリティ
2
6
ノードおよびファイル共有マジョリティ
3
7
ノード マジョリティ
3
設計のポイント サマリー
ユーザー数等の要件から基本構成を決定
高可用性要件から集約度、冗長度を調整する
運用要件を構成に反映させる
冗長度によるサイジングの影響を把握する
19
基本構成の決定
ユーザー数、MBX クォータ、プロファイルの決定
MBX 数>アクティブ ユーザー数を意識する
MBX サーバーの CPU とメモリ、DAS を利用
する場合はストレージ搭載量を確認
MBX サーバーのスペックが決まれば、比率で
HUB サーバー、CAS サーバーのスペックが
決まる
20
高可用成要件の反映
耐 MBX サーバー故障台数の確認
→許容させる MBX サーバー障害数の 2 倍以上の
台数で構成
→ DB のコピー数は許容台数 + 1
MBX サーバー故障時のユーザーへの影響度
→集約しすぎると影響大、逆はコスト大
災害対策システムを構成する場合
→想定する災害を明確にする
→災害後の要件を明確にする
→サイト内の冗長化 + サイト間冗長化が基本
21
サーバー 1 台の故障に耐える構成
サーバー 2 台、DB 2 コピー
MBX 1
ミラーリング
監視サーバー
アクティブ データベース
パッシブ データベース
22
MBX 2
DB 1
DB 1
DB 2
DB 2
サーバー 2 台の故障に耐える構成
サーバー 4 台、DB 3 コピー
ミラーリング
監視サーバー
MBX 1
MBX 2
MBX 3
DB 1
DB 1
DB 1
DB 2
DB 2
DB 3
DB 4
アクティブ データベース
パッシブ データベース
23
MBX 4
DB 2
DB 3
DB 3
DB 4
DB 4
サーバー 3 台の故障に耐える構成
サーバー 6 台、DB 4 コピー
MBX 1
MBX 2
DB 1
DB 1
DB 2
DB 3
ミラーリング
監視サーバー
DB 4
DB 5
DB 6
アクティブ データベース
パッシブ データベース
24
DB 6
MBX 3
MBX 4
MBX 5
DB 1
DB 1
DB 2
DB 2
MBX 6
DB 2
DB 3
DB 3
DB 3
DB 4
DB 4
DB 4
DB 5
DB 5
DB 5
DB 6
DB 6
運用要件の反映
バックアップ製品の選択
→要件が先か、バックアップ製品が先か?
バックアップ製品の特長把握
→パッシブ DB からバックアップが可能な製品、
ストレージの機能を制御できる製品
バックアップ方法の選択
→ 2 次媒体への保管が必要か、D2D で良いか?
リカバリ
→リカバリできる粒度と方法を要件と合わせる
DB 単位・MBX 単位・アイテム単位
25
サイジングの注意点/1
アクティブ/パッシブ による必要 CPU リソースの
理解
パッシブ DB は アクティブ DB の 15% の CPU リソース
を要求
パッシブ DB 1 つにつき、アクティブ DB に 10% の CPU
リソースを追加
障害発生後の最大リソースを想定する
26
1 日にメールボックスあたりで
送受信されるメッセージ
アクティブ DB
もしくは
スタンドアロン (MHz)
パッシブ DB
(MHz)
50
100
150
200
~
500
1
2
3
4
~
10
0.15
0.30
0.45
0.60
~
1.50
サイジングの注意点/2
縮退運転時 (= 最大リソース) を考慮する
A
A
P
コピー
処理用
CPU
27
(10%)
待機 DB
処理用
(15%)
A
P
P
A
最小構成の DAG/1
マルチロール× 2
負荷分散機構の外出し、FSW
アクティブ データベース
負荷分散装置
パッシブ データベース
AD サイト
DAG
DC/DNS
HUB
CAS
MBX
HUB
CAS
MBX
複製
複製
28
最小構成の DAG/2
シングル ロール or コンバインド ロール + MBX
仮想化によるロールの分散、外部負荷分散装置不要
AD サイト
DC/DNS
HUB
CAS
HUB
NLB
CAS
DAG
MBX
29
MBX
中規模 DAG
多重度増により複数台故障の耐性
アクティブ データベース
パッシブ データベース
AD サイト
ミラーリング
監視サーバー
CAS アレイ
HUB
DC/DNS
DAG
MBX
30
MBX
MBX
MBX
災害対策システム
プライマリ サイト単体、サイト間での冗長化
切り替えは手動
プライマリ データセンター
ミラーリング
監視サーバー
セカンダリ データセンター
WAN
DC/DNS
DC/DNS
HUB
CAS アレイ
HUB
DAG 1
MBX
31
MBX
MBX
CAS アレイ
大規模 災害対策システム
各サイト単独、及びサイト間での冗長化
サイト間切り替えは手動操作
プライマリ データセンター
セカンダリ データセンター
DAG 1 用
ミラーリング監視サーバー
DAG 2 用
ミラーリング監視サーバー
WAN
DC/DNS
DC/DNS
HUB
CAS アレイ
Active
MBX
Active
MBX
32
DAG 1
MBX
Passive
Passive
MBX
Passive
MBX
CAS アレイ
HUB
DAG 2
Passive
MBX
Active
MBX
Active
MBX
Exchange Server 2010 の可用性
DAG 設計ポイント
DAG 設計手順
確認項目
設定方法と手順
障害発生時の動作
SP1 可用性機能
参考: バックアップ
33
DAG の設定手順
以下の項目を事前に決定しておく
項目
説明
DAG 名
DAG の名前 (仮想コンピューター名)
ミラーリング監視サーバー
監視ディレクトリ
MBX 以外の ドメイン サーバー (推奨 HUB)
共有フォルダー
(例えば c:\DAGFileShareWitnesses\ ~ )
DAG 用 IP アドレス
仮想 IP アドレス
冗長化する DB
ノード上の DB で冗長化構成とするもの
ネットワーク
レプリケーションに利用するネットワークを
決める
34
DAG の設定手順
項目
説明
1 DAG の作成
New-DatabaseAvailabilityGroup
DAG 名、FSW の登録
2 DAG 用ネットワークの指定
Set-DatabaseAvailabilityGroup
-DatabaseAvailabilityGroupIpAddresses
3 ノードの追加
Add-DatabaseAvailabilityGroupServer
4 データベース コピーの追加
Add-MailboxDatabaseCopy
35
設定画面と確認画面/DAG 作成
36
設定画面と確認画面/DAG 用 IP 指定
37
設定画面と確認画面/ノード追加
38
設定画面と確認画面/DB コピーの追加
39
設定画面と確認画面/参考
40
ネットワーク アダプターの設定/1
MAPI 用ネットワークを最優先にする
41
ネットワーク アダプターの設定/2
MAPI 用の構成
42
ネットワーク アダプターの設定/3
レプリケーション用の構成
43
Exchange Server 2010 の可用性
DAG 設計ポイント
DAG 設計手順
障害発生時の動作
障害時の動作
復旧手順
災害対策システム
SP1 可用性機能
参考: バックアップ
44
アクティブ マネージャー
DAG メンバー全ての MBX サーバーで実行される
コンポーネント
DB コピー間での移動、サーバー障害の検出
プライマリ
アクティブ マネー
ジャー (PAM)
クラスター グループを所有する ノード が
役割を持つ
アクティブ化、パッシブ化の決定
トポロジの変更通知の受信
SAM の役割
スタンバイ
アクティブ マネー
ジャー (SAM)
PAM 以外のノード
ローカル データベース、IS の障害検出
PAM への情報通知
45
コピー キューと再生キュー
46
コピー キューと再生キュー
コピー キュー
アクティブ DB コピーからパッシブ
DB コピーへのコピー待ちのキュー数
長さが 10 未満であることが優先アク
ティブ化条件
再生 キュー
パッシブ DB コピーへの再生を待つ
キュー数
長さが 50 未満であることが優先アク
ティブ化条件
47
コピー キューと再生キュー
DB コピーの状態が以下の 4 つの場合に、
アクティブ化するパッシブ DB コピーを優先順位
から選定
同優先順位が複数ある場合、アクティブ化
優先順位番号 (Activation Preference) で決定する
コンテンツ
インデックスの状態
コピー キューの
長さ
再生キューの
長さ
1
Healthy
10 未満
50 未満
2
Crawling
10 未満
50 未満
3
Healthy
無条件
50 未満
DisconnectedAndResynchronizing
4
Crawling
無条件
50 未満
SeedingSource
5
無条件
無条件
50 未満
6
Healthy
10 未満
無条件
7
Crawling
10 未満
無条件
8
Healthy
無条件
無条件
9
Crawling
無条件
無条件
DB コピーの状態
Healty
DisconnectedAndHealthy
48
優先
順位
ディスク/サーバー障害時の振舞い
1.アクティブ マネージャーによる障害の検出
2.PAM によるアクティブ化する DB の選出
3.障害の発生した DB から未コピー ログを抽出
a. 消失ログが設定値 (AutoDatabaseMountDial) 以下
であればマウントされる
b. 消失ログが設定値外の場合、自動的にマウントされない
AutoDatabaseMountDial
49
値
最良の可用性
12
良好な可用性
6
ロスレス
0
ディスク障害時フロー
データベースに
障害発生
アクティブ マネージャーが
障害を検知
アクティブ マネージャーが
アクティブ化するデータベースを選択
MBX 1
MBX 2
MBX 1
MBX 2
DB 1
DB 1
DB 1
DB 2
DB 2
DB 2
DB 3
DB 3
DB 2
消失ログ
DB 3
成功
消失ログの許容量を確認
許容範囲内
手動でマウント
成功
50
DB 3
許容範囲外
メールボックス データベースの
マウント (障害復旧)
障害が発生した
データベースの回復
DB 2
失敗
障害の発生したデータベースから
消失ログをコピー
失敗
同期・
再シード
同期または再シードにより
データベース コピーを復旧
消失ログの回復
DAG メンバー以外のリカバリ
1.
2.
3.
4.
コンピューター アカウント の リセット
OS の復旧
ドメイン への参加
Exchange ロール の リカバリ インストール
Setup /m:RecoverServer [/lp:LanguagePackBundle.exe]
5. ロール アップ の適用
51
DAG メンバーのリカバリ
1.リカバリする サーバー に関連する DAG 情報の削除
a) DAG から DB コピーを全て削除
Remove-MailboxDatabaseCopy DB 名\サーバー名
b) DAG からサーバーを削除
Remove-DatabaseAvailabilityGroupServer
–Identity DAG 名 –MailboxServer サーバー名 –ConfigurationOnly
2.前ページと同様の手順で サーバー の リカバリ
3.DAG の再設定
a) DAG へサーバーの追加
Add-DatabaseAvailabilityGroupServer
–Identity DAG 名 –MailboxServer サーバー名
b) DAG へ DB コピーの追加
Add-MailboxDatabaseCopy
–Identity DB コピー名 –MailboxServer サーバー名
52
メールボックスの復元
1.データベース を一時領域に リストア
2.eseutil
3.回復用 DB の作成
New-MailboxDatabase – Name 回復 DB 名
– Server サーバー名
– EDBFilePath DB パス
– LogFolderpath Log パス
– Recovery
4.DB の マウント
5.メールボックス の リストア
Restore-Mailbox –Identity ユーザー名
–RecoveryDatabase 回復 DB 名
53
DAC モード
Datacenter Activation Coordination Mode
もしくは
データセンターのアクティブ化調整モード
3 MBX サーバー以上かつ複数サイトで DAG
を構成する場合に設定必須
運用側サイトが復旧した場合の自動復旧を
抑止し、スプリットブレインを防ぐ
SetDatabaseAvailabilityGroup
–Identity DAG 名 –DatacenterActivationMode DagOnly
54
災害対策システム向け事前準備
内容
コマンド等
1 DAC モードの有効化
Set-DatabaseAvailabilityGroup
-DatacenterActivationMode DagOnly
2 RPC 暗号化設定の統一
Set-RpcClientAccess
3 CasArray 設定
Set-ClientAccessArray
4 AutoDiscover 設定
Set-ClientAccessServer
5 オフライン アドレス帳設定
Set-OABVirtualDirectory
6 基本認証設定
Set-WebServerVirtualDirectory
55
サイト障害発生後の処置
プライマリ サイト停止時は、セカンダリ サイト
も停止するため、手動で再開する必要があります。
内容
コマンド等
1 障害の発生したサイトの DAG メンバーに停止設定
Stop-DatabaseAvailabilityGroup
2 全 MBX サーバーのクラスター サービス停止
Stop-Service Clussvc
3 スタンバイ サイトでの DAG 再開
RestoreDatabaseAvailabilityGroup
4 DNS に登録されている HUB/CassArray の IP 変更
*** 管理ツール
56
サイト復旧後の処置
サイト間フェールバックの操作
内容
コマンド等
1 プライマリ サイトで DAG 再開
Start-DatabaseAvailabilityGroup
2 ミラーリング監視サーバー の再設定
Set-DatabaseAvailabilityGroup
3 DB コピーの再設定
Update-MailboxDatabaseCopy
4 変更した HUB/CassArray の IP 戻し
*** 管理ツール
57
サイト障害フロー
自動で行われる処理
手動で行う処理
現象
サイトに
障害発生
サイト障害を検知
障害の発生したサイトの完全停止
HUB
CAS
アレイ
MBX
MBX
サイト1
アクティブ化するサイトの
インフラストラクチャ正常性確認
HUB
CAS
アレイ
MBX
MBX
サイト2
MBX のアクティブ化
他の役割のアクティブ化
サイトの回復
HUB
サイト2
サービスのプライマリ サイトへの復元
MBX の役割のフェールバック
HUB
サイトの復元の再確立
58
CAS
アレイ
CAS
アレイ
サイト1
MBX
MBX
フェールバック
MBX
MBX
Exchange Server 2010 の可用性
DAG 設計ポイント
DAG 設計手順
障害発生時の動作
SP1 可用性機能
連続レプリケーションの強化
EMC 改良
追加されたスクリプト
参考: バックアップ
59
SP1 で追加される可用性関係機能
強化された連続レプリケーション
ファイル モード ブロック モード
Outlook のサイト超え接続ロジックの改良
新しい DAC モード
新しい、管理、監視スクリプト
データベースの冗長性チェック、サーバーメンテ
EMC インタフェースの改良
DAG-IP、監視サーバーと監視ディレクトリ
フェールオーバー性能の向上
60
連続レプリケーションの強化
複製タイミングを切り替えることでデータ ロスト
の可能性減少
自動的に複製モードを切り替える
ファイル モード (オリジナル)
ブロック モード (ブロック単位複製)
切り替えプロセス
1.初期状態はファイル モード
2.複製先からの要求でブロック モードに切り替え
3.一定期間後にファイル モードに戻る
61
動作イメージ
Log 2
Log 3
Log 3
Log 1
62
ブロック モード
Replication Log Buffer
ESE Log Buffer
ファイル モード
Log 2
Log 1
Log 4
改良された EMC
監視サーバー・監視ディレクトリの設定
DAG 用の IP アドレス指定
RTM
63
SP1
Exchange Server 2010
SP1
EMC
DAG
Failover
Exchange Server 2010 の可用性
DAG 設計ポイント
DAG 設計手順
障害発生時の動作
SP1 可用性機能
参考: バックアップ
ソフトウェア選択のポイント
Volume Shadow Copy Service
ソフトウェア プロバイダーと
ハードウェア プロバイダー
65
情報保護機能
DAG、時間差コピー
ジャーナル
パーソナルアーカイブ
削除済みアイテム (の復元)
リテンションポリシー、リーガルホールド
バックアップ
66
バックアップソフト選択のポイント
パッシブ DB からの バックアップ が必要か?
リカバリ 単位の粒度を決定する
DB 単位・MBX 単位・アイテム 単位
D2D, D2T, D2D2T の決定
67
VSS の仕組み
Volume Shadow Copy Services (VSS) により、
リクエスター、ライター、プロバイダーが連携
VSS に準拠することで互換性維持が容易
ボリューム スナップショット機能により瞬時に
バックアップが完了
Requester:
Backup
Software
Volume
Shadow copy
Services
Provider:
Storage
System
68
Writer:
Exchange
Server
プロバイダーの違い
VSS Provider の選択がシステムの可用性、信頼
性、性能を左右
Hardware
Provider
ストレージベンダーが提供
Software
Provider
ソフトウェアベンダーが提供
69
ストレージ装置の資源のみ使用し SAN も活用
データの増大にアプリ性能は影響なし
ストレージ装置の機能, 性能, 信頼性を活用
サーバーとネットワークの資源を使用
データの増大にアプリ性能が影響を受ける
ソフトウェアの組合せによる自由度が高い
プロバイダーの違い
業務サーバー
バックアップサーバー
VSS Writer
VSS Requester
SQL Server
Backup Software
Agent Side
Exchange Server
Windows Server
Volume
Shadow
Copy Service
VSS Requester
Backup Software
Server Side
Windows Server
ソフトウェア
プロバイダー
Backup
Volume
ハードウェア
プロバイダー
Data
Volume
Snapshot
Shadow
Copy
Volume
Tape Backup
70
バックアップ検証結果 1 例
ハードウェア プロバイダーとソフトウェア プロバ
イダー による DB バックアップ 比較
ハードウェア プロバイダー は、ホスト OS の負担
が少ない
【% Processor Time】
6.0
5.0
4.0
3.0
2.0
1.0
0.0
71
ソフト VSS
ハード VSS
アイドル
関連セッション
T1-303: Exchange Server 2010 と次世代 Exchange Online の共
存
T1-306: Exchange Server のクラウド対応セキュリティ対策
T5-403: Exchange Server 2007/2010 のトラブルシュート Tips
72
関連 Hands-on Lab
H-301: Exchange Server 2010 SP1 のインストール、階層型アド
レス帳 v2.0 の構成とグループ スケジュール
H-302: Exchange Server 2010 SP1 メッセージ保護とコンプライ
アンス対策
H-303: Exchange Server 2010 高可用性対策 (DAG の構成)
H-304: Exchange Server 2010 2003/2007 からの移行
73
リファレンス
TechNet ライブラリ/Exchange Server 2010
http://technet.microsoft.com/ja-jp/library/bb 124,558.aspx
Exchange Server 2010 自習書シリーズ
http://technet.microsoft.com/ja-jp/exchange/2010/dd 775,186.aspx
Exchange Server 2010 ホワイトペーパー
http://technet.microsoft.com/ja-jp/exchange/ff 798,019.aspx
Exchange Server 2010 導入システム構成例
http://www.microsoft.com/exchange/2010/ja/jp/hardware.aspx
74
ご清聴ありがとうございました。
T5-402
アンケートにご協力ください。