EMC VNX Deduplication and Compression

ホワイト ペーパー
EMC VNX 重複排除および圧縮
VNX5200、VNX5400、VNX5600、VNX5800、VNX7600、VNX8000
実効容量使用率の最大化
要約
このホワイト ペーパーでは、新しい EMC® VNX®シリーズのスト
レージ プラットフォームで実現される容量最適化テクノロジー
について説明します。VNX オペレーティング環境には、ファイル
ストレージおよびブロック ストレージに対する重複排除機能と
圧縮機能が標準で搭載されています。
2014 年 7 月
Copyright © 2014 EMC Corporation.All rights reserved.(不許
複製・禁無断転載)
EMC Corporation は、この資料に記載される情報が、発行日時
点で正確であるとみなしています。この情報は予告なく変更さ
れることがあります。
この資料に記載される情報は、「現状有姿」の条件で提供され
ています。EMC Corporation は、この資料に記載される情報に
関する、どのような内容についても表明保証条項を設けず、特
に、商品性や特定の目的に対する適合性の黙示的保証はい
たしません。
この資料に記載される、いかなる EMC ソフトウェアの使用、複
製、頒布も、当該ソフトウェア ライセンスが必要です。
最新の EMC 製品名については、EMC.com で EMC Corporation
の商標を参照してください。
VMware、VMware vCenter、および VMware View は、VMware,
Inc.の登録商標または商標です。その他のすべての名称なら
びに製品についての商標は、それぞれの所有者の商標また
は登録商標です。
パーツ番号 H12209.5-J
EMC VNX 重複排除および圧縮
2
目次
エグゼクティブ サマリー ........................................................................................... 5
対象読者 ............................................................................................................................ 5
VNX によるデータ重複排除と圧縮の概要.................................................................. 5
VNX ブロック重複排除.............................................................................................. 6
VNX ブロック重複排除の概要.............................................................................................. 6
VNX ブロック重複排除プロセス............................................................................................ 8
管理 ................................................................................................................................. 11
マルチコア FAST Cache、FAST VP、マルチコア キャッシュを備えたブロック重複排除 ........... 16
相互運用性 ...................................................................................................................... 17
VNX ファイルのブロック重複排除 .................................................................................. 18
ブロック重複排除の使用例 ............................................................................................... 19
仮想デスクトップと仮想サーバー .................................................................................. 19
大規模データ環境 ........................................................................................................ 19
VNX ブロック重複排除 NaviSecCLI コマンド ........................................................................ 19
パフォーマンスと容量の節約 ............................................................................................ 19
VNX ブロック圧縮 ................................................................................................... 20
VNX ブロック圧縮の概要 ................................................................................................... 20
VNX ブロック圧縮プロセス ................................................................................................. 20
圧縮率 ......................................................................................................................... 21
解凍オペレーション ....................................................................................................... 23
管理 ................................................................................................................................. 23
使用の制限 ...................................................................................................................... 27
相互運用性 ...................................................................................................................... 28
VNX ファイルのブロック圧縮 .......................................................................................... 28
VNX ブロック圧縮コマンド .................................................................................................. 29
VNX ファイルの重複排除および圧縮....................................................................... 29
VNX ファイル重複排除の概要 ........................................................................................... 29
VNX ファイル圧縮の概要................................................................................................... 29
VNX ファイル重複排除と圧縮プロセス ............................................................................... 29
重複検出方法 .............................................................................................................. 31
圧縮方法 ...................................................................................................................... 33
CIFS 圧縮の有効性 ....................................................................................................... 33
管理 ................................................................................................................................. 34
Data Mover レベルの重複排除と圧縮の設定 ................................................................ 35
ファイル システム レベルの重複排除と圧縮の設定 ....................................................... 36
重複排除の統計の表示 ................................................................................................ 37
VNX ファイルの重複排除と圧縮コマンド ............................................................................ 37
EMC VNX 重複排除および圧縮
3
まとめ ................................................................................................................... 38
参考資料 .............................................................................................................. 38
ホーム ディレクトリ データベース ファイルについて詳しくは、付録 A:
SDelete で調整される NTFS ファイル システム ......................................................... 39
付録 B:重複排除と圧縮機能を備えた VNX へのファイル データの移行の例............. 40
顧客 A .......................................................................................................................... 41
顧客 B .......................................................................................................................... 41
EMC VNX 重複排除および圧縮
4
エグゼクティブ サマリー
より少ないリソースでより多くの成果を達成することが求められる今日の企業環境に
おいて、容量最適化テクノロジーは重要な役割を果たします。この点で、新しい
EMC® VNX®シリーズのストレージ アレイはユーザーのニーズを満たす充実した機
能を装備しています。VNX の重複排除と圧縮を利用することによって、ユーザーは
ファイル データとブロック データのストレージ使用率を大幅に高めることができます。
ブロックとファイルの両方に及ぶ、インテリジェントで自動化された重複排除機能と圧
縮機能は、VNX オペレーティング環境に装備されており追加投資は不要です。
管理面でも、シンプルで高い利便性が実現されています。容量最適化テクノロジー
の稼働後は、新しいデータが書き込まれるにしたがって、システムが容量最適化プ
ロセスをインテリジェントに管理します。Unisphere®を使用すると、単一でユーザー
フレンドリーなインターフェイスからブロック データとファイル データを管理することが
できます。
このホワイト ペーパーでは、新しい VNX シリーズ システムの容量最適化機能とその
最良の導入方法、さらにストレージ環境における他の容量最適化テクノロジーとの
適合性について説明しています。
対象読者
このホワイト ペーパーは、新しい VNX シリーズ ストレージ システムに備わっている重
複排除と圧縮の機能について理解を深めたいと考えているあらゆる読者を対象とし
ています。
VNX によるデータ重複排除と圧縮の概要
VNX システムは、多数のフラッシュ ドライブの I/O リクエストを処理するように設計さ
れています。FAST Cache や FAST_VP(Fully Automated Storage Tiering for Virtual
Pools)に代表されるパフォーマンス最適化機能は、最も使用頻度の高いデータを最
もパフォーマンスの高いドライブに移動することで、システムのコストあたりの IOPS を
高めます。
重複排除や圧縮などの容量効率性機能を使用すると、TCO(総所有コスト)の削減に
大きく役立つことができます。まず、重複排除と圧縮の両方がデータセットに必要な
スペース要件を削減するのに作用します。複合的な効率性は、重複排除や圧縮が
FAST VP やマルチコア FAST Cache と並行して使用されることで達成されます。
VNX ファイル重複排除や圧縮はファイル レベルでの節約を実現し、その一方で、
VNX ブロック重複排除や VNX ブロック圧縮は LUN レベルでの節約を実現します。こ
のホワイト ペーパーで説明する VNX 重複排除や圧縮機能のすべては、新しい VNX
シリーズ(VNX5200、VNX5400、VNX5600、VNX5800、VNX7600、VNX8000)で使用
可能です。
製品を改善するための取り組みの一環として、EMC ではソフトウェアのリビジョンを
定期的にリリースしています。可能な限り最新のリリースを使用することをお勧めし
ます。製品のリリース ノートには、製品の機能や機能拡張に関する最新情報が掲載
されています。
EMC VNX 重複排除および圧縮
5
VNX ブロック重複排除
VNX ブロック重複排除は、新しい VNX シリーズに搭載された新機能です。通常、重複
排除はブロック ストレージ オブジェクトのセット内に含まれる重複データを特定する
プロセスで、これを統合することによって、データの実際のコピー1 つだけが多くの
ソースで使用されるようになります。データの性質によっては、この機能で非常に多く
のスペースが節約できます。新しい VNX シリーズでは、VNX ブロック重複排除は 8 KB
のセット サイズによる固定ブロック重複排除方法を利用して、データセットから冗長
データを削除します。ブロック重複排除は選択されたデータセットに対してポスト プロ
セスとして実行されます。
VNX ブロック重複排除の概要
次の図に、VNX ブロック重複排除がデータセット内でスペースを節約するのに使用す
るプロセスを示します。図 1 に、重複排除が有効になった複数のブロック ストレージ
ベース LUN を示します。重複排除プロセスは、このポイント イン タイムでは実行され
ていません。
図 1:VNX ブロック重複排除の例
図 2 に、お互いが正確なコピーであると重複排除プロセスによって識別される 8 KB の
データ チャンクを示します。このデータは重複排除されます。
EMC VNX 重複排除および圧縮
6
図 2:VNX ブロック重複排除の例
図 3 に、LUN 1、2、3 のデータの重複排除プロセスを示します。各 8 KB データ チャン
クの最初のインスタンスがプールに保存される一方で、重複は削除されます。重複
排除されたデータ チャンクを含む各 LUN は、プールに残るコピーをポイントします。
図 3:VNX ブロック重複排除の例
以前ストレージの共有ブロックに重複排除されたアドレス範囲にホストが書き込む場
合、システムは新しい場所に書き込みを送信し、データのその部分は共有されま
せん。システムは次のパスで重複排除の可能性についてデータを調べます。図 4 に、
このプロセスを示します。
EMC VNX 重複排除および圧縮
7
図 4:重複排除されたスペースへの書き込みの例
上記の例では、8 KB のデータ チャンクの複数コピーが、重複として識別され、各ブ
ロックの余分なコピーが削除されます。通常のオペレーション システムで仮想マ
シンを保存するのに使用するストレージ アレイを考えてみます。このシナリオでは、
オペレーション システム データの多くが、静的であり、何回もコピーする必要がない
ので、複数のホストが個々に一意のコピーを保有します。重複排除は、オペレー
ション システムの共通部分の多くを統合し、他の目的に使用できる追加スペースを
解放します。
VNX ブロック重複排除プロセス
VNX ブロック重複排除は、プール LUN ベース単位で有効です。ブロック重複排除を使
用する LUN では、LUN の作成時に重複排除を有効にすることをお勧めします。重複
排除を有効にした LUN を作成すると、重複排除コンテナーに LUN が直接作成されま
す。既存の LUN で重複排除を有効する場合は、バックグラウンド処理を使用して、
LUN を重複排除コンテナーに移行する必要があります。データセットに対して重複排
除プロセスを実行するには、そのデータがあらかじめコンテナー内にある必要があり
ます。この移行中、LUN の重複排除状態は有効として表示され、移行プロセスは
[LUN プロパティ]ウィンドウの[重複排除]タブで確認できます。移行が完了したら、
LUN はシンになり、重複排除が有効になります。クラシック LUN での重複排除を有効
にするには、まず、プール内に重複排除が有効な LUN を作成してから、LUN 移行を
使用してデータをその LUN に移行します。
一貫性のある、予測可能なパフォーマンスが必要な場合は、シック プール LUN また
はクラシック LUN の使用をお勧めします。シン LUN のパフォーマンスを許容できない
場合は、ブロック重複排除を使用しないでください。
EMC VNX 重複排除および圧縮
8
プール LUN を重複排除コンテナーに移行するときと、LUN で重複排除を無効にして
重複排除コンテナーから移行するときは、プールには元の LUN の使用済み容量の
110%以上の空き容量が必要です。移行とそれに伴うオーバーヘッドを回避できるた
め、重複排除を有効にして LUN を作成することをお勧めします。
重複排除コンテナーは、プール内のプライベート スペースであり、その中には重複
排除が有効な LUN のすべてのデータが存在します。このコンテナーは、重複排除を
有効にした LUN をプール内で最初に作成するときか、プール内で LUN の重複排除を
有効にするときに作成されます。最後の重複排除された LUN で重複排除が無効にさ
れるか、LUN が削除されると、重複排除コンテナーは破棄されます。ストレージ プー
ルごとの重複排除コンテナーは、1 つのみです。コンテナーに使用される総スペース
は、重複排除された LUN で使用されるスペースの量に直接依存します。このスペー
スは、プール作成時には予約されておらず、重複排除された LUN が存在する時点で
使用されます。重複排除されていない LUN と重複排除された LUN は、同じプール内
で共存できます。
重複排除コンテナーが作成されると、コンテナーを所有する SP を特定する必要があ
ります。これは、プールで最初に有効になった LUN 重複排除の配置オーナーによっ
て特定されます。LUN の配置オーナーが SPA の場合、重複排除コンテナーは SPA 上
にあります。後続の LUN でブロック重複排除が有効になっている場合は、LUN の配
置オーナーは重複排除コンテナーを所有する SP 上に存在します。既存の LUN では、
配置オーナーが変更された場合でも、[デフォルトのオーナー]および[現在のオー
ナー]が保持されます。
LUN の配置オーナーは、Unisphere の[LUN プロパティ]ウィンドウの[全般]タブで確
認できます。このタブでは、プールの重複排除コンテナーを所有する SP を特定でき
ます。プールの重複排除コンテナーを所有する SP を特定するには、プールで有効に
なった重複排除の配置オーナーを確認します。
同じプール内でブロック重複排除を有効にしたすべての LUN を同じ SP が所有してい
る状態を推奨します。既存の LUN で重複排除を有効にしたら、デフォルト オーナーと
現在のオーナーが LUN の配置オーナーと一致することを確認してください。デフォル
ト オーナーが配置オーナーと一致しない場合は、Unisphere の LUN のプロパティ
ページからデフォルト オーナーを変更する必要があります。LUN の現在のオーナー
が配置オーナーと一致しない場合は、Unisphere で LUN をトレスパスする必要があり
ます(LUN を右クリックして[トレスパス]をクリック)。
重複排除を有効にした新しい LUN を作成するには、まず、プール内で重複排除を有
効にした LUN の配置オーナーを確認して、重複排除コンテナーの SP オーナーを特
定します。このプールに重複排除を有効にした新しい LUN を作成するときは、[LUN
の作成]ダイアログ ウィンドウの[詳細]タブで、プールの重複排除コンテナーを所有
する SP と一致するデフォルト オーナーが選択されていることを確認します。
EMC VNX 重複排除および圧縮
9
また、SP 間で重複排除コンテナーの負荷を分散することをお勧めします。重複排除
が 1 つのプールで有効になっており、その重複排除コンテナーを SPA が所有してい
る場合、次のコンテナーは SPB 上に作成してください。この例では、2 番目のプール
で最初に重複排除を有効にした場合、ユーザーは SPB の配置オーナーを含む LUN
で重複排除を有効にする必要があります。これにより、SP 全体で重複排除の負荷を
分散できます。プールの重複排除コンテナーの所有者は、プール内のすべての LUN
で重複排除を無効にすることなく、変更することはできません。
VNX ブロック重複排除は、重複排除コンテナー ポスト プロセスのコンテンツのバック
グラウンドで実行されます。これは、前の重複排除の実行がプール上で完了した 12
時間後です。システムの各プールには、プールに一意の、独立した重複排除コンテ
ナーとプロセスがあります。互いに比較するのは、重複排除コンテナーのコンテンツ
のみです。
12 時間タイマーが期限切れになり、重複排除プロセスを実行するように設定された
場合、現在の SP で実行中の重複排除プロセス数がチェックされます。SP ごとに最大
3 個の重複排除プロセスが一度に実行できます。空きスロットが見つからない場合、
重複排除プロセスはスロットが使用可能になるまでキュー待ちになります。プロセ
スを実行する SP は、最初に重複排除された LUN がバインドされた SP をベースにし
ています。
重複排除プロセスが実行を許可されると、重複排除された LUN のメタデータが合計
64 GB の新規および更新データ用にチェックされます。プールに 64 GB の新規または
更新データが含まれていない場合、重複排除は実行されず、12 時間タイマーがリ
セットされます。64 GB の新規データが存在する場合、新規データが最初に 8 KB の
ブロックにセグメント化されます。次に、アルゴリズムが重複排除コンテナーの新規 8
KB データ ブロックごとに実行され、データの各要素を表す一意のダイジェスト(ハッ
シュ)が作成されます。これらのダイジェストは、プール上のプライベート スペースに
保存され、後でソートされます。プライベート スペースのサイズは、重複排除コンテ
ナー内部のデータを表すのに作成されたダイジェストの数に直接依存します。重複
排除プロセスは、完了するまで実行されるか、最大継続実行時間の 4 時間に達して
ユーザーまたはシステムによって一時停止されるまで実行されます。
次に、ダイジェストは重複を特定するために比較されます。重複ダイジェストが見つ
かると、ダイジェストが表すデータ ブロックは、データが完全に同じであることを確認
するためにビットごとに比較されます。データ ブロックが同じ場合、重複データを含む
LUN 単位のインデックスが更新され、データのシングル インスタンスをポイントします。
インデックスが更新されると、未使用の重複 8 KB ブロックは削除されます。256 MB
のスライスは、そのスライスにデータがまったくない場合に使用するため、解放して
プールに戻すことができます。
重複排除プロセスが連続 4 時間プール上で実行されると、実行は一時停止され、シ
ステムはその SP 上でキュー待ちの重複排除プロセスをチェックします。重複排除プ
ロセスが実行待ちの場合、実行が許可され、一時停止したプロセスは待機します。
キュー待ちのプロセスは、先着順で実行されます。空きスロットが開くと、一時停止し
たプロセスは中断した地点から再開されます。キューにプロセスがない場合は、プロ
セスの実行が続行されます。
EMC VNX 重複排除および圧縮
10
どのポイント イン タイムでも、アレイ レベルまたはプール レベルでブロック重複排
除を一時停止できます。どちらのレベルの重複排除の一時停止も、ブロック重複排
除を無効にすることはありませんが、どの重複排除プロセスでもアレイ上で実行され
るのを一時停止または回避します。システム レベルで重複排除を一時停止した場合、
LUN の重複排除を有効化または無効化することでシステム上で行われるすべての
移行も中止されます。プール レベルで重複排除を一時停止した場合、プール内の重
複排除移行も中止されます。システム レベルで重複排除が再開されると、各プール
の重複排除プロセスはプールでの重複排除の実行が必要かどうかを確認し、重複
排除移行は続行されます。重複排除プロセスを実行する必要がある場合は、ユー
ザーが重複排除を再開してから間もなく、これらのプールでプロセスが開始されます。
プール レベルで重複排除を再開すると、プールは重複排除プロセスの実行が必要
かどうかを確認します。プールで一時停止された移行も再開されます。
管理
Unisphere ソフトウェアまたは NaviSecCLI を使用して、システム レベル、プール レベ
ル、LUN レベルの VNX ブロック重複排除を簡単に管理できます。システムを有効に
すると、重複排除コンテナー内の LUN に基づいた重複データを削除するプロセスが、
自動的に管理されます。
図 5 に、[LUN の作成]ダイアログ ボックスを示します。プール LUN を作成する場合、
ユーザーには作成時点で VNX ブロック重複排除を有効にするオプションが提供され
ます。定義上、重複排除された LUN はシン LUN なので、[シン]チェックボックスも有
効にすることに注意してください。
図 5:[LUN の作成]ダイアログ ボックス
EMC VNX 重複排除および圧縮
11
図 6 に、[LUN の作成]ダイアログ ボックスの[詳細]タブを示します。重複排除された
LUN を作成すると、プール内に存在する重複排除コンテナーのオーナーと一致する
[デフォルト オーナー]が自動的に選択されます。これは、重複排除コンテナー内の
LUN のオーナーを適切なものにするために行われます。プールに重複排除コンテ
ナーが存在する場合は、[自動]は選択できません。プールに重複排除された LUN
が存在しない場合は、[デフォルト オーナー]は[自動]になります。
図 6:[LUN の作成]の[詳細]タブ
デフォルト オーナーをピア SP に変更すると、図 7 のメッセージが表示されます。[デ
フォルト オーナー]を変更すると、ユーザーは LUN の最適なオーナー モデルを回避
するよう選択したことになります。メッセージが示すように、オーナーを変更するとパ
フォーマンスに大きく影響する場合があります。
図 7:重複排除オーナーの警告
EMC VNX 重複排除および圧縮
12
すでに作成されたプール LUN では、LUN のプロパティ ダイアログ ボックスで VNX ブ
ロック重複排除を制御できます。図 8 に、LUN のプロパティ ウィンドウの[重複排除]
タブを示します。[重複排除をオンにする]チェック ボックスをチェックして、LUN の
VNX ブロック重複排除を有効にすることができます。
図 8:LUN プロパティの[重複排除]タブ
LUN リスト ウィンドウ内で 1 つ以上の LUN を選択して右クリックし、[重複排除をオン
にする]を選択して、ブロック重複排除を有効にすることもできます。これを図 9 に示し
ます。
図 9:LUN を右クリックして重複排除を有効化する方法
重複排除が任意の LUN で有効な場合、システムは自動的に元の LUN タイプ、SP の
割り当て値、デフォルト SP、FAST VP ポリシーを保存します(LUN で重複排除が無効に
なったときにこれらのプロパティが元の値にリストアされるように設定できます)。重複
排除が LUN で無効の場合、LUN は自動的に重複排除コンテナー外に移行され、元の
プロパティがリストアされます。重複排除を有効にして作成した LUN で重複排除を無
効にすると、LUN はシン LUN になります。
図 10 に、Unisphere の[ストレージ]タブにある LUN リストを示します。カスタマイズさ
れたウィンドウで、重複排除が LUN で有効か無効かが示されます。これは、LUN
ウィンドウの上部右側にあるレンチのアイコンをクリックし、[コラムの選択]を選択し、
[重複排除]チェックボックスをチェックすると実行されます。
EMC VNX 重複排除および圧縮
13
図 10:重複排除コラムを示す LUN ページ
重複排除が LUN で有効になると直ちに、LUN の状態は[LUN プロパティ]ウィンドウの
[重複排除]タブで有効を示します。LUN の状態が有効を示す一方、LUN はプール内
の重複排除コンテナーに移行します。
ユーザーはいつでも、[ストレージ プールのプロパティ]ウィンドウ(図 11)内の[重複
排除]タブに移動して、プールの重複排除情報を見ることができます。
図 11:プールのプロパティ ウィンドウの[重複排除]タブ
EMC VNX 重複排除および圧縮
14
システムのブロック重複排除の状態も、[プールのプロパティ]ウィンドウ内の[重複
排除]タブの上部に表示されます。状態には[オン]、[オフ]、[一時停止]があります。
[重複排除]タブの[プロパティ]ボックスには、このプールの重複排除の現在の[状
態]も表示されます。[状態]は、[アイドル]、[保留]、[実行中]、[一時停止]、[障害
発生]のいずれかです。上記の例では、[状態]が[実行中]で、完了率と残りの値
(GB)が表示されます。残りのデータ量は、セグメント化とダイジェスト化が必要な
データ量です。プロセスは実行中で残り 0 GB を示し、その一方でダイジェストのソー
ト、LUN のインデックス更新、重複排除の削除を示します。
[重複排除]タブには、プールの[一時停止]ボタンと[再開]ボタンもあります(図 11)。
[一時停止]ボタンをクリックすると、重複排除パスの実行が停止されるか、プールで
実行中の重複排除プロセスが一時停止されます。[再開]をクリックすると、SP の最
大プロセス数を超えていなければ、一時停止された重複排除プロセスの実行が続行
されます。または、重複排除プロセスが実行キューに入れられます。[一時停止]ボ
タンと[再開]ボタンでは、LUN の重複排除を有効化または無効化して移行を制御す
ることもできます。[一時停止]または[再開]をクリックすると、プールの重複排除移
行が中止または再開されます。
このタブ(図 11)では、このプールの重複排除 LUN のすべてに FAST VP 階層化ポリ
シーが設定されています。重複排除コンテナーのデータは、まとめて扱われます。し
たがって、[階層化ポリシー]はプールのすべての重複排除データに適用されます。
重複排除されていない LUN 上の[階層化ポリシー]に対する同一オプションは、重複
排除コンテナーの LUN で使用できます。他のプール ベースの LUN については、デ
フォルト設定は[上位で開始して自動階層]です。
[重複排除]タブで次は、[重複排除率]です。[重複排除率]は、重複排除プロセス
が実行されるレートで、重複排除が実行される度合いではありません。この設定の
デフォルトは[中]です。[重複排除率]でも、重複排除移行の実行速度を制御できま
す。これを[中]にすると、プールの LUN で重複排除を有効化または無効化して行わ
れる重複排除移行は中程度の速度で行われます。
[重複排除された LUN の共有容量]は、[重複排除」タブでも表示されます。この値
(GB 単位)は、プール上の重複排除で現在使用される総スペース量です。この値に
は、LUN とスナップショットで使用されるスペースが含まれます。
[重複排除とスナップショットの節約]も提供されます。これは、総スペース量(GB 単
位)であり、システムは重複排除を使用することにより、このプール上で節約を実行
します。たとえば、同一の 10 GB のアプリケーション データが、同一プール上の 4 個
の LUN にコピーされます。これらの LUN が重複排除されると、このデータの 1 コピー
のみが必要とされ、重複は削除されます。この例の[重複排除とスナップショットの節
約]は、30 GB になります。10 GB は参照用に保存され、10 GB のデータから成る他
の 3 個のインスタンスは削除されます。節約は、重複排除コンテナー内で他の重複
データが特定されると、さらに増加します。
重複排除された LUN で作成された VNX スナップショットのデータは、重複排除コンテ
ナー内にも保存されます。これにより、データは重複排除されて、達成した節約分は
プールの節約にカウントされます。
EMC VNX 重複排除および圧縮
15
最後に、図 11 の[重複排除]タブには、[リフレッシュ]ボタンがあります。画面の下部
にある[リフレッシュ]ボタンは、クリックすると[重複排除]タブの情報を更新します。
図 12 に示す[重複排除サマリー]ウィンドウには、アレイの重複排除情報が表示され
ます。このウィンドウでユーザーは、現在の[システムの重複排除の状態]を見ること
ができます。状態には[オン]、[オフ]、[一時停止]があります。[システムの重複排
除の状態]の横には、[一時停止]と[再開]ボタンがあります。ユーザーはここからシ
ステム レベルで重複排除を[一時停止]または[再開]できます。
ウィンドウの[プール]部分に、重複排除が有効な LUN を保有する各プールが表示さ
れます。表示される各プールの情報には、[プール名]、[重複排除ステータス]([保
留中]、[実行中]、[一時停止])、選択された[レート]([高]、[中]、[低])、プール
用[総容量]と[空き容量]、重複排除された LUN の[共有容量]、重複排除の[節約]
情報があります。
図 12:システム レベルの重複排除サマリー
マルチコア FAST Cache、FAST VP、マルチコア キャッシュを備えたブロック重複
排除
VNX ブロック重複排除の基本的な目的は、プール内の重複排除が有効な LUN 間で共
通なデータを排除することです。スペースの節約自体は、重複排除を有効にする理由
として正しいのですが、その一方で EMC は、マルチコア FAST Cache や FAST VP とともに
重複排除を使用して、これらの機能の効率性をさらに高めることを推奨します。
EMC VNX 重複排除および圧縮
16
重複データが重複排除コンテナー内で削除されると、トラッキングやプロモートを行う
データが減少するので、FAST VP 操作はより効率的になります。また、統合されたスト
レージの設置面積により、FAST VP はプール上でスペースをより適切に利用できます。
重複排除された同じプール上にある複数の LUN を確認してみましょう。重複排除前、
これらの LUN 上のアプリケーションのアクティビティが原因となって、各 LUN のスライ
スは、プロモーションのために互いに競合するようになっていました。重複排除後、
データの完全なコピーは削除され、共通データ間の競合は取り除かれました。これで、
重複排除コンテナー内の一意のデータのみが、プロモーションのためにプール内の
データと競合するようになります。
マルチコア FAST Cache も、重複排除とともに使用するとより効率的です。基礎となる
プールにあるアクティブなデータの完全なコピーを削除することにより、マルチコア FAST
Cache も他のプロモーションのためにこのスペースを解放できます。以前はプロモー
ションを考慮しなかったデータも、重複排除がもたらす I/O の統合のおかげで、メリッ
トを得ます。それぞれが最小のアクティビティを備える、8 KB ブロックの複数コピーを確
認してみましょう。重複排除が実行され、このデータの 8 KB のインスタンス 1 個を除く
すべてを削除した後、以前の各ブロックへの I/O すべてが、単一の 8 KB ブロックに向け
られます。このブロックは、プロモーションが発生するほどに利用されるようになり、
データはフラッシュ ベースのストレージ上に存在することからメリットを得られます。
マルチコア キャッシュも、ホットな 8 KB ブロックを重複排除する場合にメリットがありま
す。これらのホット ブロックの重複排除は、他のホット ブロックが利用するマルチコア
キャッシュのメモリを解放します。重複排除により、ブロックが高度にアクセスされると、
ブロックがマルチコア キャッシュ内に留まる場合があります。
相互運用性
表 1 に、その他のアレイ機能を備えた VNX ブロック重複排除の相互運用性について概
説します。
オプション機能
動作
LUN の移行
VNX スナップショット
重複排除プール内またはプール外に対して完全にサ
ポートされています。ただし、LUN が重複排除の「有効
化を実行中」または「無効化を実行中」状態の場合は、
除外されます(LUN の移行が内部で使用され、すでに
移行中の LUN 上で開始できないからです)。同様に、
現在移行中の LUN はその重複排除の有効な状態を変
更できません。
完全にサポートされています。LUN をプール内または
プール外に対して移行中の場合は、スナップショットを
作成できません(LUN が、「有効化を実行中」または「無
効化を実行中」状態の場合です)。重複排除の有効化
または無効化の前に存在するスナップショットは、操作
が完了するときに破棄されます(プロセスの前にユー
ザー警告が表示されます)。
EMC VNX 重複排除および圧縮
17
圧縮
コントローラー ベースの
暗号化
FAST VP
SnapView スナップショット
SnapView クローン
MirrorView(Sync および
Async)
SAN Copy
予約済み LUN プール
クローン プライベート LUN
ライト インテント ログ
プライベート LUN
サポートされていません。現在の圧縮の実装に重複排
除コンテナーとの互換性がなく、各々の効率性機能が
互いの効率性を弱めてしまうからです。
完全にサポートされています。
完全にサポートされています。ただし、プール上に 1 個
の属性セットが装備され、属性セットは、そのプール内
の重複排除の有効な LUN すべてに適用されます(重複
排除されていない LUN は、LUN 単位の FAST VP ポリ
シーを保持したままです)。
完全にサポートされています。
完全にサポートされています。ただし、ベスト プラクティ
スでは、クローンがソース LUN と同じプールに存在しな
いように指示しています。重複排除の例では、クローン
が同一の重複排除プールにある場合、重複ブロックを
共有するので、別のスピンドル上でソースのクローンを
作成する目的を無効にしてしまいます。ユーザーが
ソース LUN と同じプールでクローン ターゲットを作成す
る場合、Unisphere は警告を発行します。
完全にサポートされています。
完全にサポートされています。
重複排除 LUN は予約済み LUN プールでは使用できま
せん。
重複排除 LUN はクローン プライベート LUN では使用で
きません。
重複排除 LUN はライト インテント ログでは使用できま
せん。
通常、重複排除 LUN はプライベートにはなりません。
表 1:VNX ブロック重複排除の相互運用性
VNX ファイルのブロック重複排除
ファイル LUN ではブロック重複排除がサポートされないため、ブロック重複排除を無
効にしたシック LUN を使用するファイル システムの作成を強くお勧めします。VNX OE
for Block リリース 33 では、新しい LUN のデフォルト LUN タイプはシンなので、これは、
LUN 作成時、「シン」チェックボックスのチェックを外すことによって実行されます。デ
フォルトではブロック重複排除は無効になっています。重複排除と圧縮の最適化は、
シンとファイル重複排除(圧縮を含む)の属性をファイル システム レベルで使用して
行われます。
EMC VNX 重複排除および圧縮
18
ブロック重複排除の使用例
ストレージ環境に、完全に同じデータのコピーが複数含まれる場合、重複排除が最
も効果的なのは明らかです。このことは特に、読み取り専用で変更がない大容量
ファイルを含むデータセットに当てはまります。以下は、重複排除の最も普及してい
る使用例です。
仮想デスクトップと仮想サーバー
仮想デスクトップと仮想サーバーは、ある環境に必要な物理ハードウェアを削減する
のに、一般的な選択肢です。仮想環境には通常、アプリケーションがロードされる共
通のベース イメージが含まれます。ベース イメージは通常、変更がないままの可能
性があるファイルを保有するので、そのタイプの他のベース イメージと共通になりま
す。この共通データの環境は、重複データを解放できるので、ブロック重複排除に
とって理想的です。節約率は、共通データを保有するデスクトップが多く導入される
ほど、向上します。重複排除による節約スペースの効率性は、重複データの量に直
接依存します。
大規模データ環境
重複排除は、同じ LUN のコピーが複数存在する環境でも有効です。これらの LUN が
共通データを保有する本番 LUN であるか、共通ソースのバックアップを保有する本
番 LUN であるかにかかわらず、重複排除を使用すると大規模な節約が達成できま
す。さまざまな顧客がマルチ LUN データセットのテスト環境のコピーと開発環境のコ
ピーを作成してしまい、重複排除の利用によってストレージの投資を削減したいと
望んでいます。
VNX ブロック重複排除 NaviSecCLI コマンド
他の Unisphere 機能同様、VNX ブロック重複排除の設定は、NaviSecCLI を通じて表
示、変更できます。システム レベルでの重複排除についての情報の表示、一時停止、
重複排除の再開には、deduplication コマンドを使用します。LUN で重複排除を有効
または無効にするには、lun -modify コマンドを使用します。プール レベル関連の統
計には、storagepool コマンドを使用します。これらの各コマンドやその他のコマンド
の詳細については、EMC オンライン サポートにある「VNX Command Line Interface
Reference for Block」を参照してください。
パフォーマンスと容量の節約
ブロック重複排除は大量の領域の節約を実現しますが、本番環境でこの機能を有効
にする前に、ブロック重複排除をテストすることをお勧めします。ブロック重複排除は、
通常のコード パスへの追加オーバーヘッドが必要となるデータ サービスです。ブロッ
ク重複排除が大量の重複データを含まないデータセットで有効になっている場合は、
追加されるオーバーヘッドを解消するメリットの方が、容量の節約が実現されるメリッ
トよりも上回るので、この機能をオフにすることをお勧めします。レスポンス タイムを
重視するアプリケーションでは、ブロック重複排除を無効のままにすることをお勧めし
ます。
EMC VNX 重複排除および圧縮
19
ブロック重複排除は書き込み処理が 30%未満のワークロードのデータセットに最適
です。重複排除された 8 KB ブロックへの書き込みがあるごとに、ブロックに新しい
データが割り当てられ、ポインターへの更新が発生することになります。大量の書き
込みワークロードでは、このオーバーヘッドは大きくなります。
ターゲットがブロック重複排除を有効にした LUN であるときは、シーケンシャルでブ
ロックの大きなランダム(32 KB 以上の I/O)ワークロードも回避する必要があります。
ブロック重複排除はデータ断片化の原因となり得るため、シーケンシャル ワークロー
ドに大量のオーバーヘッドが必要になり、これがストレージ プールとシステムのパ
フォーマンスに影響を及ぼすことがあります。
ブロック重複排除の LUN を使用する場合は、LUN の内容を検討するようにしてくださ
い。1 つの LUN 上にあるデータの量がブロック重複排除に適しているものの、他の部
分ではそうでない場合、可能であれば別の LUN にデータを配置することを考慮してく
ださい。オペレーティング システムとアプリケーション データを含む 1 つの LUN がこの
一例で、これは VDI 環境で見られます。この例では、オペレーティング システムの情
報を重複排除対応 LUN に配置し、アプリケーション データは重複排除非対応の LUN
に配置するのが最適です。
VNX ブロック圧縮
VNX ブロック圧縮の概要
通常、圧縮はデータセットによって使用される総スペースの削減を試行するプロセス
です。VNX ブロック圧縮は、64 KB 単位で実行され、データセットのストレージ設置面
積を削減し、ユーザーに節約を実現させます。圧縮されたデータへのアクセスは、
I/O の完了前の解凍オペレーションの発生につながるので、圧縮のアクティブなデー
タセットでの使用は推奨されません。
VNX ブロック圧縮プロセス
VNX ブロック圧縮は、システム上のすべての LUN タイプで有効にできます。圧縮が
プール ベース LUN で有効になると、初期の圧縮プロセスが実行され、LUN はシンに
なります。シン LUN のパフォーマンスを許容できない場合は、ブロック圧縮を使用し
ないでください。クラシック LUN で VNX ブロック圧縮を有効にした場合は、プール ベー
ス LUN への LUN の移行が発生します。シン LUN が使用されるのは、シン LUN テクノ
ロジーによって、圧縮プロセスが解放されたスライスをプールに戻すような場合です。
プールから LUN に割り当てられる容量は 256 MB 単位です。長期間にわたって、十
分な量の 8 KB ブロックが圧縮によって解放されると、スライスがプールに返され、
プール内のすべての LUN が使用できるようになります。
EMC VNX 重複排除および圧縮
20
VNX ブロック圧縮は、データを 64 KB 単位で処理します。圧縮オペレーションが実行
される速度は、[圧縮率]の設定([高]、[中]、[低])によって制御できます。この値
については、このセクションで後ほど説明しますが、LUN 単位ベースで設定され、
データが圧縮オペレーションによって処理されるレートを制御します。システム レベ
ルと LUN レベルで圧縮を一時停止することもできます。圧縮が一時停止されると、新
しいデータ チャンクがスペースを節約するために処理されることはありません。再
開を選択すると、圧縮プロセスを続行できます。
VNX ブロック圧縮は、64 KB のうち 8 KB 以上を節約できる場合にのみ、データを圧縮
します。圧縮による結果的な節約が 64 KB のチャンクの中で 8 KB より小さい場合、
データは未圧縮のまま LUN に書き込まれます。十分な節約効果が得られない場合、
製品の効率性の観点から、VNX は圧縮を行いません。
圧縮プロセスの実行中、64 KB のデータ チャンクが、可能であればスペースを節約
するために処理されます。データ チャンクが圧縮されると、圧縮データへの I/O は、
I/O が完了する前にデータの解凍を発生させます。ブロック データ圧縮は、相対的
に非アクティブなデータを対象としており、圧縮データの読み取りと更新は最初に
データの解凍を発生させるので、VNX システムの高可用性を必要とします。この解
凍オペレーションは、圧縮による追加オーバーヘッドです。静的なデータ リポジトリ
やアクティブ データセットのコピーをユーザーからの希望で高可用性ストレージ上に
格納する必要がある場合などに検討してください。
LUN 上の圧縮を無効にすると、LUN の圧縮データのすべてが解凍されます。これに
より、ディスク上の LUN のサイズは増加し、スペースに関する考慮が必要となります。
解凍オペレーションはこのセクションで後ほど詳しく説明します。
圧縮率
データセットをクラシック LUN またはシック LUN からシン LUN に移動すると、未使用の
容量の再取得と転用の利点が得られ、「従量課金制」の容量消費モデルが可能にな
ります。厳格な IOPS およびレスポンス タイム要件がないときには、ユーザーはこのト
レードオフを行えます。圧縮ではさらに踏み込んだ形になり、追加のシステム リソー
スおよび LUN パフォーマンスのトレードオフによって、より多くの容量を節約できます。
ユーザーはいつでも、[LUN プロパティ]ウィンドウで圧縮率を調整できます。[低]、
[中]、[高]があり、[中]がデフォルトです。圧縮が適しているのは、大部分が非アク
ティブであるもののファイブ ナインの可用性が要求されるデータです。
EMC は、レスポンス タイムが重要なアプリケーションがストレージ システムで実行さ
れている場合、システム レベルで圧縮率を[低]に変更することを推奨します。必要
であれば、アクティビティのスパイク中にシステム レベルで圧縮を[一時停止]するこ
ともできます。圧縮によって空けられているプールに容量を返す処理は、CPU の働き
に寄与することになり、ライト キャッシュのデータとしての使用率は可能な限りで少な
いスライスへ統合されます。この処理は圧縮処理の完了後も続行します。圧縮機
能を一時停止すれば、バックグラウンドで行われるどのようなオペレーション(圧縮、
関連づけられたスペースの再利用)もサーバーI/O に影響を及ぼすことはありま
せん。
EMC VNX 重複排除および圧縮
21
クラシック LUN の初期圧縮は、シン LUN ターゲットに対する標準の LUN 移行の動作
に近く、似たものになります。圧縮は最初に移行とともにインラインで実行されます。
図 13 に、新しい VNX シリーズのさまざまな圧縮率設定に対する帯域幅の差を示しま
す。低と中の差の方が、中と高の差よりもより大きくなっています。この現象はすべ
てのモデルにわたって一貫しています。
図 13:圧縮率
データの圧縮率は圧縮中に達成された圧縮にほとんど影響を及ぼしません。データ
の圧縮率が高い(8:1 圧縮率)場合の圧縮の帯域幅は、中程度の圧縮率(1.5:1)で
圧縮する場合よりも 10%低くなります。違いが大きくなるのは、圧縮率が「高」に設定さ
れた状態で、許容最大圧縮オペレーション数に近づいたときだけです。レートの設
定を「中」または「低」にした場合は、2 つの圧縮率のケースは同等の結果になります。
非圧縮シン LUN のパフォーマンスと比較した場合、サーバーI/O に及ぶ影響の程度
は中から高になります。圧縮データの読み取りと書き込みに固有であるインライン オ
ペレーションは、独立した I/O スレッドのパフォーマンスに影響を与えるので、I/O 集
中型またはレスポンス タイムが重要なアプリケーションを備えた LUN の圧縮は推奨
されません。
圧縮の強みは、より効果的に容量を利用できることです。そのため、圧縮はアクティ
ブ データベースやメッセージ システムに対して推奨されるものではなく、アーカイブ、
データベースのクローン、メッセージ システムのボリュームなどのより静的なデータ
セットに対して正常に適用されることになります。データが最大限の効率性で、かつ
高い可用性の状態で格納する必要がある場合に使用することが、最も適した用途と
なります。
EMC VNX 重複排除および圧縮
22
解凍オペレーション
解凍プロセスでは、圧縮データが元のサイズに復元されます。圧縮 LUN に対して圧
縮を無効にすると、LUN 全体がバックグラウンドで処理されます。解凍プロセスが完
了すると、以前クラシック LUN やシック LUN であった LUN は、元の LUN と同じサイズを
備えたプール内で、完全割り当てのシン LUN になります。圧縮が無効になっている
場合、シン LUN は新しいシン LUN に移行されます。
解凍中、プールが約 91%フルになると、LUN の圧縮状態がシステム一時停止になり
ます。圧縮がこの状態にあっても、LUN へのホスト I/O は中断されずに続行します。
この動作は、新規ホスト I/O でプール容量が利用できることを確実にするためのセー
フガードです。ユーザーがプールに容量を追加せずに解凍を続行することを決定し
た場合、ユーザーはこのセーフガードをオーバーライドして、解凍を再開できます。た
だし、プールが 98%フルになると、圧縮状態が再びシステム一時停止になります。こ
のセーフガードはオーバーライドすることができません。
LUN の移行機能は、解凍に対する代替手段です。このオプションが選択されるのは、
LUN タイプの変更の必要性や異なる物理スピンドルの使用が発生する場合です。た
とえば、移行先の LUN のユーザー容量が圧縮 LUN のユーザー容量と同じか、それを
超えていれば、圧縮 LUN をクラシック LUN や他のプールの LUN に移行することがで
きます。
管理
圧縮がクラシック LUN で有効になっている場合、クラシック LUN からシン LUN への
オンライン移行が実行されます。移行に必要な処理はすべて自動的に実行されます。
サーバーの I/O に対する割り込みは生じません。クラシック LUN はまだプール内に存
在しないため、ユーザーは圧縮 LUN の移行先プールを選択するように求められます。
図 14 に、[圧縮をオンにする]ダイアログ ボックスを示します。このダイアログ ボック
スを使用して、既存のプールを選択するか、[プールの作成]ダイアログ ボックスを
起動して移行先プールを新規に作成することができます。ユーザーは、このダイアロ
グ ボックスで移行率を設定することもできます。これはあくまで移行用です。プール
内の既存の LUN に対して実行されるイン プレース変換とは異なるので注意してくだ
さい。
図 14:クラシック LUN 圧縮の移行先プールの選択
EMC VNX 重複排除および圧縮
23
[プール]ドロップダウン メニューには現在利用可能なすべてのプールが一覧表示さ
れています。クラシック LUN のユーザー容量に対応可能な空き容量を持つプールの
みが表示されます。クラシック LUN のユーザー容量に等しい容量がプール内で確保
され、プロセスが正常に完了します。移行の完了後は、元のクラシック LUN が解放さ
れ、その容量は、RAID グループに新しく LUN を作成する目的で利用できるようになり
ます。
図 15 に、圧縮の有効化前のシック LUN を示します。シック LUN ではユーザー容量と
メタデータの合計の容量が消費されるため、LUN のユーザー容量が 250 GB である
にもかかわらず、プールでは 257 GB が消費されています。LUN の圧縮完了後、ユー
ザーは LUN およびプールの消費済み容量が削減されたことを確認できます。この場
合の消費済み容量の削減は、シン LUN および圧縮された LUN での節約によるもの
です。
図 15:圧縮前のシック LUN のプロパティ
VNX ブロック圧縮を有効にするには、図 16 のように、[圧縮をオンにする]チェック
ボックスを選択して[適用,]をクリックします。LUN が[圧縮]状態になると(図 16)、使
用するプール容量は 63 GB となり、193 GB 以上を節約できます。
図 16:圧縮後の LUN のプロパティ
EMC VNX 重複排除および圧縮
24
この節約は、LUN をシック LUN からシン LUN に移動し、データを圧縮することのメリッ
トを表しています。圧縮がプール内のシック LUN で有効になった後に達成されたス
ペースの節約は、LUN 上の空きスペースとデータの互換性に完全に依存しています。
図 16 の上部にある圧縮率は、(データ削減の度合いではなく)どの程度積極的に圧
縮を行うかを決める設定です。圧縮率は、初期圧縮、後続の新規データの圧縮、解
凍に適用されます。オプションには、[高]、[中]、[低]があり、デフォルトは[中]です。
レートはいつでも変更できます。[LUN のプロパティ]ウィンドウの[圧縮]タブで、圧
縮を[一時停止]または[再開]することもできます。
図 17 に、LUN が圧縮される前の[ストレージ プール プロパティ]ウィンドウを示します。
ご覧のように、プールは 9.53%フルです。
図 17:圧縮前のプール プロパティ
図 18 に、250 GB の LUN の圧縮後の[プール プロパティ]を示します。ご覧のように、
フルの割合は 9.53%から 8.058%に下がり、空きスペースは 11,575.564 GB から
11,763.932 GB に増加します。LUN の圧縮によって節約された容量は、プールに返さ
れ、プール内の LUN によって使用されます。[ユーザー容量]、[サブスクライブ容量]、
[サブスクライブの割合]といったサーバー表示メトリックに変化はありません。
EMC VNX 重複排除および圧縮
25
図 18:圧縮後のプール プロパティ
LUN の圧縮状態を確認するには、Unisphere のヘルプで各状態のリストと詳細情
報を参照してください。ヘルプにある表には、圧縮状態、その状態の説明、状態が有
効な LUN タイプが記載されています。
図 19 に示した[圧縮された LUN のサマリー]ダイアログ ボックスには、すべての LUN
のブロック圧縮アクティビティが一元的に表示されます。ダイアログ ボックス下部に
ある[機能の一時停止]ボタンと[機能の再開]ボタンを使用して、システム レベルで
圧縮を制御することもできます。
図 19:[圧縮された LUN のサマリー]ダイアログ ボックス
[機能の一時停止]オプションを使用すると、LUN レベルのすべての圧縮オペレー
ションが一時停止されます。LUN 移行に伴う圧縮オペレーションは、他の圧縮オペ
レーションと同じ方法で一時停止できます。これらのオペレーションは、[LUN のプロ
パティ]ダイアログ ボックスの[圧縮]タブでキャンセルできます。
EMC VNX 重複排除および圧縮
26
図 20 に、Unisphere ソフトウェアに表示される VNX システムの LUN テーブルを示し
ます。LUN 属性のシン列と圧縮列は、ユーザーが必要に応じて構成できます。
図 20:Unisphere の VNX LUN テーブル
使用の制限
表 2 に、VNX ブロック データ圧縮機能の制限について詳細を示します。
VNX モデル
5200
5400
5600
5800
7600
8000
圧縮 LUN の合計数
SP あたりのコンカレント圧縮
アレイあたりのコンカレント移行
1,000
20
16
1,000
20
16
1,000
20
16
2,000
20
16
3000
32
24
4000
40
24
表 2:VNX ブロック データ圧縮機能の制限
注:
•
コンカレント圧縮オペレーションには、シン LUN 上でのデータの初期圧縮、新
しいデータの圧縮、解凍が含まれます。
•
クラシック LUN では、圧縮対象の LUN をシン LUN に移行する必要があり、コン
カレント移行には、クラシック LUN のあらゆる初期圧縮が含まれます(ここで
は、解凍も含まれます)。
•
圧縮と移行に対する制限には相互の関連性はありません。
EMC VNX 重複排除および圧縮
27
相互運用性
表 3 に、その他のアレイ機能を備えた VNX ブロック圧縮の相互運用性について概説
します。
オプション機能
LUN の移行
VNX スナップショット
重複排除された LUN
コントローラー ベースの
暗号化
FAST VP
SnapView スナップショット
SnapView クローン
MirrorView(Sync および
Async)
SAN Copy
予約済み LUN プール
クローン プライベート LUN
ライト インテント ログ
プライベート LUN
動作
VNX ブロック圧縮は、LUN の移行中に、LUN 上で有効
にすることはできません。
VNX ブロック圧縮で圧縮できません。
VNX ブロック圧縮でサポートされていません。
完全にサポートされています。
完全にサポートされています。
VNX ブロック圧縮でサポートされていません。
VNX ブロック圧縮が有効な LUN は、クローン ソースに
なることができません。
VNX ブロック圧縮が有効な LUN は、プレ 29 FLARE コー
ド アレイにレプリケートすることができません。
VNX ブロック圧縮が有効な LUN は、San Copy セッション
のターゲットになることはできません。すべてのデータ
は新規として扱われるので、解凍と再圧縮オペレー
ションが更新のために発生します。
VNX ブロック圧縮が有効な LUN は、予約済み LUN プー
ル内で使用できません。
VNX ブロック圧縮が有効な LUN は、クローン プライベー
ト LUN として使用できません。
VNX ブロック圧縮が有効な LUN は、ライト インテント ロ
グとして使用できません。
VNX ブロック圧縮でサポートされていません。
表 3:VNX ブロック圧縮の相互運用性
VNX ファイルのブロック圧縮
ファイル システムの作成には非圧縮のシック LUN を使用することを強くお勧めします。
VNX OE for Block リリース 33 では、新しい LUN のデフォルト LUN タイプはシンなので、
これは、LUN 作成時、「シン」チェックボックスのチェックを外すことによって実行され
ます。デフォルトではブロック圧縮は無効になっています。圧縮の最適化は、シンと
ファイル重複排除(圧縮を含む)の属性をファイル システム レベルで使用して行われ
ます。
EMC VNX 重複排除および圧縮
28
VNX ブロック圧縮コマンド
他の Unisphere 機能同様、VNX ブロック圧縮の設定は、NaviSecCLI を通じて表示、
変更できます。圧縮に使用されるコマンドは、圧縮に適した名称です。このコマンド
やその他のコマンドの詳細については、EMC オンライン サポートにある「 VNX
Command Line Interface Reference for Block」を参照してください。
VNX ファイルの重複排除および圧縮
VNX ファイル重複排除の概要
VNX ファイル重複排除が有効にされているファイル システムでは、共通ファイル シス
テム内にある重複ファイルの削除が実行されます。この重複排除技術は、SIS
(Single-Instance Storage)と呼ばれます。SIS は、EMC 独自の重複排除技術ではなく、
データ重複排除の多くの方法のうちの 1 つです。重複ファイルを削除することによっ
て、ストレージに必要なスペースの容量が減少します。ファイル重複排除を使用する
間に達成された節約は、ファイル システムに保存されたファイルの類似性に完全に
依存するので、その容量はさまざまです。
VNX ファイル圧縮の概要
VNX ファイル圧縮が有効にされているファイル システムでは、ディスク上における
ファイルの消費済みサイズが削減されます。ファイル サイズの削減は、ファイル シス
テム上のファイルのコンテンツの確認によって実行され、共通領域が削除されます。
圧縮プロセスによる節約量は、各ファイルのコンテンツに完全に依存します。繰り返
しの文字列を多く含むファイルでは、最高レベルの節約が実現されます。重複排除
と異なり、圧縮ではユニークなファイルや重複ファイル内のスペースの節約が実現で
きます。
VNX ファイル重複排除と圧縮プロセス
VNX ファイル重複排除と圧縮が有効にされているファイル システムでは、ポリシーの
条件に合致するファイルを調べるため、ファイル システムが定期的にスキャンされま
す(以下で説明します)。ポリシーの条件に合致するファイルが特定されると、ファイ
ルは、重複排除が有効な場合、sha1 またはバイト方法を使用して、重複排除されま
す。重複排除が実行された後、または重複排除が無効なケースでスキップされた後、
高速またはディープ方法を使用して圧縮が実行され、ファイルによって使用されたス
ペース全体の削減が試行されます。ユーザーは重複排除と圧縮に関して、複数の
方法から選択ができます。これらはどちらもこのセクション内で後ほど説明します。
表 4 に、ファイル システムと Data Mover に共通する VNX ファイル重複排除および圧
縮設定を示します。次の各設定により、重複排除が正しく実行されます。これらの設
定は、[ファイル システムのプロパティ]ウィンドウおよび[Data Mover の重複]ウィン
ドウに表示されます。
EMC VNX 重複排除および圧縮
29
設定
定義
デフォルト値
アクセス時間
ファイルがアクセスされなかった期間(日数)
15 日
大文字と小文字を 実行する文字列比較において、大文字と小文
区別
字を区別するか(NFS 環境)、区別しないか
(CIFS 環境)を定義します。
Off
変更時間
ファイルが変更されなかった期間(日数)
15 日
最小サイズ
このサイズより小さいファイルは重複排除され
ません
24 KB
最大サイズ
このサイズより大きいファイルは重複排除され
ません
8 TB
ファイル拡張子除
外リスト
指定された拡張子のファイルは重複排除されま
せん
インセンティ
ブなし
最小スキャン間隔
重複排除が有効なファイル システムを重複排
除ポリシー エンジンがスキャンする頻度
7 日間
SavVol の High
Watermark
ファイル システムの SavVol の容量使用率がこ
のレベルに達すると、容量削減処理が行われ
なくなります
90%
パス名除外一覧
指定したパス名のディレクトリは、重複排除され
ません(ファイル システム レベルの設定)
インセンティ
ブなし
表 4:VNX ファイル重複排除および圧縮のファイル システム/Data Mover の設定
重複排除と圧縮のスキャンが始まる前に、最後に重複排除のスキャンが行われた
日が[最小スキャン間隔]で確認されます。デフォルトでは、前回のスキャンが最近 7
日間以内に実行された場合、重複排除スキャンは開始されません。7 日間が過ぎた
ら、SavVol の使用状況をチェックして、それが[SavVol の High Water Mark]未満であ
ることを確認します。SavVol の使用状況が重複排除の実行前や実行中に[SavVol
の High Water Mark]を超えたら、重複排除はそれぞれに対して実行されないか、一
時停止されます。SavVol のサイズも確認されます。チェックポイントが作成された
ファイル システムで、重複排除による大きな変更が発生している可能性があるから
です。
次に、ファイル システムは除外したパスにないファイルの確認を開始します。ユー
ザーはスキャン中に除外したいパス名を指定できます。次に、見つかったファイルの
拡張子が、除外リストにあるかどうかが確認されます。ユーザーは、重複排除から
の除外を希望する、異なるファイル拡張子(.txt、.zip など)を指定して、ファイル拡張
子除外リストを更新できます。
EMC VNX 重複排除および圧縮
30
ファイルが除外パスになく、除外されたファイル拡張子ではない場合、そのファイル
がアクセス、修正された最後のタイミングを確認します。これらのタイミングは現在の
設定と比較されます。ファイルの最終アクセスおよび修正日が現在の設定値よりも
古い場合、次のポリシーがコンプライアンスに適しているかが確認されます。ファイ
ルが最近 30 日以内にアクセス、修正されていたなら、スキップしたいとユーザーが
希望する場合、これは設定可能であり、これらのファイルはスキップされます。
ファイルのサイズも、ポリシー基準が適合しているかどうかについて確認されます。
ファイルが[最小サイズ]設定よりも大きく、[最大サイズ]設定よりも小さい場合、ポ
リシー チェックはその他の設定に移動します。デフォルトでは、最小ファイル サイズ
は 24 KB、最大ファイル サイズは 8 TB に設定されています。ファイルが小さすぎるま
たは大きすぎる場合、重複排除は実行されません。
表 5 に、重複排除と圧縮に関連するその他の設定を示します。これらの値はどちら
もユーザーがカスタマイズできます。
設定
定義
デフォルト値
CPU %の High Watermark CPU がこのレベルに達する 75%
と、重複排除がスロットル
ダウンされます(Data
Mover レベル設定)。
CPU %の Low Watermark
スロットル ダウンされた重 40%
複排除は、CPU がこのレベ
ルに戻ると再びスロットル
アップされます(Data
Mover レベル設定)。
表 5:その他の重複排除と圧縮の設定
最後の設定は、表 6 に示す[バックアップ データの High Watermark]です。ユーザー
は環境に応じて値を変更してカスタマイズできます。
設定
定義
デフォルト値
バックアップ データの High NDMP で容量削減型のバッ 90%
Watermark
クアップが行われるための
条件として、容量削減後の
ファイルが満たすべき論理
サイズの割合(%)。
表 6:NDMP バックアップ関連の設定
重複検出方法
VNX ファイルで重複排除が有効な場合、どの[重複検出方法]を利用するか選択で
きます。図 21 に、選択可能な[重複検出方法]を示します。[sha1]、[バイト]、[オフ]
が選択できます。
EMC VNX 重複排除および圧縮
31
図 21:VNX ファイル重複排除検出方法
重複検出方法の選択
前に説明したように、ファイル レベルの重複排除では、シングル インスタンスのスト
レージを使用して重複ファイルのコンテンツが削除されます。これは、重複ファイル
のコンテンツが特定、シングル インスタンス化されて、スペースが削減されることを
意味します。ファイルのコンテンツがシングル インスタンス化されるだけで、既存ファ
イル名、セキュリティ属性、タイムスタンプ、ファイルのメタデータは保持されます。
シングル インスタンス化された各ファイルは、これらのファイル用のデータの単一コ
ピーの場所をポイントします。
デフォルトの重複排除設定である sha1 アルゴリズムは、264 ビット未満の長さのデー
タ ストリームを受け入れ、160 ビットのハッシュを生成します。これは、ファイル内に
含まれるデータの一意な表現になるように設計されています。重複排除が可能な
ファイルを検索する場合、SHA-1 ハッシュは比較され、合致するファイルが特定され
ます。合致が見つかると、データは重複排除されます。異なるコンテンツを保有する
2 個のファイルに同じ SHA-1 ハッシュが付与される可能性は、非常に低く、260 分の 1
未満の確率です。
[バイト]を選択すると、システムは強制的にバイト単位の比較方法を利用して、重
複排除前にファイル コンテンツが正確かを確認します。バイト単位の比較が発生す
るのは、SHA-1 が潜在的な合致を特定するのに使用された後のみで、これはバイト
の使用によって生じるオーバーヘッド容量を削減するのに役立ちます。バイトを使用
すると、特に大容量ファイルに対して、大量のオーバーヘッド容量が予測されます。
バイト単位の比較方法の使用は、重複排除されるファイルが完全に同じであると保
証する必要がある場合に適しています。
[オフ]を選択すると、重複排除はファイル システムに対して無効になります。ファイ
ル システムに対してグローバルな重複排除設定が有効で、[重複検出方法]がオフ
の場合、圧縮はファイル システムで利用される唯一の容量最適化方法になります。
重複検出方法の変更
[重複検出方法]の変更を選択すると、変更時点以降は新しい設定が有効になりま
す。以前異なる方法を使用して重複排除されたファイルは、すべて変更されないま
まとなります。[重複検出方法]の変更は、ファイル システム上で重複排除を有効に
した後は推奨されません。
EMC VNX 重複排除および圧縮
32
圧縮方法
VNX ファイル圧縮には、2 つの異なる方法があり、これにより圧縮を通じてスペース
の節約が実行されます。方法には[高速]と[ディープ]圧縮があります。デフォルト
の設定は[高速]で、スペースの節約と速度を最適化します。[ディープ]では、速度
よりもスペースの節約を最適化します。これらのオプションは、[ファイル システムの
プロパティ]ウィンドウの[重複排除]タブで使用できます。
圧縮方法の選択
[高速]と[ディープ]圧縮方法をどちらか選択する場合、いくつかの重要な考慮事項
があります。最初の考慮事項はパフォーマンスです。[ディープ]圧縮方法は[高速]
に比べて、各ファイルでかかる時間が長くなります。オペレーションの圧縮フェーズ
の間に、最高レベルのスペースの節約を実現するためです。解凍の速度も考慮事
項になります。圧縮されたファイルがアクセスされるとき、ファイルは I/O の完了前に、
メモリに解凍される必要があります。[ディープ]方法を使用して圧縮されたファイル
にアクセスすると、[高速]方法を使用して圧縮された場合より、長い時間がかかるこ
とがあります。時間の長さは、元に戻すデータ容量やアクセスされるデータ容量に
よって異なります。
さらにスペースについても考慮が必要です。圧縮で[ディープ]方法を使用すると、
[高速]を使用するより 30%のスペースの節約が実現します。たとえば、[高速]方法
がファイル上で実行され、スペースの節約が 50%ならば、[ディープ]方法を使用す
ると、スペースの節約は同じファイルで 65%近くになります。最高のスペースの節約
が目的の場合は、[ディープ]圧縮方法の使用が適しています。
最後の考慮事項は、互換性です。すべてのレプリケーション ソフトウェアが、[ディー
プ]圧縮設定をサポートしているわけではありません。レプリケーション ソフトウェア
に[ディープ]方法がサポートされていないのに、[ディープ]方法を使用して圧縮され
たファイル上で読み取り操作を試みると、その場合の典型的なエラーである I/O エ
ラーが発生します。レプリケーション ソフトウェアを使用する前には、[ディープ]圧縮
がサポートされているかどうかを確認する必要があります。
CIFS 圧縮の有効性
表 7 に、CIFS で圧縮を有効にするかどうかを制御するオプションを示します。デフォ
ルトでは CIFS 圧縮が有効にされています。CIFS 圧縮は、重複排除がファイル システ
ム レベルでオンまたは中断の場合にのみ発生します。重複排除がファイル システ
ム レベルで無効または無効化の処理中の場合、[CIFS 圧縮が有効化]ボックスが
チェックされていても、CIFS 圧縮は実行されません。
設定
定義
デフォルト値
CIFS 圧縮の有効性
CIFS 圧縮を有効にしま
す。
オン
表 7:圧縮関連の設定
EMC VNX 重複排除および圧縮
33
管理
VNX ファイル重複排除と圧縮は、ファイル システム ベースで有効になります。デフォ
ルトは無効で、ファイル システムが作成される時点で有効にできます。また選択に
よって後で有効にすることもできます。ファイル重複排除と圧縮を有効にする単一の
設定が存在し、重複排除と呼ばれます。ファイル重複排除と圧縮はどちらも、重複
データの削除とスペースの節約のために実行されます。
図 22 に、[重複排除の有効化]設定を示します。これはファイル システムの作成時
に有効にできます。
図 22:ファイル システム作成時の重複排除の設定
ユーザーが既存のファイル システムで重複排除の設定を有効にしたい場合、最初
に、Unisphere を使用して該当する[ファイル システムのプロパティ]ウィンドウを開く
必要があります。図 23 に、既存のファイル システムにある[ファイル システム]タブ
の[重複排除]設定を示します。
図 23:[ファイル システムのプロパティ]ウィンドウの[重複排除の設定]
EMC VNX 重複排除および圧縮
34
Data Mover レベルの重複排除と圧縮の設定
Unisphere の[ストレージ]タブで、Unisphere の右側にあるタスク パネルで[ファイル
ストレージ]の下にある[重複排除の設定]オプションを見つけます。図 24 に、このオ
プションの場所を示します。
図 24:重複排除の設定の場所
図 25 は、Data Mover 用の[重複排除の設定]ウィンドウの例です。
図 25:Data Mover の[重複排除の設定]ウィンドウ
EMC VNX 重複排除および圧縮
35
ファイル システム レベルの重複排除と圧縮の設定
Unisphere の[ストレージ]タブの下にある[ファイル システム]ウィンドウで、重複排
除と圧縮の設定を表示/カスタマイズしたいファイル システムを右クリックし、プロパ
ティをクリックします。重複排除と圧縮の設定が、[ファイル システムのプロパティ]
ウィンドウの[重複排除の設定]タブに見つかります。図 26 は、[ファイル システムの
プロパティ]ウィンドウの[重複排除の設定]タブの例です。
図 26:ファイル システムの重複排除の設定ウィンドウ
EMC VNX 重複排除および圧縮
36
重複排除の統計の表示
ファイル システムのプロパティ ページを介してファイル システム データ上の重複排
除プロセスの結果が表示されます。重複排除の節約は、重複排除と圧縮がファイル
システムで有効な場合、これらのために節約されたスペースの総容量です。ファイル
の重複排除が無効な場合、節約は圧縮だけのためにレポートされます。次の統計
がレポートされます。
•
タイムスタンプ:前回ファイル システムに対してスキャンが正常に実行された
タイムスタンプ。
•
スキャン済みファイル数:重複排除ポリシー エンジンが前回ファイル システ
ムをスキャンした際に検査されたファイルの総数。
•
重複ファイル数:容量を節約するために重複排除ポリシー エンジンによって
処理されたファイルの数。スキャン済みファイルに対する重複排除済みファイ
ルの割合(%)も表示されます。
•
元のデータのサイズ:重複排除を行わない状態でデータをファイル システム
に格納した場合に必要となる領域。この数値がファイル システムの容量を超
える場合もあります。これをファイル システムが「過剰にプロビジョニングされ
ている」といいます。これは、ファイル システムの容量(この値も表示される)
に対する元のデータのサイズの比率で表示されます。
•
節約された容量:重複排除によって節約された容量と割合(%)。重複排除後
のデータを格納するために必要な実際の領域を元のデータのサイズから差
し引いて計算されます。
統計情報は、初回スキャン後、前回正常完了したスキャンに基づく静的な値として報告
されます。図 27 は、ファイル システムの[重複排除のステータス]と[統計]の例です。
図 27:重複排除の節約の例
VNX ファイルの重複排除と圧縮コマンド
他の Unisphere 機能同様、VNX ファイル重複排除の設定は、VNX ファイル コマンド ラ
イン インターフェイスを通じて表示、変更できます。設定の多くを表示、編集するのに
使用されるコマンドは fs_dedupe コマンドです。このコマンドやその他のコマンドの
詳細については、EMC オンライン サポートにある「 VNX Command Line Interface
Reference for File」を参照してください。
EMC VNX 重複排除および圧縮
37
まとめ
VNX ストレージ システムは、実効容量使用率を高めることのできる強力な容量効率
性機能を備えています。これらの容量最適化機能は、VNX オペレーティング環境に
標準で備わっており、追加コストは発生しません。ファイル ストレージ向けとブロック
ストレージ向けの重複排除および圧縮機能によって、プライマリ ストレージ システム
内のあらゆる種類のデータの容量効率性を高める余地が生まれます。
新しい VNX ブロック重複排除は、スペースの節約を実現できるもう 1 つの方法です。
プール内の重複排除された LUN に含まれるデータは、8 KB ブロック レベルで比較さ
れ、重複はスペースの節約のために削除されます。VNX ブロック圧縮と異なり、重複
排除は大容量の重複が存在するアクティブなデータセットでの使用が推奨されます。
ブロック重複排除は、仮想デスクトップや大きなクローン環境での使用が強く推奨さ
れます。EMC は、マルチコア FAST Cache や FAST VP と連携した重複排除の使用を推
奨します。連携して使用することでこれらの機能のより高い効率性が実現します。
VNX ブロック圧縮は、サブ LUN レベル、64 KB 単位で実行されます。64 KB チャンクで
8 KB 以上が節約可能な場合、データは圧縮されます。EMC は、アーカイブのような
静的なデータセットでの VNX ブロック圧縮の使用を推奨します。データが最大限の効
率性で、かつ高い可用性の状態で格納する必要がある場合や、パフォーマンス
オーバーヘッドが許容できる場合に使用することが、最も適した用途となります。
VNX ファイル重複排除と圧縮は、VNX ファイル データでスペースの節約をするのに連
携します。ユーザーは重複排除が有効になっているかどうかにかかわらず、圧縮を実
行できますが、これらを連携して実行すると、最大限のスペースの節約が実現できま
す。重複排除では、最初にファイル システム上の重複ファイルをシングル インスタン
ス化して、次に圧縮により、残りのファイルのサイズを削減しようと試みます。VNX ファ
イル重複排除と圧縮を使用する間に達成された節約は、ファイル システムに保存され
たファイルの類似性に完全に依存するので、その容量はさまざまです。
参考資料
以下に挙げるホワイト ペーパーは、EMC オンライン サポートで閲覧可能です。
•
EMC VNX 仮想プロビジョニング:高度なテクノロジー
•
EMC VNX Multicore FAST Cache
•
EMC VNX FAST VP – A Detailed Review
•
EMC VNX Unified Best Practices for Performance – Applied Best Practices
Guide
EMC VNX 重複排除および圧縮
38
ホーム ディレクトリ データベース ファイルについて詳しくは、付
録 A:SDelete で調整される NTFS ファイル システム
多くのファイル システムは、削除されたファイルによるスペースを効率的に再使用で
きていません。NTFS ファイル システムからファイルが削除された場合、削除された
ファイルのデータは新しいデータで上書きされるまでそのファイル システム内に格納
された状態のままになります。ファイルが頻繁に削除されると、ファイル システム内
の空き領域は、もはやそのファイル システムではアクセス不能な、削除されたファイ
ル データで次第に埋まっていってしまいます。削除されたファイル データによって、
EMC データ圧縮の効率性が低下します。削除されたファイル データを保持し続ける
というのは、ファイル システムの特徴の 1 つであり、LUN が直接 Windows サーバー
に存在しているか Windows サーバーが VM に存在しているかということによらず、関
連性があるものです。
データ圧縮プロセスは、削除されたファイルに関係するブロックについても、有効な
ファイルに対するデータの処理と同様の方法で処理を行います。NTFS ファイル シス
テムにおいて、未使用のブロックは消費済み容量がゼロになるように圧縮されます
が、削除されたファイルのブロックは削除されたファイル データが格納されたまま
残っているため、それが圧縮されるという結果になります。
Microsoft の SDelete ユーティリティを使用すると、-c オプションでコマンドを呼び出して
削除されたファイルのブロックをゼロで置き換えることができます。削除されたファイル
ブロックはファイル システムのデフラグや再フォーマットでも削除できません。SDelete
でゼロになったブロックは、データ圧縮処理を行うことで、容量をまったく消費しない状
態になります。これは圧縮の結果により深刻な影響を与えるものになります。
たとえば、100 GB のファイル システムに 1.5:1 の圧縮率(33%の容量節約)のファイ
ルがある場合を考えてみます。このファイル システムは 100 GB のクラシック LUN 上
に存在しています。また、ファイル システムが報告する使用領域は 60 GB であるもの
の、ファイル システムは一定期間使用され続けているため、実際にファイル システ
ム内での使用ブロックが 90 GB であるという状況を考えてみます。これは、データに
未割当ての領域が、ファイル システム内で 10 GB だけしかないことを意味します。
SDelete を使用しないと、全体で 90 GB に相当するブロックが 1.5:1 の比率で圧縮さ
れるため、圧縮された LUN の結果として、プール内でおおよそ 60 GB が消費されま
す。シン LUN メタデータでは追加で 3~4 GB の容量が消費される可能性があります。
データが未割当ての 10 GB の部分は、圧縮されると、容量をまったく消費しない状態
になります。この結果、全体で見た容量の節約は 40 GB になります。
ファイル システムに対して圧縮を行う前に SDelete が実行された場合、データ圧縮は
より効果的なものになります。60 GB のデータが存在している状態ですが、さらなる
30 GB の削除されたファイル ブロックと 10 GB の未割当ての容量が、SDelete によっ
てゼロで上書きされます。この場合、圧縮された LUN はプール内で 40 GB のみを消
費することになるので、節約される容量の総計は 60 GB になります。データ自体は
1.5:1 の比率で圧縮されますが、ゼロ化された容量は圧縮された LUN 内の領域を
まったく消費しません。この例では、SDelete の使用によって、追加で 50%も多い領
域が節約できました。
EMC VNX 重複排除および圧縮
39
SDelete は有効なファイル データによって消費されていないすべての領域に対して
書き込みを行います。ファイル システムがシン LUN 上に存在している場合、SDelete
によってシン LUN が完全に消費された状態になってしまいます。そのため、シン LUN
上で SDelete を実行することを選択した場合には、十分なプール容量があることを確
認しておく必要があります。NTFS ファイル システムをホスティングしているクラシック
LUN またはシック LUN 上では、領域を最大限節約するには圧縮を有効化する前に
SDelete を実行してください。このユーティリティのダウンロードについてなど、詳細な
情報については、次のリンク先で確認できます。
http://technet.microsoft.com/ja-jp/sysinternals/bb897443.aspx.
付録 B:重複排除と圧縮機能を備えた VNX へのファイル データ
の移行の例
ここでは、Windows Server から VNX システムへのデータの移行を検討している顧客
の例を取り上げます。データを移行する際に起こることや、移行の前に重複排除を
有効化しておくことの重要性を実際のシナリオに沿って紹介します。
注:fsUtils パッケージには、次のユーティリティが含まれています。
• fsScan:単一または複数のファイル システム内のすべてのメタデータを格納
する小さなデータベースとしてのデータ ファイルを生成します。
• exScan:既存のExchangeメールの特性(サイズ、最終アクセス時刻など)につ
いて、現在の使用状況を細かく列挙した評価情報を出力し、アーカイブ ソ
リューションの導入によって得られる容量節約効果を評価します。
• fsReports:fsScan のデータ ファイルからレポートを作成します。
• fsDiff:2 つの fsScan 出力ファイルを比較します。
以下の例では、fsscan ユーティリティを使用してメタデータを収集しました。fsscan
ユーティリティからは.dtl ファイルが生成されます。この dtl ファイルに対し、fsreports
ユーティリティでレポートを実行することで、重複排除とアーカイブの対象ファイルに
ついての情報が得られます。
EMC VNX 重複排除および圧縮
40
顧客 A
以下、VNX への移行対象となる Windows Server の概要です。
•
2 TB の MS Office データ
•
人の目に触れることの多いプロジェクト
•
パフォーマンスに既知の問題
Windows Server
の初期分析
FsUtil 出力
VNX への移行後
ファイル シス
テム
2 TB
重複排除
節約
無効
0
2,471 GB
4,056,632 ファイルを
アーカイブ可能
全ファイルのうち 73%が放置され
たまま 180 日以上経過
3,522,207 ファイルを
重複排除可能
合計サイズ 2,236 GB(40%圧縮で
総容量の 90%)893 GB の領域を
節約できる可能性あり
重複排除されたファイ
ル 3,461,285 個
節約された容量 881 GB
1,590 GB
顧客 B
顧客は、古い NAS を VNX に移行することを検討しています。
•
ホスト ベースの移行
•
人の目に触れることが多い
•
レプリケーション セットが第 1 日目から必要
重複排除は、IP レプリケーション、チェックポイント、移行の後で有効化されました。
ファイル シス
テム
従来の NAS の初期 760 GB
分析
FsUtil
760 GB
VNX への移行後
???
重複排除
節約
無効
0
770,725 ファイルをアーカ
イブ可能
全ファイルのうち 69%が放置
されたまま 180 日以上経過
844,761 ファイルを重複
排除可能
合計サイズ 718 GB(40%圧
縮で総容量の 75%)288 GB
の領域を節約できる可能性
あり
節約された容量 9 GB
重複排除されたファイル
44,862 個
EMC VNX 重複排除および圧縮
41
??何が起きているのでしょうか??



SavVol は 137 GB サイズの 82%(チェックポイントとレプリケーションの
オーバーヘッド)
重複排除に使用できたのは、137 GB のうちわずか 8%(10 GB)
10 GB の変更が FS によって満たされるとすぐ、重複排除が一週間停止
SavVol を 300 GB まで拡張した後の結果を次に示します。
従来の NAS の初
期分析
FsUtil 出力
VNX への移行後
ファイル
システム
760 GB
重複排除
節約
無効
0
760 GB
770,725 ファイルを
アーカイブ可能
全ファイルのうち 69%が放置された
まま 180 日以上経過
844,761 ファイルを重
複排除可能
合計サイズ 718 GB(40%圧縮で総
容量の 75%)288 GB の領域を節約
できる可能性あり
484 GB - 300 GB(SavVol の拡張
分)= 184 GB(削減量の合計)
276 GB
重複排除されたファイ
ル 845,293 個
まとめ:重複排除と圧縮を有効化した状態で移行を行う際、事前にチェックポイン
トをオンにすることは避ける
重複排除を有効化した状態で移行を行う際、事前にチェックポイントをオンにした場
合、スペースをクリアし、使用するブロックを解放するために、ファイルが重複排除さ
れます。結果、解放されたブロックへの書き込みが開始され、チェックポイント
SavVol が肥大化する可能性があります。この場合、SavVol は、これらの新しいブ
ロックを SavVol への保存対象としてトラッキングします。新しい変更をすべてトラッ
キングしようと SavVol は絶えず拡大することになります。
EMC VNX 重複排除および圧縮
42