StorageTek Storage Archive Manager 5.4による自動化された - Oracle

StorageTek Storage Archive Manager 5.4 による
自動化されたデータ整合性検証
概要
データは数年にわたってアーカイブされることが多く、永久に保存されたままの場合もあり
ます。これは、第一の目的が長期保存(国立図書館など)であったり、または法律によって
義務付けられて(医療記録や財務記録など)いたりするためです。非常に長期にわたって
データを保存する場合、データが完全な状態のままで、アクセス可能であることを簡単に確
認する方法が必要になります。StorageTek Storage Archive Manager が提供するソリュー
すべてのアーカイブ・データの整
合性検証とデータ破損時の自動修
復を自動的に実行
ホスト・サーバーにデータを送
り返すことなくアーカイブの整
合性を検証
ションは、自動的にアーカイブを監査し、すべてのデータの整合性を検証し、問題がみつかっ
た場合は自己修復を実行します。
5.3 リリース以降の StorageTek Storage Archive Manager には、データ整合性の監査を実行
する機能が備わっています。5.4 リリースでは、ユーザーが監査を自動化して、どれだけ完全
にアーカイブを監査するかと、監査の頻度を選択できます。選択肢は、索引データの簡易ス
キャンからアーカイブ内の全ビットの完全スキャンまで多岐にわたります。問題が見つかると、
アーカイブは自動的に自己修復を実行し、検出された問題の詳細と、必要に応じて修正時間を
ログに記録します。SAM-QFS のデータ整合性検証はテープ・ドライブ自体の内部で実行され、
ホスト・サーバーでのデータの読取りは必要ないため、追加のサーバー帯域幅は必要ありませ
ん。
SAM-QFS はデータ監査を自動化するほかに、不変性チェックの実行機能を備えています。デー
タ整合性検証は、テープに書き込まれたデータがホスト・サーバーでアクセス可能であり、破
損していないことを確認しますが、不変性チェックは、コピー先がディスクであるかテープで
あるかに関係なく、特定のファイルのプロパティがライフ・サイクル全体を通じて変更されて
いないことを確認します。
StorageTek Storage Archive Manager 5.4 による自動化されたデータ整合性検証
利点
1. アーカイブ内の全データにアクセスできることを自動的に検証します。

ユーザーはすべてのデータの整合性を自動的に検証し、ビット崩壊やその他のス
トレージ・デバイスの劣化からデータを保護できるようになります。
2. データ破損の発生時には自動的に自己修復を実行します。

ファイルに整合性の問題が見つかり、アーカイブ内に 2 番目のコピーが存在する
場合、損傷したコピーを自動的に置き換えるように StorageTek Storage Archive
Manager を設定できます。

ホスト・サーバーにデータを送り返す必要がないため、システム・リソースを節
約できます。
整合性監査はテープ・ドライブ自体の内部で実行されるため、サーバーやディス
クのリソースはその他のアーカイブ・タスクで引き続き使用できます。

3. Oracle StorageTek T10000 エンタープライズ・ドライブと LTO テープ・ドライブ
の両方をサポートすることで、アーカイブ環境全体を保護します。

多くのアーカイブはデータを長期保存するために複数のテープ・テクノロジーを
使用しています。環境全体ですべてのアーカイブ機能を使用できることが非常に
重要です。
StorageTek Storage Archive Manager の仕組み
StorageTek Storage Archive Manager 5.3 によるデータ整合性検証
データ整合性検証(DIV)が StorageTek Storage Archive Manager の機能として導入された
のは、2012 年の中頃です。5.3 リリースで追加された tpverify コマンドは、T10000C およ
び T10000D テープ・ドライブを使用したテープ上のファイル整合性を検証するために使用で
きます。データの検証は 3 つのタイミングで実行可能であり、データの書込み時と読取り時
に加えて、任意のタイミングでデータを監査できます。データがテープに書き込まれると、
ホスト・サーバーによって DIV CRC が生成され、各レコードに追加されます。その後、ファ
イルがテープに書き込まれると、テープ・ドライブでも DIV CRC が生成されてサーバーによ
る DIV CRC と比較され、サーバーとテープ・ドライブ間でデータ破損が発生していないこと
が検証されます。重要なのは、DIV を使用するかどうかに関係なく、顧客のデータがテー
プ・ドライブに格納され次第、データは常に保護されることです。DIV を使用してデータが
書き込まれた場合、テープ・ドライブは重複する追加 CRC とエラー修正コード(ECC)を使
用して DIV CRC を保護し、この DIV CRC はデータとともにテープ上に保存されます。テー
プ・ドライブは読取りや書込みを実行するたびに ECC をチェックし、ビット崩壊やビット・
フリッピングが発生している場合はデータを修正します。このエラー修正は DIV 機能とは無
関係です。
ファイルが読み取られると、各レコードに対して再度 DIV CRC が生成され、書込み処理時に
生成された元の DIV CRC と比較されます。tpverify コマンドを使用してファイルの監査が
要求されると、テープが読み取られて新しい CRC が計算され、書込み中に生成された CRC と
比較されます。DIV CRC が一致しない場合、ファイルに整合性の問題があることを意味しま
す。これはログに記録され、ファイルのコピーにはフラグが付けられます。ファイルごとに
2 つ 以 上 の コ ピ ー が ア ー カ イ ブ 内 に 保 存 さ れ て い る 場 合 に 限 り 、 StorageTek Storage
Archive Manager の設定を通じて、このファイル・コピーを自動的に置換できます。DIV
CRC の生成と比較はテープ・ドライブ自体の内部で実行され、サーバー・リソースを使用す
る必要はありません。また、T10000 テープ・ドライブが使用される場合、読取りと書込み
の実行中に、DIV CRC の生成およびチェックによってテープ・ドライブのスループットが低
下することはありません。
Copyright © 2014, Oracle and/or its affiliates.All rights reserved.Oracle および Java は Oracle およびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。Intel および Intel
Xeon は Intel Corporation の商標または登録商標です。すべての SPARC 商標はライセンスに基づいて使用される SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMD ロゴおよび AMD Opteron ロ
ゴは、Advanced Micro Devices の商標または登録商標です。UNIX は、The Open Group の登録商標です。0514
StorageTek Storage Archive Manager 5.4 による自動化されたデータ整合性検証
これは、ハードウェアベースの CRC が使用されているためです。 StorageTek Storage
Archive Manager と T10000 テープ・ドライブの組合せは、ホスト・サーバーにデータを送
り返したり、スループットに影響を与えたりすることなく、エンド・ツー・エンドのデータ
整合性チェックを提供する初のアーカイブ・ソリューションです。
テープに書き込まれるデータが暗号化されている場合、DIV CRC の生成とチェックを実行す
るには、テープ・ドライブから暗号化キーにアクセスできる必要があります。
図 1:SAM-QFS によるデータ整合性検証
StorageTek Storage Archive Manager 5.4 による新しい自動化機能
StorageTek Storage Archive Manager 5.4 のリリースに伴い、アーカイブ内のデータ整合性
検証機能は大幅に簡素化および拡張されました。ユーザーは DIV ポリシーを作成して、アー
カイブの監査を自動的に生成できるようになります。ポリシーは次の要素に基づいて定義で
きます。



ファイルが作成された日時
ファイルが変更された日時
特定のテープ上にあるファイルが最後にテープ・ドライブにマウントされた日時
たとえば、ファイルが作成、変更、読取りされてから 6 か月後に監査を実行するとします。
DIV チェック中にエラーが見つかると、ファイルのコピーはログ・ファイル内でフラグが付
けられ、ファイルの新しいコピーを作成するためのキューに追加されます。新しいコピーを
作成するには、少なくとも 2 つのファイル・コピーがアーカイブ内に保存されている必要が
あります。このように新しいコピーを自動的に作成することで、アーカイブの自己修復機能
が提供されます。
T10000C と T10000D に加えて、このリリースでは LTO5 および LTO6 テープ・ドライブでも
DIV がサポートされています。多くのアーカイブはエンタープライズと LTO のテープ・ドラ
イブ・テクノロジーを組み合わせて使用しています。 LTO テープ・ドライブがサポートされ
たことで、ユーザーは環境全体に対して DIV 機能を適用できるようになります。 LTO テー
プ・ドライブはソフトウェアベースの CRC を使用するため(T10000 ドライブではハード
ウェア CRC を使用)、テープ・ドライブのスループットが少し低下します。スループットが
低下する割合は使用される具体的なハードウェアによって異なりますが、
一般には 15%以下です。
Copyright © 2014, Oracle and/or its affiliates.All rights reserved.Oracle および Java は Oracle およびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。Intel および Intel
Xeon は Intel Corporation の商標または登録商標です。すべての SPARC 商標はライセンスに基づいて使用される SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMD ロゴおよび AMD Opteron ロ
ゴは、Advanced Micro Devices の商標または登録商標です。UNIX は、The Open Group の登録商標です。0514
StorageTek Storage Archive Manager 5.4 による自動化されたデータ整合性検証
5 つのデータ検証オプション
検証されるデータ
基本検証 MIR リージョンの検証
テープ上の 2 つの上位データ・ト
標準検証 ラックと 2 つの下位データ・ト
ラックでエラー修正コードを検証
エラー修正コードと DIV CRC を使
レガシー
用して、テープ・カートリッジの
検証
コンテンツ全体を検証
エラー修正コードを使用して、
完全検証 テープ・カートリッジのコンテン
ツ全体を検証
エラー修正コードと DIV CRC を使
完全検証
用して、テープ・カートリッジの
プラス
コンテンツ全体を検証
DIV による
テープ・ドラ
スキャンにかかる
イブのスルー
時間
プット低下
T10000C、T10000D 1 分以下
なし
サポートされる
テープ・ドライ
ブ
T10000C、T10000D 10~20 分
最大 2.5 時間
(LTO4)、
最大 4 時間
(LTO5)、
最大 6 時間
(LTO6)
最大 6 時間
(T10000C)、
T10000C、T10000D
最大 10 時間
(T10000D)
最大 6 時間
(T10000C)、
T10000C、T10000D
最大 10 時間
(T10000D)
IBM LTO4、
IBM LTO5、
IBM LTO6、
HP LTO6
暗号化
キーの必
要性
なし
なし
なし
15%以下
あり
なし
なし
なし
あり
6 か月ごとの標準検証が推奨されており、これがデフォルト設定になっています。
テープ上の MIR リージョンの検証は非常に高速に完了しますが、テープ上のすべての
データが読取り可能であることを検証するものではありません。標準検証では、テー
プ上の 2 つの上位トラックと下位トラック、テープの先頭(BOT)、テープ上のデータ
の終わり(EOD)、さらに最初の 1,000 ブロックがチェックされます。これらの領域に
含まれるデータが有効である場合、中間トラック上のデータも有効である可能性が極
めて高くなります。多くのユースケースにおいて、標準検証オプションは、データ整
合性検証とテープ・ドライブ・リソース使用のバランスをもっともうまく取っていま
す。レガシー検証は LTO のみに対応しており、テープ上のコンテンツ全体をスキャン
します。完全検証はテープ全体でエラー修正コード(ECC)をチェックします。完全検
証プラスは ECC だけでなく DIV CRC をチェックします。DIV CRC はテープ上の各レ
コードに対して書き出され、もっとも完全なデータ整合性の検証を可能にします。
自動化 DIV の設定方法にはいくつかのオプションがあります。希望する場合は、DIV
監査を特定のテープ・ドライブで実行するように割り当てることができます。そうし
ない場合は、ステージングやアーカイブの作業が DIV 監査よりも優先されます。デ
フォルトでは、アーカイブに関連付けられたライブラリ内のすべてのメディアがス
キャンされますが、メディア内の特定部分のみをスキャンするオプションも提供され
ています。また、ユーザーは、特定のファイルでデータ整合性の問題が見つかった場
合に取るべきアクションを決定できます。ログ・ファイルへの記録にとどめるか、ま
たは新しいコピーを作成するようファイルにフラグ付けをすることができます。推奨
される設定は、問題発生時にアーカイブが"自己修復"を実行できるように、エラーが
見つかったすべてのファイルに対して新しいコピーを作成することです。これらのオ
プションはすべて、StorageTek Storage Archive Manager の構成ファイル内で設定で
きます。本番リクエストによって DIV 監査が中断された場合、DIV 監査を終了するた
め、テープは自動的に再度キューに追加されます。DIV 監査は最後に完了した位置か
ら再開されます。
Copyright © 2014, Oracle and/or its affiliates.All rights reserved.Oracle および Java は Oracle およびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。Intel および Intel
Xeon は Intel Corporation の商標または登録商標です。すべての SPARC 商標はライセンスに基づいて使用される SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMD ロゴおよび AMD Opteron ロ
ゴは、Advanced Micro Devices の商標または登録商標です。UNIX は、The Open Group の登録商標です。0514
StorageTek Storage Archive Manager 5.4 による自動化されたデータ整合性検証
不変性
データの不変性はデータ整合性検証とは異なる概念です。 不変性は、ファイルのプロパ
ティがライフ・サイクルを通じて変更されていないことを意味するデジタル保存用語です。
通常、不変性を確認するには、ファイルに対してチェックサムを生成してファイルと一緒
に保存しておき、アーカイブ内でファイルのコピーが作成されたり(ディスクまたはテー
プのいずれかに関係なく)、ファイルが読み取られたりするたびに検証を実行します。
データ整合性検証は、データがサーバーからテープに対して正確に書き込まれており、
テープ上のデータがアクセス可能であることを確認するという点において、不変性とは異
なります。StorageTek Storage Archive Manager は長年にわたり、ssum 機能を使用して
不変性を検証する機能を提供しています。
ssum 機能が有効化されている場合、アーカイブ内に取り込まれる各ファイルに対して
チェックサムが生成され、その後に作成されるそれぞれのファイル・コピーとともに保管
されます。StorageTek Storage Archive Manager に固有の 64 ビットのチェックサムが使
用されます。ファイルのコピーが読み取られるか、ディスクまたはテープ上に新しいコ
ピーが作成されるたびに、StorageTek Storage Archive Manager はチェックサムを再計
算し、最初にファイルがアーカイブに取り込まれたときに生成された元の値と比較します。
DIV とは異なり、チェックサムを検証するには、ホスト・サーバー側でファイルを読み取
る必要があります。ただし、ssum を使用すると、ファイルのコンテンツがライフ・サイ
クル全体を通じて変更されていないことを検証できます。
Copyright © 2014, Oracle and/or its affiliates.All rights reserved.Oracle および Java は Oracle およびその子会社、関連会社の登録商標です。その他の名称はそれぞれの会社の商標です。Intel および Intel
Xeon は Intel Corporation の商標または登録商標です。すべての SPARC 商標はライセンスに基づいて使用される SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMD ロゴおよび AMD Opteron ロ
ゴは、Advanced Micro Devices の商標または登録商標です。UNIX は、The Open Group の登録商標です。0514