ストレージシステムの基礎

3.RAIDとは?
RAIDとは?
RAIDの特徴
RAID(Redundant Arrays of Independent Disks)を用いれば、ディスクに格納す
るデータに冗長性を持たせ、単一ディスクの障害によるシステムダウンや
データの損失を回避すると同時に、ディスクI/Oのスループットを改善するこ
とができます。
ディスクをどのように組み合わせて使うかの基本形については6種類のRAIDレ
ベルが考察されており、それぞれRAID 0~RAID 5で表す。このうち、よく使
われるのはRAID 0、1、5です。以下、各RAIDレベルの動作原理と得意な用途
について考察してみよう。

複数のハードディスクを組み合わせる
– アクセス速度の向上
– 耐障害性の向上

RAIDのレベル
– RAID 0 :単純な並列書き込み
– RAID 1 :ミラーリング
– RAID 2 :ECC(Parity情報)を別のディスクに書く
– RAID 3/4 :ECCを専用のディスクに書く
– RAID 5 :ブロック単位でECCを生成書き込む
RAIDとは?
RAID 0: 耐故障性の無いディスクアレイ
仕組みについて
(ストライピング)
RAID 0は複数台のハードディスクに、データを分散して読み書きし
高速化したものである。 冗長性がなく耐故障性もないため、RAIDに
は含まれないとされ、RAID 0と呼ばれる。 RAID 0には最低2ドライブ
が必要である。1台のドライブが故障しただけでアレイ内の全データ
が失われてしまうため、信頼性は単体ドライブと比べて劣る。例えば、
ある条件で一定期間使用した場合におけるドライブの故障率が1%
だったとした場合、1台ならば故障率は1%だが、2台でRAID 0を構成
した場合は約2%(1-0.99*0.99=0.0199)となり故障率は約2倍に上昇
する。
長所
構成ドライブの全ての容量が利用可能。
パリティ計算によるオーバーヘッドは生じない。
構成ドライブ数に応じてリニアなI/O性能向上が期待できる。
短所
冗長性が全くない為、ミッションクリティカルな環境での使用に適さない。
リニアなI/O性能向上を吸収できるだけの帯域を持ったバスアーキテクチャが必要と
なる。
RAIDとは?
RAID 1: 二重化 (ミラーリング)
仕組みについて
RAID 1は複数台のハードディスクに、同時に同じ内容を書き込む。
RAID 1は最もシンプルなRAIDであり、信頼性の高いRAIDである。
また、RAIDの最大の弱点であるコントローラの故障にも対応しや
すい。 RAID 1には最低2ドライブが必要である。一台が故障した際
に、もう一方も同時に故障する可能性は低く、システムは稼動し
続けることが出来る。ただ、複数台に同じデータを持っているので、
扱えるデータ容量としてはアレイを構成するハードディスク容量の
半分以下となる。RAID 1ではハードディスク台数が増えれば増える
ほどハードディスクの利用効率が悪くなる。
長所
復旧が速い。
障害発生時に単体ディスクより性能が低下しない。
RAIDハードウェア/ソフトウェアなしでも使用できる。
RAID
1を応用してハードディスクの複製ができる。
短所
構成ディスク容量に対するデータ記録可能量が常に構成ディスク台数の逆数倍であるため効率が
悪い。
RAID 1の容量は、構成するドライブの中でもっとも小さな容量に決定され、余った部分は利用で
きない。
RAIDとは?
RAID
3: ビット/バイト単位での専用パリティドライブ仕組みについて
RAID 3はRAID 2の誤り訂正符号を排他的論理和
によるパリティに変更し、演算コストを低減したもの
である。最低3台のハードディスクを扱い、1台を誤り
訂正符号に割り当て、残りの複数台にデータを記録
する。RAID 3はRAID 5に採って代わられた。
RAID 3に対応した機器をこれから手に入れることは
不可能と考えてよい。ビデオ編集機器においては、
アクセスの殆どがシーケンシャルアクセスであること
から、現在でもRAID 3が用いられている場合があるが、
パソコンやサーバでRAID 3を用いる理由はもうない。
長所
パリティを訂正符号として用いているためRAID
2に比較して計算コストが低い。
構成ドライブ数-1個の容量が確保できるため、ディスク容量の無駄を最小限に押さえ
られる。
短所
ビット/バイト単位でアクセスを行うためI/Oの効率が悪い。
パリティドライブが書き込み処理時のボトルネックとなる。
RAIDとは?
RAID
4: ブロック単位での専用パリティドライブ
RAID 4はRAID 3のI/O単位をブロック
に拡大し、I/O効率の改善を計ったもの
である。
性能面でRAID 5に劣るRAID 4は廃れ
つつある。
長所

アクセス単位がブロックになっているため、RAID 3より高速なI/Oが望める。

パリティドライブは書き込み処理時のボトルネックになり得る。(これに対す
る解がRAID5)
短所
RAIDとは?

RAID 5:ブロック単位でのパリティ分散記録
RAID 5は複数のハードディスクに誤り訂正
符号データと共に分散させて記録すること
で、RAID 3、RAID 4のボトルネックを回避
している。現在、RAID 5は各種RAIDの
「主役」といえる。RAID 5で速度面の不満が
あるなら、使っている台数と同数のハード
ディスクを追加してRAID 0と組みあわせる
か、サーバを増設し負荷を分散させると
よい。ただし、すでに冗長化されている
ためRAID 1との組み合わせには向かない。

長所


アクセス単位がブロックになっているため、RAID 3より高速なI/Oが望める。
短所

パリティドライブは書き込み処理時のボトルネックになり得る。(これに対す
る解がRAID5)
RAIDとは?

RAID 6:ブロック単位・複数パリティ分散記録
RAID 6はパリティを2つ記録する。
パリティデータを2重に作成することで、
2重障害に対応でき、同時に2台の
ドライブが故障しても復元できる。
よって、RAID 5より耐故障性は高い。
RAID 6は最低4台のハードディスクが
必要である。

長所


RAID 5と比べてさらに高い信頼性がある。
短所



初期投資が大きい。(ただし、長期的な運用コストはRAID 5と大差ない)
二重にパリティを生成するため、RAID 5よりも書き込み速度が低下する。
コントローラーの故障に対応できない。(RAID 1+0はできる)
4.ストレージインタフェースと
は?
ストレージインタフェースとは?
ストレージインタフェースの歴史
1986年 1989年
1994年
2000年
IDE (ATA)
2007年
2003年
SATA
SCSI
SAS
FC
青色のインターフェースはパラレル方式
緑色のインターフェースはシリアル方式
ストレージインタフェースとは?
パラレル方式からシリアル方式へ移行について
なぜパラレル方式からシリアル方式へ、インターフェースは移行するようになったのだ
ろうか。まず、パラレル方式がかつて広く採用された理由を挙げてみると、次のように
なる。

当時のパラレル採用の理由
一度に送るデータ量を増やすことで高速伝送を実現できた。
PC内部のデータがパラレル処理なので、インターフェースの設計が容易だった。
複数の機器でインターフェースを共有しやすかった。
ストレージインタフェースとは?
パラレルの問題
そのパラレルインターフェースにも次第に限界が見え始めてきた。それはシリコン
デバイス(半導体チップ)の進化により電気信号の高速伝送が可能になり、パラレ
ル転送時の各ビットの到達速度のばらつきが目立つようになってきたのである。そ
して、このばらつきを吸収するために伝送速度を制限しなければならなくなり、パ
ラレル方式というアーキテクチャ自体が大きな課題を抱えていることがクローズ
アップされてきたのである。
パラレル転送の各ビットの到達速度のばらつき
ストレージインタフェースとは?
シリアルインターフェースの採用
一方、シリアルインターフェースは、次に挙げる理由で再び採用され始めた。

現在、シリアルの採用の理由
シリコンデバイスの進化により電気信号の高速伝送が可能になった。
配線がシンプルかつ容易
ピア・ツー・ピア接続なので、障害発生時の他への影響を軽減できる。
イーサネットでも使われている多重化技術で更なる高速化が可能。
イーサネットでも使われているスイッチ技術で接続の拡張性、柔軟性が向上する。
多重化技術
スイッチ技術
ストレージインタフェースとは?
ストレージを支える「SATA」と「SAS」とは?
ストレージインターフェースについても、シリアルが採用され始めた。
シリアルATA(SATA)
2003年になると、ANSIでもシリアル方式のシリアルATA(SATA:サタ)の標準化
が開始された。SATAの最初の規格は1.5Gbpsで、2004年には3Gbpsになった。そ
して2007年には6Gbpsになる予定だ。ソフトウェア的には従来のATAの上位互換に
なっていて、コマンドがシンプルで開発が容易であるという特長を持っていること
から、PCなどの容量単価の安いハードディスクで多く採用され始めている。
インター
フェース
ATA/IDE
SATA
テクノロジ
パラレル
シリアル
転送速度
現在
予定
ケーブル
・ワイドリボン
・ 40ピン
133MB/秒 現時点で最大
・長さ18インチ
(約0.457m)
・ 細いラウンドリボン
3Gbps
6Gbps
・4ピン
・長さ1m
パラレルATAとシリアルATAの比較
接続
・チャネルあたり2ドライブ
・マスター/スレーブ関係
・ ドライブ間で同じ帯域幅を共有
・チャネルあたり1ドライブ
・point-to-point接続
・ドライブあたりフル帯域幅
ストレージインタフェースとは?
Serial Attached
SCSI(SAS)
シリアル方式のSCSIも2003年に規格化されたのがSerial Attached SCSI(SAS)で
ある。SASはSCSIで確立されたソフトウェアとハードディスクドライブの信頼性
はそのままで、コスト効率の高いシリアルATAの物理層とコネクタを採用した規格
になっている。SASはSASとSATAの両方をサポートした仕様になっていることか
ら、SASドライブとSATAドライブを混在して使用できる。現時点では最大3Gbps
までの転送速度をサポートしているが、SASロードマップでは、2007年に6Gbps、
2010年に12Gbpsのデータ転送速度が計画されている。ただし、SASでは3Gbpsの
ポートをマルチリンク(複数のポートを束ねて仮想的に1本の広帯域なポートとし
て使うことで、最大×4ポート)に対応しているので、当分6Gbpsに移行する必要は
ないといわれている。現在、エンタープライズ向けサーバ/ストレージ機器での採
用が進んでいる。
SASのケーブル
項目
データ転送速度(将来)
接続機器の台数
SAS
3Gbps(12Gbps)
16000台/ドメイン
パラレルSCSI
3Gbps
15台/バス
SATA
3Gbps(6Gbps)
1台
コネクタ
ケーブリング
7ピン
8m
68ピン
12m
7ピン
1m
SAS、パラレルSCSI、SATAの比較
ストレージインタフェースとは?
SASとSATAの使い分け
SATAはデスクトップPC用に作られたものであり、シンプルな構成で、最適な価
格・容量を必要としているストレージ環境に適している。一方、SASはメインスト
リームサーバ、エンタープライズストレージ用に作られていて、最高のパフォーマ
ンス、拡張性、信頼性を必要としている環境に適している。
SAS、SATAの比較
主な決定要因
フ
ド
ォ
ラ
ー
イ
マ
バ
ン
ー
ス
・
要
パ
因
高いパフォーマンス能力
フルデュープレックス、高い帯域幅、ポートアグリゲーション、広範囲なコマンドキューイング、豊富なコマンドセット
SAS SATA
○
低いギガバイトあたりのコスト
○
低い予算で購入可能
データ転送時の高いパフォーマンス
高周波。データベース、オンラインでの買い物、銀行振込、CRMなどの即時のランダムアクセスのデータタイプ
○
レファレンスやシーケンシャルタイプのデータにとっての高いコスト効率
○
低アクセス頻度・ストリーミングや、ファイル共有や、電子メール、ウェブ、バックアップ、アーカイブデータなどのシーケンシャルデータなどに最適
拡
張
性
・
信
頼
性
要
因
高い拡張性
8mという長いケーブルを備えた独創的なストレージ用の高いフィジカル デバイスアドレシング範囲と接続
高い信頼性と有用性
広範囲なエラーを回復させる技術;マルチイニシエータ(同時アクセス) +デュアルアクティブポートサポート
○
○
シンプルなコンフィギュレーション セットアップ
○
ユビキタス ドライバ - ベンダのドライバを必要としない。マザーボードチップセットに組み込まれている。
高いデバイスフレキシビリティ
SASとSATAの両方をサポート
○
ストレージインタフェースとは?
Fibre
Channelとは?
これはチャネル方式のメリット(広帯域と確実性)にネットワーク方式のメ
リット(接続の自由度が高く遠距離通信にも適している)を加味したコン
ピュータと周辺機器間のためのデータ転送方式のひとつで、ファイバチャネル
の標準化が始まったのは 1996年ごろから。接続には光ファイバまたは同軸ケー
ブルを使用し、長距離区間の高速データ転送を実現する。
データ転送速度
1Gbps、2Gbps、4Gbps、8Gbps(検討中)
最大ケーブル長(光ファイバの場合) 10km
最大ノード数 126台(FC-AL型)、1678万台(FC-SW型)
データ伝送単位 シリアル
接続形式 コネクション型およびコネクションレス型
ビットエラーレート 10-12以下
ストレージインタフェースとは?
Fibre
Channelとは?
ファイバチャネルの基本構成
ファイバチャネルのトポロジ(接続方式)には
サーバーとストレージを1対1でつなぐPoint to
Point型、ハブを使って126ノードまでループ状
に接続できるFC-AL(Arbitrated Loop)型、
ファイバチャネル(ファブリック)スイッチを介して
1678万ノード(24ビット空間)まで接続できる
ファブリック型(FC-SW(Switched))がある。
カスケード型とメッシュ型
カスケード型では、一連のスイッチが1つまた
は複数のISL(Inter-Switch Link:スイッチ間
リンク)によって、ツリー状の配列で相互接続
されている。メッシュ型ファブリックは、
すべてのスイッチがファブリック内の任意
のスイッチと他のスイッチの間に少なくとも
2つのパスまたは経路があるように相互
接続されている。
ストレージインタフェースとは?
iSCSIとは?
イーサネット上にSCSI-3のパケットを流すことでネットワーク上でSCSI機器
を使用可能にする技術で、記憶装置とコンピュータの通信に使うSCSIコマン
ドを、IPネットワーク経由で送受信するためのプロトコルです。これを使うと、
社内LANなどのTCP/IPネットワーク上に大容量ハードディスクなどの記憶装置
を直に接続して、複数のコンピュータから共用することができるようになる。
SCSI規格は信号線などの物理的な仕様とデバイス間の通信を行なうための仕
様を組み合わせたものだが、このコマンド(とコマンドに従って送受信される
データ)をIPパケットとして送受信することによって、遠隔地にあるSCSIデバ
イスを直接操作することが可能になる。
SCSIコマンドやレスポンスをTCP
パケットにカプセル化することによ
り、従来のSCSIによるトランスポー
トをIPネットワークに置き換える。
RFC3720 で2004年4月に規格化。
(TCP Port番号は 3260)
ストレージインタフェースとは?
iSCSIとは?
OSによるサポート状況
OS名
AIX
Windows
NetWare
HP-UX
Solaris
Linuxカーネル
リリー ス時期
2002年10月
2003年6月
2003年8月
2003年10月
2005年2月
バー ジョ ン
AIX 5.2
2000, XP Pro, 2003
NetWare 6.5
HP 11i v1, HP 11i v2
Solaris 10
2005年6月 2.6.12
iSCSIホストバスアダプタのサポート状況
iSCSIホストバスアダプタ(HBA)はアダプタ自身にiSCSIプロトコルを実装したもの
である。オペレーティングシステムからは SCSI HBA と見えるように振舞う。iSCSI
HBA にはTOENICを持っているものもあり、さらに iSCSI としての処理もオフロー
ドするものもある。ブート可能なiSCSIターゲットを設定するため、NVRAM を使っ
て OSのドライバシステムに対して SCSI HBA であるかのうように見せかける。
以下のベンダーが iSCSI HBA を開発している。
アダプテック(生産終了)、インテル、Alacritech、Qlogic
参考)インタフェースとは?
インタフェースの技術的な推移
5.接続手法は?
接続手法は?
DAS(Direct Attached
Storage)
サーバにストレージ・デバイスを1対1接続する従来の方法である。ストレージの管理
や拡張性などに問題がある。
FC-SAN)
SCSIプロトコルをカプセル化し、 トランスポートとして、ファイバ・チャネルを使用す
ることによりストレージ・ネットワークを構成しブロック・データの送受信を行う。
データ伝送効率やSCSIとの親和性などのメリットがあるが、コスト面やスキルド・エン
ジニアの不足などの問題点がある。
NAS(Network
Attached Storage)
IPネットワークを介してストレージへファイル・レベルでのアクセスを行う。ストレー
ジ・デバイス側にファイル・システムを持つことから、マルチ・プラットフォーム間で
のファイルの共有などのメリットがあるが、パフォーマンスやコスト面での問題点があ
る。
IP-SAN
SCSIの命令体系をIPにマッピングした「iSCSI」(Internet SCSI)やファイバチャネル
をベースにIPネットワークを利用する「FCIP」(Fiber Channel over IP)または
「iFCP」(Internet Fiber Channel Protocol)で接続する「IP-SAN」がある。SCSIのコ
マンドやデータをTCP/IPパケットの伝送フレームの中に包み込み、SCSIコマンド体系を
外から見えなくすることにより、ストレージ製品のIPネットワークへの直接接続を可能
にする。ストレージ製品がネットワークに直結できることにより、ネットワーク網を構
築するハブ、ルータ、スイッチ類は従来のものが利用できるようになることでコスト面
接続手法は?
FC-SAN、IP-SAN、NASの仕組みの違い
接続手法は?
ストレージ系IPプロトコルの特長