Securing Microsofts Cloud

サーバーの適切なサイジングによる
データセンターのコスト削減と
電力削減の実現
IT 部門では、近年これまで以上に、導入コストおよびエネルギー消費を考慮して、可能な限り効率性の高いサー
バーを選択し、展開することが求められています。本ドキュメントでは、マイクロソフトの大規模なデータセンターの
管理と運営を担う Microsoft Global Foundation Services チームが、どのようにしてサーバーを適切にサイジングし、
最大限の効率化を達成しているかについて説明します。このプロセスでは、代表的なワークロードを使用した詳細
なパフォーマンス データの収集に集中的に取り組み、その後そのデータセットを分析して、実稼働シナリオに最も
適したサイズかつバランスのサーバーを選択します。IT 部門は本ドキュメントで示す方法を採用することによって、
購入予算を大幅に引き上げ、予算に制約がある場合でも組織の目標を容易に達成できるようになります。
発行日: 2009 年 12 月
1 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
はじめに
コストとエネルギーの観点から考えて最も効率的なサーバーを確実に購入し展開するには、どうすればよいでしょうか。
Microsoft Global Foundation Services (GFS) 部門は、何万台というサーバーからなるマイクロソフトのデータセンターを構築、管
理しています。このためにまず最初に実施しているのが、社内ワークロードの詳細な分析です。その後、分析プロセスを形式
化し、展開するサーバーを適切にサイジングすることにより、即時的かつ長期的なコスト削減を実現しています。GFS では、公
開されているベンチマーク データよりも、実際の社内ワークロードをテストする方がはるかに有益な比較データを得られると
考えています。サーバーを適切にサイジングするにあたり、システムのバランスを調整することで、大幅なコスト削減を実現し
ています。GFS の分析と経験から、一般的には、より尐数かつ比較的安価なプロセッサを利用する方が理にかなった選択だ
といえます。これは、パフォーマンスのボトルネックが CPU ではなく、ほぼ例外なくプラットフォームのディスク I/O に関連し
ているためです。
マイクロソフト データセンターのサーバー環境の概要
マイクロソフトのエクスペリエンスは、どのような環境にも対応できるのでしょうか。まずはその判断材料となる点について説明
しましょう。Global Foundation Services は、マイクロソフトが提供するオンライン サービス、Live サービス、およびクラウド
サービスのすべての環境をサポートしています。これらの環境はきわめて変化に富み、決して一体型とは呼べません。マイク
ロソフトの電子メール サービスや検索サービスついては広く周知されていますが、実際には、Bing、Hotmail、Microsoft Office
SharePoint Online、および Xbox Live といった多様なアプリケーションを使用する 200 種類を超えるオンライン サービスをサ
ポートしています。効率性の観点から、GFS ではサーバーを限られた種類に統合し、すべてのサービスにわたって使用してい
ます。これらのサーバーでは、Windows Server 2003、Windows Server 2008、または Windows Server 2008 R2 が実行され
ています。これは、エンジニアリング、財務、および人事など、まったく共通性のない複数の社内アプリケーションをサポー
トすることが求められる多くの IT 担当者にとって馴染みのあるシナリオです。マイクロソフトで使用するアプリケーションは、い
くつかの主要カテゴリに分類できます。GFS は、Bing (以前の Live Search) や Windows Azure を始め、Web (IIS)、ファイル、お
よびデータベース (マイクロソフトでは Microsoft SQL Server をトランザクション処理に使用) などすべてに対して、それぞれ最
適な条件を考える必要があります。
求められるパフォーマンスとは
一般的にこの業界で “パフォーマンス” という場合、ほとんどの人は速度を思い浮かべます。ところが辞書で調べてみると、
パフォーマンスとは、「何らかの目的に対して、どの程度機能を実行するか」ということであると定義されています。サーバーの
場合、GFS が考慮するのは速度だけではありません。速度に対する従来の指標といえば、スループット、応答時間、および待
機時間ですが、GFS ではコスト効率の評価基準についても考慮しています。
2 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
自動車を例に考えてみましょう。経済性を考えて車を購入する場合、気になるのは車の走行速度だけではなく、燃費や整備性
といった、経済面に関連する判断基準についても知りたいと考えるはずです。GFS ではサーバーを比較する際、単価あたりの
パフォーマンス、ワットあたりのパフォーマンス、ワット単価あたりのパフォーマンスについて、広い観点から検討します。また、
実際のエネルギー消費量と、そのエネルギー消費量に対する作業量も調査し、さらには信頼性と整備性についても考慮し
ています。
公開されたベンチマーク データの信頼性
従来のパフォーマンス指標 (スループットと応答時間) について考える場合、非常に便利な業界標準のベンチマークが多数存
在します。これらのベンチマークの大半は、標準性能評価法人 (Standard Performance Evaluation Council: SPEC) およびトラン
ザクション処理性能評議会 (Transaction Processing Performance Council: TPC) という、2 つの主要業界団体によって策定され
ています。
最もよく使用されるベンチマークの 1 つに、SPEC CPU2006 があります。このベンチマークでは、標準化された一連の整数演
算と浮動小数点演算のベンチマーク テストを単一のスレッドで実行することにより、さまざまなマイクロプロセッサの中央処理
装置 (CPU) のパフォーマンス特性に関する有用な詳細情報が提供されます。また、CPU2006_rate はこのベンチマークのマル
チスレッド バージョンであり、CPU2006 ベンチマークを複数のインスタンスで実行し、詳細なスループット特性を分析します。
ただし、CPU2006 ベンチマーク スイートを通じて得られたデータを解釈するにあたっては、考慮すべき重要な注意事項があり
ます。公開されたベンチマーク結果は、ほとんどの場合、実稼働システムのコード開発においてはめったに使用されない、き
わめて細かく調整されたコンパイラを使用して得られた数値であるということです。多くの場合、通常ほとんどの実稼働システ
ムでは使用されない、コード最適化スイッチの設定が含まれます。また、CPU2006 スイートを構成する個々のベンチマークは、
非常に有益かつ多様なアプリケーション セットに対応していますが、各企業の実稼働環境で実行されるアプリケーションに必
ずしも当てはまるわけではありません。加えて、ベンチマーク結果を解釈する際は、ベンチマーク テストのデータ収集に使用
された具体的なシステム構成 (CPU の周波数とキャッシュ サイズ、メモリ容量など) を考慮することも大変重要です。結果は
構成の影響を受けるため、選択する製品の比較を行う前に把握しておく必要があります。
一般的に使用されるもう 1 つのベンチマーク セットとしてトランザクション処理性能評議会 (TPC) から公開されているベンチ
マークは、トランザクション ワークロード (データベースなど) のシステムレベルのパフォーマンスに対応しています。このカテ
ゴリでは、TPC-C、TPC-E、および TPC-H がよく知られています。これらのベンチマークは、所定のソフトウェア スタックに関して、
さまざまなハードウェア プラットフォーム間の相対的パフォーマンスを計測する際に非常に役立ちます。ただし、TPC の Web
サイトで閲覧できる公開されたベンチマーク テストのデータに基づいて、競合製品を完全に比較することは難しく、これは特に
ハードウェア コンポーネントが必ずしも同じではなく、構成が異なるのが一般的であり、使用されているデータベース ソフト
ウェアやオペレーティング システムも異なることが要因です。加えて、システム構成では、パフォーマンスのボトルネックが生
じないよう、細かいチューニングが行われていることが尐なくありません。これは通常、CPU サブシステムの能力を無駄にし
ないよう、きわめて高性能なストレージ サブシステムを使用していることを意味します。実際、TPC-C や TPC-E で画期的な結
果が達成されている場合、ストレージ サブシステムに 1,000 台以上のディスク ドライブから成るシステム構成が使用され
3 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
ているケースも珍しくありません。この点をわかりやすく示した、TPC-C の最近の結果の例があります。この例では、3,000 ドル
を尐 し上 回る 、 エン トリ レ ベ ル 価格 のデ ュ ア ル プ ロ セッ サ サー バー プ ラッ ト フォ ーム が 使 用 され て い ま す ( 出典 :
http://www.tpc.org、英語)。公開されたベンチマークの結果は良好で、1 分間あたり 600,000 回を超えるトランザクションが
達成されています。ただし、システム コストの合計は 675,000 ドルを超えており、ほとんどの企業にとって現実的とは言い
難い構成です。コストの大半は、144 GB のメモリと、1,000 台を超えるディスク ドライブを採用していることにあります。
CPU2006 と同様に、TPC ベンチマークの結果を解釈する際はいくつか注意すべき点があります。最も注意すべきなのは、ベ
ンチマーク テストに使用された構成が、どの程度厳密に利用者の実稼働環境の展開状況を反映しているかという点です。公
開されたベンチマーク データを信頼したり、競合製品を比較するにあたっては、まずこの点を把握することが不可欠となり
ます。次に考慮すべきなのは、ソフトウェア スタックに含まれる要素 (オペレーティング システムおよびデータベース ソフト
ウェア)、そしてその構成方法です。それらを利用者の環境に展開された実際のソフトウェア構成と比較します。
競合製品間でパフォーマンスを比較する標準的な方法を確立するうえで、業界ベンチマークはもちろん役に立ちます。ただし
注意が必要なのは、公開されたベンチマークの構成は、そのシステムで達成可能な最高のパフォーマンスを引き出すために
設計されているという点です。購入の意思決定のためにベンチマーク データを利用する場合は、結果をそのまま解釈しない
ようにご注意ください。また、ベンチマーク テストに使用されたシステムを詳細に分析し、自社のシナリオとどの程度関連性が
あるか把握されることを強くお勧めします。購入の意思決定において、公開されたベンチマークの結果をそのまま使用すること
は、たとえば レース場での F1 レーシング カーの走行性能を測定し、そのデータを参考にして通勤用の車を購入することと
同じようなことであるといえます。
CPU は通常ボトルネックにならない: 適切なシステム バランスの必要性
それでは、パフォーマンスを現実的に検討するにはどうすればよいのでしょうか。__ まず必要なのは、自身が所属する組織
の標準的なユーザー構成を把握することです。通常この点は、処理能力やコストの制約に基づいて決定されます。標準的な
環境では、公開されたベンチマークよりもメモリ サイズが尐なく、ディスク I/O の数量が制限されているのが一般的です。こ
のように、サーバー システムのバランス調整が適切でないことが、業界全体の CPU 使用率を大きく押し下げる要因となっ
ています。これにはどのような対処が可能でしょうか。1 つの選択肢としては、メモリ容量を増やしてディスクへのアクセス数を
減らす方法があります。多尐のコスト増を伴いますが、これによってパフォーマンスの向上が期待できます。もう 1 つの選択
肢は、GFS でもよく行いますが、バランス調整したサーバーを展開する方法です。これにより、主要なプラットフォーム リソー
ス (CPU、メモリ、ディスク、およびネットワーク) を適切にサイジングすることができます。
4 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
図 1: CPU パフォーマンスとディスク パフォーマンスの推移
上のグラフ (出典: Intel ホワイト ペーパー、英語) からわかるように、過去 10 年間で CPU パフォーマンスが大幅に向上し
ているのに対し、ディスク パフォーマンスはほぼ横ばいです。CPU パイプラインの稼働率を上げるには、システム アーキテク
チャの設計を通じて、他のプラットフォーム コンポーネント (メモリとディスク) が CPU に対して適切なデータ帯域幅を提供で
きるようにする必要があります。メモリ帯域幅を増やすということは、メモリ チャネルと接続する CPU ピンを増やすということ
であり、システムのコストと消費電力の増加を意味します。また、ドライブ帯域幅を増やすには、ドライブを増設してハイ パ
フォーマンス構成 (RAID 10、RAID 5) を構築する必要があり、システムの電力、コスト、ラック専有面積の増大につながります。
所定のアプリケーションに対して、メモリやディスクの帯域幅が十分に割り当てられない場合、CPU が長時間にわたってアイド
ル状態になり、システムの電力が無駄に消費されます。また、CPU のパイプライン処理機能のさらなる向上を目指すテクノロ
ジ ロードマップのマルチコア CPU では、さらに問題が大きくなります。こうしたミスマッチを緩和する一般的な手法としては、
システム メモリの容量を増やし、ディスクへのアクセス頻度を減らすことが考えられます。
こうした際限のない CPU パフォーマンスの向上 (「ムーアの法則 (英語)」を参照) と、それによって発生するプラットフォーム
の他の要素 (特にメモリとディスク) との不均衡は、パフォーマンス チューニングに対する重大な課題を意味しますが、GFS
ではこれを、サーバーを適切にサイジングする絶好の機会であると捉えています。マルチコア CPU のパフォーマンス向上に
より、商品市場ではサーバーの CPU 数の減尐が加速しています。現在では、4 ソケット システムで実行していた処理が 2
ソケットで、2 ソケット サーバーで実行していた処理が 1 ソケット サーバーで実行できるようになっています。問題としては、
特定の世代のプラットフォームにおける任意のカテゴリのワークロードに対して、CPU/メモリ/ディスクの適切なバランスを見
出すのが難しいことにあります。これを解決することこそが、サーバーを適切にサイジングするうえでの最終目標となります。
この目標を達成するには、システムの負荷テストを実施し、各ワークロード シナリオに対するシステムのスケーラビリティを把
握します。マイクロソフトのアプリケーション環境でそれを実施する具体的な方法については、後続のセクションで紹介します。
再び車を例に考えてみたいと思います。ほとんど市街地でしか乗らない車に、V8 エンジンを搭載する必要はありますか。その
ような車には、4 気筒エンジンを搭載する方がはるかに効率的といえます。
5 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
下の図 2 に、考慮すべきもう 1 つの側面を示しています。ある特定のプロセッサについて、周波数ごとに測定されたパ
フォーマンスを見た場合、通常、直線的な効果は確認できません。高周波数のプロセッサでは、周波数よりも価格の上昇率の
方が高くなります。さらに悪いことに、パフォーマンスは通常、周波数に比例して向上するわけではありません。パフォーマンス
をできる限り最大化しようとすれば、得られるパフォーマンスに見合わない高額な投資が必要になります。パフォーマンスは本
当に最大化する必要があり、そしてシステムのその他の部分でそれを活かしきれるのでしょうか。コスト面を考えると、追求す
べき最適なレベルを特定することが非常に重要です。
図 2: 直線的に上昇しない市販のデュアルソケット プロセッサの価格パフォーマンス
電力関連の多大なコスト
多くの理由から、電力は重要な考慮事項です。その 1 つ目の理由は、電力は継続的に発生する累積的な経費である点です。
全米の法人向け電気料金を平均すると、キロワット時あたり約 10 セントになります。サーバーのライフサイクル全体で考える
と、そのコストは膨大です。もう 1 つの理由は、サーバーによる電力消費が、データセンター内の別の場所での電力消費を引
き起こす点にあります。これを測定する方法の 1 つに、電力使用効率 (PUE) という指標の利用が挙げられます。
サーバーで 1 ワットを消費するごとに、サーバーへの電力供給と冷却のために一定量の消費電力のオーバーヘッドが発生し
ます (図 3 を参照)。このオーバーヘッドは、50 ~ 100 パーセント超になる場合があります。効率性に劣る古いデータセン
ターで PUE が 2.0 の場合、サーバーの消費電力が 1 ワット増えるごとに、データセンター インフラストラクチャによってさら
にもう 1 ワットが消費されます。
概算ですが、サーバー寿命を通常の 5 年とすると、1 ワット節電することにより約 4 ~ 5 ドルの節約になります。これは概
算値であり、当然ながら支払う電力料金に応じて変化しますが、サーバーを多数使用している場合は相当の多額になります。
6 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
図 3: データセンター内のサーバーの電力消費と冷却によるオーバーヘッドを計測する電力使用効率 (PUE)
電力コストは通常、運営コストとして考えられますが、電力の消費には多大な資本投資も伴います。標準的なデータセンターを
構築するコストを考えた場合、業界の一般的な見積もりでは、サーバーの消費電力 1 メガワットあたり約 1,000 ~ 2,000 万
ドルになります。GFS では、電力を消費するすべてのサーバーについて、こうした資本投資を減価償却していくことをお勧めし
ます。次の図 4 に示すグラフは、基本的な 1U サーバーの 3 年間の総所有コスト (TCO) を表しています。このコストの半
分弱が、機器の購入費用になります。青色の部分は PUE を考慮に入れた電力会社への支払額、オレンジ色の部分はその
特定のサーバーで消費されるエネルギー量に対して発生するデータセンターの減価償却費、そして緑色の部分はその他の運
営コストを表しています。時間の経過とともに、それほど長くかからずに、サーバーの購入価格が総所有コストの半分未満とな
ります。5 年間の TCO では、より購入価格の割合が小さくなります。
図 4: 基本的な 1U サーバーの 3 年間の総所有コスト
7 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
このドキュメントで説明した適切なサイジングの原則を使用率向上に役立てることにより、データセンターをさらに効率的に活
用できるようになります。これにより、現在のデータセンターにおいてさらに長期にわたってニーズを満たせるようになるため、
新しいデータセンターの建築や賃貸を先延ばしにすることができます。
サーバーの適切なサイジングにおける GFS のアプローチ
ここでは、展開するサーバーの種類を GFS がどのように決定しているかを説明します。最初に行う作業であり、またおそらく
最も重要な作業になりますが、GFS はまずデータセンターのワークロードを把握することに注力します。具体的なアプローチと
しては、主要アプリケーションの測定と分析を行い、それらの特性をモデル化して、サーバーの選択に活用します。
ここで、1,000 台のディスク ドライブを使用して、1 分間あたり 600,000 回のトランザクションを達成したシステムのベンチ
マークの例について振り返ります。ドライブ数が 8 台、24 台、または 57 台の場合のパフォーマンスの状態を見ると、1 秒
あたりのトランザクション数が 10 分の 1 にまで減尐しています。図 5 を見ると、ディスク数の増加と共に CPU 使用率が高
まっており、システムがディスクの制約を受けているためであることがわかります。ディスク ドライブの数を増やすにつれて、1
秒あたりのトランザクション数が増加します。これは、I/O 数が増加することで、結果としてスループットが拡大するためです。ド
ライブ数が 8 台のみの場合、CPU 使用率は 5 パーセントにすぎません。ドライブ数が 24 台になると、CPU 使用率は 20
パーセントに上昇します。ドライブ数をさらに倍増すると、CPU 使用率は約 25 パーセントまで高まります。これはディスク I/O
の不足によるものであるため、高速プロセッサを高額で購入する必要はありません。こうしたデータを活用して構成を適切にサ
イジングすれば、電力とコストの両方を削減することが可能になります。
図 5: 標準的なシステム パフォーマンス: 最も大きな要因はディスク I/O のパフォーマンス
8 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
Web サーバーのテスト
Web サーバーに関しては、マイクロソフトのツールである Web Capacity Analysis Tool (WCAT) を使用してテストを実行してい
ます。このツールは一般提供されており、IIS.net からダウンロード可能です。これの代わりに SPECweb2009 という業界ベン
チ マ ー ク を 利 用 す る こ と が で き ま す が 、 GFS で は 、 当 社 固 有 の 使 用 モ デ ル に は 適 さ な い と 判 断 し ま し た 。 WCAT は
Windows/IIS の関連ツールなので、マイクロソフトの環境にはるかに適しており、セットアップも非常に簡単です。テストでは、
検討中の 2 種類のサーバーを用意し、それぞれの数値を調べます。使用するワークロードに基づいて、たとえば CPU 負荷
の高いプロファイルのシナリオや、ディスク ドライブの負荷の高いプロファイルを選択することができます。図 6 に、テスト対
象のシステムおよびそれを実行するマシンを含む、WCAT テスト環境の具体的な構成を示します。
図 6: Web Capacity Analysis Tool のテスト環境
図 7 は、WCAT テストの結果を示しています。このケースでは、高速なプロセッサのデータに大きな差異が見られますが、こ
れはコンテンツがメモリ キャッシュから提供されたことが要因と考えられます。この Web サービスの場合、旧式のサーバーと
新しいサーバーを比較したところ、高速な CPU を使用することによって大幅にパフォーマンスが向上されました。
9 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
図 7: Web Capacity Analysis Tool のテスト結果
ファイル サーバーの選択
次に、ファイル サーバーのパフォーマンスについて考察します。最初に、Event Tracing for Windows (ETW) を使用したストレー
ジの特性評価について見ていきます。ETW は Windows に含まれる機能で、ディスク イベント トレースの収集を行います。
ディスク イベント トレースを保存しておくと、後にこれらを分析し、お使いの環境におけるファイル サーバーの動作の原因を
特定することができます。このツールを使用すると、転送サイズ、キューの深さ、1 秒あたりの入出力処理数 (IOPS)、および輻
輳などに関する統計値の要約レポートを生成することができます。つまりこのツールでは、お使いのサーバーへのアクセス状
況に関する広範な統計情報を生成することができます。ディスク サブシステムへのアクセスは、例外なくすべて収集されます。
GFS は、複数の異なるワークロードを実行するマイクロソフトの実稼働サーバーからこうしたトレースを収集し、その情報を使
用して、ワークロードのプロファイルを作成しています。また、このプロファイルをサーバーの適切なサイジングに活用し、実際
のワークロードの需要に見合う、十分な IOPS を確実にディスク サブシステムに割り当てるようにしています。
10 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
このワークロード分析に基づいて、ディスク コントローラーのパラメーターを設定することもできます。図 8 は、2 つの RAID
ストレージ コントローラーに関して実施した分析結果を示しています。一方のコントローラーは 512 MB のキャッシュ、もう一
方は 256 MB のキャッシュを備えています。パフォーマンスを確認したところ、キューの深さが一定のレベルを超えると、512
MB のコントローラーでは、比較的安価な 256 MB のコントローラーに比べて非常に高いパフォーマンスを発揮することがわ
かりました。ところが、GFS が実施した ETW のワークロード分析の結果を見たところ、ほとんどの場合キューの深さが 8 I/O
を超えていないことがわかりました。そのため、当社の運用領域では、2 種類の RAID コントローラーの間にパフォーマンスの
違いはないということがいえます。もし、ワークロード分析を行わずにグラフだけを見ていたら、キューの深さが最も大きい範囲
でパフォーマンスが 10 ~ 15 パーセントも向上している点に注目し、まったく使用する予定がないパフォーマンスのために
高額な投資を行っていたかもしれません。
図 8: キャッシュ サイズの異なる RAID ストレージ コントローラーの分析
11 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
図 9 では、CPU パフォーマンスが重視される、別のアプリケーションの測定値を示しています。ここでは 4 種類のプロセッサ
について、パフォーマンスのスケーリングを検討しています。データは左端のプロセッサ (2.0 GHz、80 W) を基準に正規化さ
れています。1 つ目の棒グラフは周波数を表しており、2 つ目は 1 秒あたりのジョブ数で計測したパフォーマンスを示してい
ます。
図 9: コンピューティング ワークロードのパフォーマンス/電力/コスト間のトレードオフ
グラフによると、2.0 GHz から 2.33 GHz の間で周波数が 17 パーセント増加した一方、パフォーマンスは 14 パーセントしか
向上しませんでした。つまり、パフォーマンスをギガヘルツあたりで計測すると、2.33 GHz プロセッサの効率性は 98 パーセン
トになります。これはすばらしい値ですが、周波数が高くなるにつれ、効率性は低下し始めており、最も周波数の高いプロセッ
サでは 90 パーセントを下回っています。この最も周波数の高いプロセッサのデータを詳しく見ると、電力 (赤色) の値は 2.0
GHz プロセッサの 1.5 倍になっており、CPU の定価については 5 倍になっています。つまり、総所有コストという観点から考
えると、この最高周波数のプロセッサの導入価値は明らかに低いといえます。中間の 50 ワットのプロセッサは、2.67 GHz の
プロセッサよりも消費電力とコストが低いうえ、パフォーマンスはわずかしか劣らないため、選択肢としては最適です。
この図の例では、ごくシンプルなアプローチを採用し、プロセッサの定価と電力のみを示しています。実際にサーバーを購
入する際は、プラットフォームレベルの観点から、異なるプロセッサを使用することでどの程度プラットフォームのコストと電力
が変化するかを検証することが重要です。ただし、この例が示すように、価格、電力、パフォーマンスを考慮した場合に最も総
合的に優れた効率性が認められるのは、傾向として中間クラスのプロセッサが多いことがわかります。
12 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
テクノロジの導入タイミング
プロセッサのパフォーマンスは、常に進化を続けています。IT 部門は、新たに主流となったテクノロジを、どのタイミングで展
開するべきなのでしょうか。これを検討するには、マイクロプロセッサの価格を振り返ることが役に立ちます。メーカーは基本的
に、パフォーマンスを強化したプロセッサを、以前のプロセッサと同じ価格帯で提供してきました。たとえば、デュアル コア プ
ロセッサが最初に登場した際、メーカー各社は次のように述べていました。「デュアル コアになったからといって、価格の上乗
せはいたしません。価格は、旧製品となるシングル コア製品と同じです。つまり、1 つの価格で 2 つ入手できることになり
ます」。その後、デュアル コアからクアッド コアになったときも同様に、価格は変わらずに 4 つのコアを購入できました。
ほとんどの購入者は、ごく自然な流れとして、シングルコア プラットフォームの価格でデュアル コアを購入できるようになり、
その 1 年後にはクアッド コアを購入できるようになりました。価格を据え置いたまま、理論上はパフォーマンスがますます向
上しています。これは一見、非常に得をしているかのように思えます。ところが実際のパフォーマンスは、コア数に比例して増
大するわけではありません。既に説明したとおり、メモリ帯域幅の制約やディスク I/O 帯域幅の制約がある場合、単純に
CPU コアのパフォーマンスが倍になっても、全体のパフォーマンスが倍になるわけではありません。
ただし、コア数を増やすことにより適切なサイジングを行ったり、コストを大幅に削減できる可能性がでてきます。また、パ
フォーマンスの向上によって CPU の使用率は低下するため、従来 4 ソケットを使用していた処理を 2 ソケットで、従来 2
ソケットを使用していた処理を 1 ソケットで実行できるようになる可能性もあります。適切にサイジングを行えば、直観的なア
プローチとは逆になりますが、全体的なシステム コストの削減が可能となります。
どの程度コスト削減効果があるかを具体的に示すため、4 ソケットのデュアルコア CPU を使用して、合計 8 つのコアがある
場合を考えてみます。8 コアを必要とする場合、クアッドコア プロセッサを導入すれば必要なソケットが 2 つだけになるので、
コスト削減となります。これは、4 つ以上のソケットをサポートするクアッドコア プロセッサが、2 ソケットのみをサポートするも
のと比べて大幅に価格が高いためです。4 ソケット プラットフォームはより高価なだけでなく、消費電力も高いのが一般的
です。繰り返しになりますが、パフォーマンスが最も高い領域では、パフォーマンスよりもコストの上昇率の方が高くなります。
お使いのアプリケーションが複数の 2 ソケット サーバーにスケールアウト可能ならば、ソケット数の多いシステムにスケール
アップするよりもコストを削減できます。図 10 に、マイクロソフトが実際にファイル サーバーに使用していたデュアルソケット
プラットフォームの例を示します。構成はさまざまでしたが、使用率は 11 ~ 35 パーセントの間を推移していました。“新たに
改良された” 次世代プロセッサの提供が開始された際に GFS が出した結論は、シングルソケット プラットフォームに移行して
も目的のパフォーマンスを維持できるだろうというものでした。これは、新しいプロセッサによって処理能力が向上するからとい
うよりは、最悪の場合でも 35 パーセントの使用率が 70 パーセントに上昇する程度で、最終的な使用率は 55 パーセントで
推移すると予想されたためです。マイクロソフトは次のようなデータから判断し、ファイル サーバーに関しては、ほとんどの
ケースで 2 プロセッサは必要ないという結論に至りました。
13 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
図 10: 適切なサイジングの例: ファイル サーバーのデュアルソケット プラットフォーム
まとめ
結論としてまず強調したいのは、パフォーマンスを構成するのは速度だけではないということです。パフォーマンスの定義にコ
スト効率を含める場合には、電力も考慮する必要があります。また、プロセッサの処理速度は多くの場合、私たちの利用能力
を上回っています。CPU パフォーマンスを余すことなく活用するのは困難です。このようにアンバランスなプラットフォームでは、
構成を適切にサイジングすることが重要です。これにより、総所有コストの観点からますます電力が重要な要素となりつつある
現状で、電力とコストの両方の削減を達成することが可能になります。
もう 1 つ覚えておいていただきたいのは、環境によって業界ベンチマークが当てはまらない場合があるという点です。IT 部門
は独自にワークロードの特性分析を行い、実際の環境内でアプリケーションの動作を把握したうえで、その結果に基づいて最
適化を実施されることを強くお勧めします。
作成者: Dileep Bhandarkar (ディスティングイッシュト エンジニア) および Kushagra Vaid (主席ハードウェア アーキテクト)、両
者ともに Microsoft Corporation Global Foundation Services 所属
14 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行
利用条件
このドキュメントに記載されている情報は、このドキュメントの発行時点における米国 Microsoft Corporation (以下、「マイクロソフト」) の見
解を反映したものです。マイクロソフトは市場の変化に対応する必要があるため、このドキュメントの内容に関する責任をマイクロソフトは問
われないものとします。また、マイクロソフトは、発行日以降に発表される情報の正確性を保証できません。
このホワイト ペーパーに記載された内容は情報の提供のみを目的としており、明示、黙示、または法令に基づく規定にかかわらず、このド
キュメントで示す情報についてマイクロソフトはいかなる責任も負わないものとします。
このドキュメントおよびソフトウェアを使用する場合は、適用されるすべての著作権関連の法律に従っていただくものとします。著作権の下で
許可される権利を制限することなく、このドキュメントのいずれかの部分を転載すること、情報検索システムに格納または登録すること、
あるいはいずれかの形式、手段 (電子的、機械的、写真複写、録画等を含む)、または目的で配布することは、マイクロソフトから書面による
明示的な許可を受けた場合を除いて一切禁止されます。
このドキュメントに記載されている事項に関しては、マイクロソフトが特許権、出願済み特許、商標権、または著作権等の知的財産権を所有
している場合があります。別途マイクロソフトのライセンス契約で明示的に規定される場合を除き、このドキュメントは、これらの特許権、商標
権、または著作権等の知的財産権の実施権を付与するものではありません。
Microsoft、Bing、Hotmail、Microsoft SharePoint Online、Microsoft SQL Server、Xbox Live、Microsoft のロゴ、および本ドキュメントに含まれる
その他のマイクロソフト製品とサービスは、米国 Microsoft Corporation の米国またはその他の国における商標または登録商標である可能
性があります。
本ドキュメントに記載されている実在の企業および製品は、それぞれの所有者の商標である場合があります。
© 2009 Microsoft Corporation. All rights reserved.
15 | サーバーの適切なサイジングによるデータセンターのコスト削減と電力削減の実現
2009 年 12 月発行