EMC IsilonとPivotal HDを使用したBusiness Data Lake

EMC ISILON と PIVOTAL HD を使用した
BUSINESS DATA LAKE ソリューション
ビジネスの洞察力および革新の促進
ポイント
•
EMC Isilon NAS ストレージと Pivotal HD
による効率的で強力なストレージと分析が
Business Data Lake の基盤を提供
•
強力なイン プレース データ分析により結
果を迅速に取得
•
分析をサポートするための個別のインフラ
BUSINESS DATA LAKE のメリット
非構造化データの急激な増加は、今日のさまざまな業界の多くの企業にとって大きな課題となってい
ます。データ量やデータ ソースの大幅な増加に伴い、従来の情報管理や分析手法は、現代の企業が
生み出し、管理する膨大なデータ量を扱うにはコストや時間がかかりすぎるようになっています。
オープンで柔軟性の高い最新のデータ アーキテクチャである Business Data Lake により、次のこと
が実現できます。
•
増大するデータ ストレージ要件に容易に対応し、コストを削減する拡張性と効率性に優れたイン
フラストラクチャ
ストラクチャにより発生するコストと複雑さを
•
データからビジネス バリューを引き出す強力で使いやすい分析ツール
回避
•
可用性と堅牢なセキュリティ オプションを最大化してビジネス ガバナンス要件に対応するエン
タープライズ クラスのデータ保護
つまり、Business Data Lake により、ビジネスを変革する可能性がある貴重な洞察を得るための豊
富なリポジトリが提供されます。
EMC ISILON および PIVOTAL ソリューション
EMC® Isilon®スケールアウト ストレージおよび Pivotal HD、エンタープライズ Hadoop ディストリビ
ューションは、極めて拡張性の高いビッグデータ ストレージと優れた分析機能を組み合わせた強力か
つ高度に効率的な Business Data Lake ソリューションを提供します。このソリューションにより、新し
い洞察を獲得し、ビジネスの革新を促進し、ビジネスに変革をもたらす Business Data Lake を構築
できます。
Isilon は、HDFS(Hadoop Distributed File System)をネイティブにサポートする唯一のスケール
アウト NAS プラットフォームです。Isilon に格納された非構造化データに対して、Pivotal HD を活用
してバッチおよびリアルタイム データ分析クエリーを実行できます。不必要な設備投資、運用コストの
増加、時間を要するビッグデータの個別インフラストラクチャへのレプリケーションは発生しません。
Pivotal HD のコンピューティング リソースを Isilon ストレージ システムに接続するだけで、データか
ら価値を引き出す準備が完了します。
EMC ISILON および PIVOTAL によるイン プレース HADOOP 分析
ソリューション概要
PIVOTAL HD
•
•
Pivotal HD では、フル サポートのエンタープライズ対応ディストリビューションとして拡張およびパッ
すべてのデータの価値を最大化し、ビジネ
ケージ化された Apache Hadoop の機能が提供されています。さらに Pivotal では、イン メモリ分散
スでの活用を実現
システムを組み合わせた豊富かつ実証済みの並列 SQL クエリー処理エンジンを備えた付加価値のあ
高度な分析のための既存の SQL スキル
セットを活用
•
PIVOTAL HD
クローズド ループ分析のためのイン メモ
るサービスが提供されます。Pivotal HD は、共通データ ストレージ レイヤーとして HDFS を持つ
OLAP および OLTP のための、業界で唯一のクローズド ループ バッチおよび分析処理です。ビジネ
ス上の日々の出来事について分析を行うことで、リアルタイムで適切な措置を講じる規範的なシステ
ムを構築できます。
リ データ グリッドによりタイム トゥ バリュ
ーを短縮
PIVOTAL HD のアーキテクチャ
HADOOP のための高速で実証済みの SQL 分析クエリー エンジン
Pivotal HAWQ は、新規参入の SQL-on-Hadoop と異なり、豊富で強力な SQL クエリー オプティ
マイザーの Greenplum データベースから 10 年以上にわたり蓄積された革新的なソリューションを提
供します。HAWQ は、30 結合を超えるクエリーなど、もっとも難度の高いクエリーの最適なクエリー プ
ランを簡単に見つけることができます。HAWQ プロセッサは、HDFS の大規模な並列分散環境で分析
クエリーおよび混合クエリー ワークロードを実行するように最適化されています。HAWQ は完全な
SQL 準拠のため、既存のスキル セットおよび製品を活用してデータ分析プロジェクトを大幅に高速化
できます(場合により Hadoop 単体の 100 倍のパフォーマンスを実現)。
また、HAWQ には HDFS、HBase、Hive との外部インターフェイスがあり、Hadoop エコシステムに
格納されたデータの読み取りおよびクエリーが可能な上に、直接 HAWQ にロードできます。さらに、テ
キスト、AVRO、RCFile 形式などのさまざまなデータ形式がサポートされています。
HADOOP のためのリアルタイム データ サービス
10 年以上にわたり蓄積された革新的なソリューションを土台に構築され、SQL に完全準拠した
GemFire XD は、Pivotal HD と HAWQ を組み合わせたイン メモリ データ グリッドです。業界で最
初のクローズド ループ分析ソリューションを作成する本番品質のプラットフォームを提供します。
GemFire XD では、大きなデータストア(HDFS)で即座に統合された低レーテンシーのスケールアウ
ト OLTP アプリケーションを作成できます。これにより、アプリケーションへの 1 秒未満のレスポンスが
提供される一方、HAWQ、Hive、Map Reduce を介してリアルタイムでデータのバックエンドでの解析
が可能になります。
EMC ISILON
•
•
Hadoop 分析ソリューションおよびイン プ
EMC ISILON スケールアウト NAS
Isilon スケールアウト ストレージ ソリューションにより、非構造化データ資産および関連する分析プロ
ジェクトの増大に対応する膨大な容量を確保できます。Isilon ソリューションでは、単一の Isilon クラ
レース解析を可能にする、より高速なネイ
スターで容量を 16 TB(テラバイト)から最大 20 PB(ペタバイト)以上まで簡単に拡張できます。Isilon
ティブ HDFS サポートの導入
のネイティブ HDFS サポートとイン プレース ビッグデータ分析機能を活用することで、個別の専用
Hadoop インフラストラクチャに必要な多額の設備投資を回避できます。
80%以上のディスク使用率によるコストの
削減
•
単一クラスターで 20 PB 以上に拡張
•
従来の Hadoop 導入時に存在した単一障
害点のリスクを排除
柔軟な運用のためのマルチ プロトコル サポート
柔軟性の向上
ネイティブ HDFS サポートに加え、Isilon スケールアウト NAS は、NFS、SMB、HTTP、FTP、クラウド
イニシアティブをサポートする REST ベース オブジェクト アクセスなど、幅広い業界標準プロトコルを
総合的にサポートします。つまり、Isilon により、柔軟性の高いストレージ インフラストラクチャが
Business Data Lake 環境に提供されます。これにより、ワークフローの単純化、ビジネス分析プロジ
ェクトの高速化、クラウド インフラストラクチャ イニシアティブのサポート、企業のアプリケーションとデ
ータからのより大きな価値の取得が可能になります。
コストの低減
Isilon では、大規模なファイルおよび非構造化データ資産の統合、ストレージのサイロの排除、
Business Data Lake への基盤の提供により、ストレージ インフラストラクチャを合理化します。
Isilon のソリューションにより、最大で 80%以上のストレージ使用率が達成されます。さらに Isilon
SmartDedupe™データ重複排除により、冗長データを排除することでビッグデータ ストレージ要
件を最大 35%縮小できます。この優れた効率性が意味することは、他の選択肢よりも少ないストレー
ジ容量と物理スペースで同じ量のデータを保存でき、初期設備投資と維持コストの両方を削減できると
いうことです。さらに Isilon ソリューションは管理が容易なため、ストレージ管理の IT リソースが従来の
ストレージ システムよりも軽減されます。
迅速な結果
Isilon のイン プレース データ分析手法を使えば、個別のインフラストラクチャにビッグデータを複製
するために必要な時間とリソースを削減できます。たとえば、10 Gb の回線では、100 TB のデータの
コピーに 24 時間以上かかることがあります。代わりに Isilon では、データ分析プロジェクトを即座に開
始し、数分で結果を得ることができます。データ取り込みの長いフェーズなしにイン プレース分析を実
行する機能は、ビジネス スピードでの分析をサポートします。
ビッグデータ資産の保護とセキュリティ
Isilon のストレージ ソリューションは、最高レベルのデータ保護と非構造化データの可用性を提供し
ます。Isilon OneFS®により、ソリューションは従来の Hadoop 導入時に存在した「単一障害点」のリ
スクも排除します。これは、Isilon ストレージ クラスター内のすべてのノードを実質的に NameNode
にすることで実現しています。結果として、データ ストレージと分析環境のリカバリ性が大幅に向上し
ています。
EMC Isilon には、高速で効率的なデータ バックアップと災害復旧など、エンド ツー エンドのデータ
保護オプションが非構造化データのために用意され、データ資産の可用性がさらに高まっています。
コンプライアンスおよびコーポレート ガバナンス要件の順守を支援するために、Isilon には、ファイル
システム監査や WORM(Write Once/Read Many)データ保護などの堅牢なセキュリティ オプション
があり、過失や故意の変更/削除を防止しています。Isilon では、ストレージ管理とファイル システム ア
クセスとで役割を安全に分離でき、認証ゾーンを使用して組織内の特定部門用に安全な分離されたスト
レージ プールを作成することも可能です。
サマリー
Business Data Lake は、ビジネスの変革と圧倒的な優位性の獲得を支援する貴重な洞察を得るた
めの豊富なリポジトリとして役立ちます。EMC Isilon スケールアウト NAS と Pivotal HD は、極めて
拡張性の高いビッグデータ ストレージと優れた分析機能を組み合わせた強力かつ高度に効率的な
Business Data Lake ソリューションを提供します。
次のステップ
EMC Isilon と Pivotal HD による Business Data Lake ソリューションがお客様の組織にどのよう
なメリットをもたらすかの詳細については、EMC または Pivotal セールス担当者または認定リセラーに
お問い合わせください。
また、EMC Store(http://store.emc.com/isilon)で EMC のソリューションをご覧ください。
お問い合わせ
EMC 製品、サービス、ソリューションが
ビジネスおよび IT の課題の解決にど
のように役立つかの詳細については、
EMC 担当営業または認定 EMC パート
ナーまでお問い合わせください。
あるいは、EMC の Web サイト
(http://japan.emc.com)をご参照
ください。
japan.emc.com
EMC2、EMC、EMC のロゴ、Isilon、OneFS、AutoBalance、SmartDedupe は、EMC Corporation の登録商標
または商標です。その他のすべての名称ならびに製品についての商標は、それぞれの所有者の商標または登録商
標です。Copyright © 2014 EMC Corporation. All rights reserved.(不許複製・禁無断転載) ソリューション
概要 H12775-J 6/14
EMC Corporation は、この資料に記載される情報が、発行日時点で正確であるとみなしています。この情報は予告
なく変更されることがあります。