EMC ISILON

Data Lake
EMC ISILON
+
IoTを⾒据えたデータ活⽤はDataLakeから始める
〜Pivotal+Isilonで実現するDataLakeの世界〜
SQL, MapReduce, Hive, Pig, etc.
データ活用サイクルを回すために、
みんなで使えるデータ活用基盤を用意しよう
Hadoop等
構造化
データ
「みんなで使える」
・あらゆるデータの⼀元管理が可能
・汎用的なインターフェースでアクセス可能
非構造化
データ
SQL, File Access, Flume, Fluentd,
Sqoop, Storm, S4, etc.
ビジネス・アプリケーション
Report
BI
Mining
Map
Reduce
Hive/
Drill
File
Access
SQL on Hadoop
HBase・Drill
etc
In-Memory
DB/DWH
EMC ISILON
SQLインターフェースを備えた
エンタープライズHadoop
Multi Interface Scaleout
NAS
EMC ISILON
売上情報
顧客情報
メール
アクセスログ
音声
Webコンテンツ
生産情報
動画
M2M
SNS
HDFS連携可能な豊富なイン
ターフェースを持つスケールアウト
NAS
Data Lake
Data Lake
Data Lake
‐ データ処理基盤の基盤要素となるHDFSにデータを蓄積
‐ あらゆるデータ・要件に応じて処理エンジンの使い分け
‐ インターフェースを多く持ち、データ活⽤対象となるデータの⼀元管理を
実現するOneFSへデータ蓄積
‐ 集約したデータをHDFS利⽤可能とし分析対象データにすることが可能
HAWQ
アドバンスド
データベースサービス
Pivotal HD
Enterprise
ANSI SQL + アナリティクス
Xtension
フレームワーク
リソース管理
& ワークフロー
HBase
クエリ
オプティ
マイザ
カタログ
サービス
ダイナミック・パイプライニング
Yarn
Zookeeper
Pig, Hive,
Mahout
Map
Reduce
Center
コンフィグ
デプロイ
HDFS
HVE
Command
モニター
管理
Oozie
Sqoop
Flume
Apache
Pivotal HD 追加機能
TED Data Lakeパッケージ
SQL on Hadoop製品のPivotalHD・HAWQと豊富なインターフェースを持つスケールアウトNASのEMC Isilonを組み合わせた
DataLake基盤を、最適なHWの選定と共に、容易に導⼊・運⽤が可能なパッケージ
TED Pivotal HAWQパッケージ
性能・ユーザー数の面で拡張性も考
慮したバランスの取れたH/Wを選定
・・・
EMC Isilon
性能・容量の観点からモデルを選択可能
スタンダード
X410
スモールスタート
X210
東京エレクトロンデバイスセッション
 日時: 2015/10/15 17:15〜17:55
 場所: ボールルームB
 タイトル: IoTを⾒据えたデータ活⽤はDataLakeから始める

〜Pivotal+Isilonで実現するDataLakeの世界〜
パフォーマンス
S210