Cloudera CDH5

DATA SHEET
HADOOPエコシステムのパワーを企業に
もたらすCDH
CDH 5
エンタープライズ分野における100%オープンソースのHadoopスタンダード
INTEGRATED
CDHは、Clouderaが提供するApache Hadoopベースの100%オープンソースのプラット
• 迅速な立ち上げと稼働を実現するApache
フォームであり、企業ニーズを満たすために特別に設計されています。最も幅広く導入
Hadoopベースの完全パッケージ
SECURE
• 機密データの処理と制御マルチテナンシー
の促進
SCALABLE AND EXTENSIBLE
• 幅広いレンジのアプリケーションを活用し
ビジネスと共に成長
されているHadoopとして、CDHは、銀行や通信、メディア、小売や政府機関などの大規
模企業・組織において、数百件にのぼる大規模な本番環境で稼働しています。
CDHはApache Hadoopと、Hadoopに関連する十以上の主要オープンソースプロジェクト
で構成されており、単一でスケーラブルなシステム内にストレージ機能と計算処理機能
を統合して、ビッグデータの運用実行に求められる優れた柔軟性と経済性を提供してい
ます。
これらの機能は、時間やコストに依存する従来型のソリューションでは実現できま
せんでした。CDHは、
データ運用を支援し、以下の機能を提供することでビジネスの成長
を応援します。
HIGHLY AVAILABLE
• 単一システム内にストレージ機能とサーバー機能を統合
• ミッションクリティカルなアプリケーション
• 固定スキーマから解放し、任意のフォーマットでデータを格納
とワークロードを確実に実行
COMPATIBLE
• 既存のインフラ投資の拡張・活用が可能
OPEN
• ベンダの特定技術に依存しない、迅速な
技術革新がもたらす効果
• 総合的なAPI
• バッチ処理、アナリティックSQL、インタラクティブサーチ、機械学習、ストリーム・
プロセッシング、さまざまなサードパーティーアプリケーションなど、多種多様な
フレームワークを単一のデータプールで処理します
• リニアなスケーラビリティを保持しながらインプレースでデータを並列処理
• 必要とするユーザーやアプリケーションにデータをリアルタイムで提供
• 既存のデータ管理システムや分析ツールとの統合
CDHは、Cloudera Enterpriseの主要コンポーネントであり、エンタープライスデータハブ
アーキテクチャとして、Hadoopのコア要素である「スケーラブルなストレージ」
「分散
コンピューティング」のほか、企業が必要とする「セキュリティ」
「高可用性」
「幅広い分
野にわたるハードウェア/ソフトウェアソリューションとの統合機能」
を提供します。CDHは、
特定のベンダの技術に依存することなく、安定性が高くて実証済みのオープンソースの
ビッグデータ管理ソリューションを探している企業にとっての理想形であり、オープン
“データはビジネスに不可欠なもの。
CDHは、当社の分析エコシステムの
中心的な存在だ“
Nokia
ソースコミュニティの絶え間ない革新技術を利用しながら本番環境でHadoopを利用する
企業のための信頼性の高い優れたソリューションです。
プロセス
ディスカバー
モデル
サーブ
データ投入
分析
機械学習
SAS, R,
Spark, Mahout
データベース
Sqoop, Flume
データベース
データ変換
MapReduce,
Hive, Pig, Spark
検索
Impala
HBase
ストリーミング
Spark Streaming
Solr
セキュリティと管理
NoSQL
YARN, Cloudera Manager,
Cloudera Navigator
無制限のストレージ HDFS, HBase
図1:Cloudera Enterprise は、100% オープンソースの Hadoop ディストリビューション、システム管理、データ管理、さらに
総合的なサポートを、強力なデータ管理プラットフォームとして統合したものです。
DATA SHEET
即導入できる、最も進化したHadoopベースのプラットフォーム
CDHは本番環境でのHadoop利用に必要なすべてを備えているオープンソースのプラットフォームです。すべてを統合してパッケージ化し、徹底的に
検証し、
ドキュメントも整備されている完全ソリューションです。CDHは、行き当たりばったりのHadoop開発ではなく、ビッグデータによって現実のビジ
ネス課題を解決することで成功への最短距離を提示します。
CDH プロジェクトとその概要
プロジェクト名
概要
CDH 5.3
CDH 5.4
Apache Avro
データをストアおよびネットワーク転送する際のシリアライゼーションシステム
v1.7.6
v1.7.6
Apache Crunch
MapReduce およびSparkパイプラインのコーディング、テスト、
さらに実行を行なうための
Javaライブラリフレームワーク
v0.11
v0.11
Apache DataFu
Apache PigのためのUDF(ユーザー定義関数)
ライブラリ
v1.1.0
v1.1.0
Apache Flume
ログやイベントデータを収集・集約し、HDFSやHBaseにリアルタイムでストリーミングする
分散フレームワーク
v1.5.0
v1.5.0
Apache Hadoop
高信頼性のスケーラブルな分散ストレージと計算処理
v2.5.0
v2.6.0
FUSE-DFS
従来型ファイルシステムとしてHDFSをマウントするモジュール
v2.5.0
v2.6.0
HDFS
スケーラブルな分散アーキテクチャとフォールトトレランスを備えたHadoop分散ファイル
システム
v2.5.0
v2.6.0
MapReduce
Apache Hadoopの分散コンピューティングフレームワーク
v2.5.0
v2.6.0
MapReduce 2 (YARN)
次世代のMapReduceフレームワーク
v2.5.0
v2.6.0
Apache HBase
リアルタイムにデータ読み出し/書き込みができる、
スケーラブルなレコード/テーブルの
ストレージ
v0.98.6
v1.0
Apache HCatalog
Hadoop内のデータに対し、テーブルおよびストレージ管理サービスを実行
Apache Hive
に含まれる
Apache Hive
に含まれる
Apache Hive
SQLライクなインタフェースと、BIアプリケーションとHadoopを連携するODBC/JDBCドライバ
を備えたメタデータリポジトリ
v0.13.1
v1.1
Cloudera Hue
ApacheライセンスのブラウザベースHadoop用デスクトップ・インターフェイス
v3.7.0
v3.7.0
Cloudera Impala
ApacheライセンスのHDFSまたはHBase内データに対するリアルタイムSQLベースのクエリ
エンジン
v2.1
v2.2
Apache Kafka
スケーラブルでフォールトトレラントなパブリッシュ-サブスクライブ型メッセージング
システム
v1.2.0
v1.3.0
Kite
Hadoop のアプリケーション開発を支援するApache ライセンスのライブラリ、
ツール、実例集
v0.15.0
v1.0
Apache Mahout
Hadoopの機械学習アルゴリズムのライブラリ
v0.9
v0.9
Apache Oozie
Hadoopアクティビティを協調させるワークフローエンジン
v4.0.0
v4.1.0
Parquet
Apacheライセンスのカラム指向ファイルフォーマット
v1.5.0
v1.5.0
Apache Pig
Hadoopに格納したデータを処理する高次データフロー言語
v0.12.0
v0.12.0
Cloudera Search
CDHおよびSolr内の各種プロジェクトと統合された検索エンジン
v1.0
v1.0
Lily HBase Indexer
HBase 上 のデータをリアルタイムにインデクシングするための Apache ライセンス
モジュール
v1.5
v1.5
Apache Solr
フリーテキストのファジーマッチ、
ファセット化検索エンジン
v4.4.0
v4.10.3
Apache Sentry (Incubating)
ImpalaおよびHiveに対するきめ細かいロールベースの認証を実現するモジュール
v1.4.0
v1.4.0
Apache Spark
サイクリックデータフローおよびインメモリ処理が可能な、高速なデータ処理エンジン
v1.2
v1.3
Apache Sqoop
リレーショナルデータベースとHadoopを統合するデータトランスポートエンジン
v1.4.5
v1.4.5
Apache Sqoop2
Sqoopのための並行処理とサーバー支援機能を提供
v1.99.4
v1.99.5
Apache Whirr
クラウド環境でHadoopを展開・実行するためのライブラリ
v0.9.0
v0.9.0
Apache Zookeeper
高信頼性を誇る分散協調サービス
v3.4.5
v3.4.5
CDH テクニカルスペック
CDH 5.3
CDH 5.4
サポートするCloudera Managerのバージョン
Cloudera Manager 5.3 以降
Cloudera Manager 5.4 以降
サポートするCloudera Navigatorのバージョン
Cloudera Navigator 2.2 以降
Cloudera Navigator 2.2 以降
サポートするオペレーティング・システム
Red Hat Enterprise Linux 5.7*, 6.4*, 6.5*
CentOS 5.7*, 6.4*, 6.5*
Oracle Linux 5.6* (UEK R2), 6.4* (UEK R2), 6.5* (UEK R2
and UEK R3)
SUSE Linux Enterprise Server 11* (SP2以降)
Debian 7.x*
Ubuntu 12.04* (Precise), 14.04*
* 64ビット版のみ
Red Hat Enterprise Linux 5.7*, 5.10*, 6.4*, 6.5*, 6.6*
CentOS 5.7*, 5.10*, 6.4*, 6.5*, 6.6*
Oracle Linux 5.6* (UEK R2), 6.4* (UEK R2), 6.5* (UEK R2 and UEK R3),
6.6* (UEK R3)
SUSE Linux Enterprise Server 11* (SP2以降)
Debian 7.x*
Ubuntu 12.04* (Precise), 14.04*
* 64ビット版のみ
サポートするJDK
JDK1.7, JDK1.8
JDK1.7, JDK1.8
サポートするインフラ
Apache Maven
Apache Maven
対応クラウド・プラットフォーム
Amazon EC2, SoftLayer, Microsoft Azue
Amazon EC2, SoftLayer, Microsoft Azure
cloudera.com
Cloudera株式会社
〒104-0031 東京都中央区京橋2-7-14 ビュレックス京橋211
© 2015 Cloudera, Inc. All rights reserved. ClouderaおよびClouderaのロゴはCloudera株式会社の商標として米国その他の国に登録されています。その他
の商標については、その商標が表す企業に帰属します。
このデータシートの情報は事前告知なしに変更される場合があります。
ご質問は[email protected]までご自由にお寄せ下さい。
またClouderaニュースレターについては、
[email protected] に「ML_SUBSCRIBE」
という件名でメールをお送り下さい(本文不要)。
cloudera-datasheet-cdh5-107