Cloudera Impala

DATA SHEET
エンタープライズの要件を満た
す、Hadoopネイティブなコンポーネント
柔軟性
• HDFSやHBaseにストアされたあらゆるデー
タに対し、インタラクティブな分析が可能
ネイティブ
• Hadoopコンポーネントと、ワークロード管
理、
メタデータ、セキュリティ、SQL構文、ユー
ザーインタフェースを共有
Cloudera Impala
Apache Hadoopのためのオープンソース分析データベース
Cloudera Impalaは、Apache Hadoop上でネイティブに稼働する分析データベースです。
Impalaは、他のHadoopフレームワークがもつ柔軟性や優れたコスト効果、パフォーマンス、
使い勝手を備えていると同時に、従来からのデータベースに使用されるSQL機能を持ってい
ます。Impalaは、Clouderaのエンタープライズデータハブに統合されており、多様なフォー
マットのファイルやデータ、メタデータ、セキュリティやリソースの管理を、MapReduceや
Apache Hive、Apache Pigなどと共有しています。
さらにImpalaは、主なサードパーティーツール
(IBM Cognos、Microsoft BI、Microstrategy、SAP BusinessObjects、SAS、Tableauなど)
と
シームレスな連携が可能であり、
これまでの投資も活かすことができます。
優れたコスト効果
従来型のDBとHadoopの特長を合わせ持つ
• データの移動、モデリング、ストレージスペー
Impalaはリリース以来、オープンソースのダウンロード数で100万件以上、業務環境での適用
例も数百件に上るなど、業界標準のSQLインタフェースとなっています。Hadoopエコシステム
のネイティブなコンポーネントとして、従来からのデータベースであれ、他のHadoopフレー
ムワークであれ、Impalaはそれらを凌ぐだけのメリットを提供します。従来のデータベースと
Hadoopの両方の特長を活かし、
さまざまな分析ニーズを持つより多くのユーザーにデータを
提供し、エンタープライズのニーズに応えます。
スを節減する、単一のストレージと分析機能
最高速
• Hadoopのスケーラビリティがもたらす、業界
最高のマルチユーザーパフォーマンス
使い易さ
• 事前定義の分析機能や既存BIツールとの連
携により、容易にデータ検索とクエリが可能
お馴染み
• 今あるSQLのスキルを活かす、標準SQLやベ
ンダー独自の拡張SQLをサポート
Hadoopの特長
エンタープライズの要件を満足
柔軟性:Hadoop上のあらゆるデータに対し、
さまざまな分析ができるよう、
構造化データ、
準構造化データ、
非構造化データをスキーマ・
オン・リードまたはスキーマ・オン・ライトで
容易に扱うことができます
優れたパフォーマンス:業界最高のユーザ
ー同時並列性能で、他に比べ30倍近い速
度を誇ります
拡張性:データの移動や変換なしに、Hadoop
のデ ータに 直 接クエリをか けられること
で、Hadoopのもつ低レイテンシさとインタ
ラクティブなパフォーマンスを維持できます
優れたコスト効果:単一のシステムで高度な
ユーザー並列性をサポート、
システムを分割
したり複数用意する必要がありません
総合的なビュー:単一のデータストレージに
対する完全な行および履歴データのクエリ
が可能。データ集約や固定スキーマによる
情報の損失がありません
オープン:Apacheライセンスのオープン
ソースとマルチベンダーサポートにより、
ベンダーロックインがありません
使い易さ:コストベースのクエリ自動最適
化機能と既存のビジネスインテリジェンス
ツールの併用で、ユーザーフレンドリーな
データ検索と分析ができます
互換性:標準SQLやベンダー独自の拡張
SQLと互換性があり、使い慣れたSQLのス
キルを活かすことができます
セキュリティ:HadoopとClouderaのセキュ
リティを連携させたとシンプルなKerberos
認証とApache Sentryによるロールベース
の認可。いずれもCloudera Managerで簡単
に設定できます
DATA SHEET
分析データベースをHadoopに実装
Impalaでは、SQL文の記述、または好みのビジネスインテリジェンスツールを使って、従来の並列RDBと同じように、Hadoopのデータにインタラクティブに
SQLを発行することができます。SQL文を作成する場合、Impalaでは標準SQLに準拠した、以下のようなコアとなるSQL機能を使用することができます:
• 分析 / ウィンドウ関数
• ディスクベースのクエリ処理
• WHERE句およびEXISTS句の相関および非相関サブクエリ
• 従来のデータベースからあるベンダー独自の拡張SQL
レイテンシを最小に抑えるため、ImpalaはHDFSのデータを(中間処理を行うSpark、Tez、MapReduceとは異なり)直接処理、HDFSのキャッシングを使用し、
クエ
リ実行中におけるメモリ内データ転送の最適化を図ります。結果的に、同様な処理を行うものに比べ、30倍も高速なパフォーマンスを発揮し、ハードウェアを効
率的に使用することができます。
HadoopのネイティブなコンポーネントであるImpalaは、同じストレージ(HDFSおよびHBase)、
メタデータおよびリソース管理 (YARN) をプラットフォームの
他の部分と共有します。セキュリティについては、Kerberos認証(Cloudera Managerにより自動化)や精緻なロールベース権限付与のためのApache Sentry
(インキュベーション中)を統合しています。
さらにImpalaは、
一般的なHadoopネイティブなファイルフォーマットに対するクエリが可能です。
テキストファイル、
SequenceFile、
RCFile、
Apache Avroの行データ
にクエリが可能で、優れたパフォーマンスを提供し、Parquetによる列指向のフォーマットによってスペースの効率的な利用を図ることができます。
こうした
ファイルフォーマットは無償かつオープンソースであり、他のクエリや、MapReduce、Hive、PigといったHadoopの他の処理機能でも使用することができます。
Impala:目的指向のフレームワーク
Impalaは、導入や利用が簡単にできるよう作られています。Impalaは、既存のHive統合との互換性を維持するため、
メタデータ、
スキーマ、
ドライバ、SQL構文
など、主要なインフラストラクチャをHiveから引き継ぐ形で拡張と強化を行なっており、追加で設計や調整、
トレーニングを行うことなく再利用と統合ができる
ようになっています。Hiveを理解していれば、Impalaに容易に移行することが可能で、優れたマルチユーザーパフォーマンスと互換性、使いやすさを手に入れ
ることができます。
ImpalaとHiveはいずれもHadoopエコシステムの中で重要な役割を果たしています。MapReduceとSparkフレームワークをベースにしたHiveは、長時間にわ
たるバッチ処理やデータ変換処理(ETL - データの抽出、変換、ロード)に最適です。Impalaは特に、Hadoopネイティブな分析データベースのために始めから
設計されたもので、単一のHadoopストレージに対して、突出したパフォーマンスと使いやすさ、拡張SQLとの互換性を提供します。Impalaの一般的な適用例
には以下のようなものがあります:
• オペレーショナルデータストア:複数のソースからデータを取り込み、内部または外部向けのダッシュボードに表示させる
• データディスカバリツール:膨大な量のデータを対象に、使い慣れたSQL機能で高速に検索を実行し、汎用的な可視化ツールにシームレスに連携
• 目的指向アプリケーション向けの分析バックエンド:1つに統一されたプラットフォームで、より多くのユーザーに低いコストでデータとシステムを提供
ClouderaのエンタープライズデータハブにおけるImpala
ImpalaはClouderaのエンタープライズデータハブにおける重要なコンポーネントであり、1つに統合されたソリューションとして、データやメタデータをスト
アし分析できると同時に、コンプライアンス対応のセキュリティやガバナンス機能、システム全般に対する管理機能を提供します。エンタープライズデータハ
ブを形成するImpalaは、世界の先端企業が、
より多くのより多様性に富んだデータから、
これまでにない価値を引き出すことを可能にします。
Cloudera Enterpriseサブスクリプション
Cloudera Enterpriseのサブスクリプションライセンをご利用いただくことで、Impalaの能力をフルに活用することができます。Cloudera Enterpriseはまた、
ミッ
ションクリティカルなアプリケーションがImpalaを十分に使いこなすための、包括的なテクニカルサポートや必要な機能を提供します。
Impalaのダウンロード
cloudera.com/downloads
cloudera.com
Cloudera株式会社
〒104-0031 東京都中央区京橋2-7-14 ビュレックス京橋211
Cloudera Liveで試す
cloudera.com/live
© 2015 Cloudera, Inc. All rights reserved. ClouderaおよびClouderaのロゴはCloudera株式会社の商標として米国その他の国に登録されています。その他
の商標については、その商標が表す企業に帰属します。
このデータシートの情報は事前告知なしに変更される場合があります。
ご質問は[email protected]までご自由にお寄せ下さい。
またClouderaニュースレターについては、
[email protected] に「ML_SUBSCRIBE」
という件名でメールをお送り下さい(本文不要)。
cloudera-impala-datasheet-105