DATA SHEET エンタープライズの要件を満た す、Hadoopネイティブなコンポーネント 柔軟性 • HDFSやHBaseにストアされたあらゆるデー タに対し、インタラクティブな分析が可能 ネイティブ • Hadoopコンポーネントと、ワークロード管 理、 メタデータ、セキュリティ、SQL構文、ユー ザーインタフェースを共有 Cloudera Impala Apache Hadoopのためのオープンソース分析データベース Cloudera Impalaは、Apache Hadoop上でネイティブに稼働する分析データベースです。 Impalaは、他のHadoopフレームワークがもつ柔軟性や優れたコスト効果、パフォーマンス、 使い勝手を備えていると同時に、従来からのデータベースに使用されるSQL機能を持ってい ます。Impalaは、Clouderaのエンタープライズデータハブに統合されており、多様なフォー マットのファイルやデータ、メタデータ、セキュリティやリソースの管理を、MapReduceや Apache Hive、Apache Pigなどと共有しています。 さらにImpalaは、主なサードパーティーツール (IBM Cognos、Microsoft BI、Microstrategy、SAP BusinessObjects、SAS、Tableauなど) と シームレスな連携が可能であり、 これまでの投資も活かすことができます。 優れたコスト効果 従来型のDBとHadoopの特長を合わせ持つ • データの移動、モデリング、ストレージスペー Impalaはリリース以来、オープンソースのダウンロード数で100万件以上、業務環境での適用 例も数百件に上るなど、業界標準のSQLインタフェースとなっています。Hadoopエコシステム のネイティブなコンポーネントとして、従来からのデータベースであれ、他のHadoopフレー ムワークであれ、Impalaはそれらを凌ぐだけのメリットを提供します。従来のデータベースと Hadoopの両方の特長を活かし、 さまざまな分析ニーズを持つより多くのユーザーにデータを 提供し、エンタープライズのニーズに応えます。 スを節減する、単一のストレージと分析機能 最高速 • Hadoopのスケーラビリティがもたらす、業界 最高のマルチユーザーパフォーマンス 使い易さ • 事前定義の分析機能や既存BIツールとの連 携により、容易にデータ検索とクエリが可能 お馴染み • 今あるSQLのスキルを活かす、標準SQLやベ ンダー独自の拡張SQLをサポート Hadoopの特長 エンタープライズの要件を満足 柔軟性:Hadoop上のあらゆるデータに対し、 さまざまな分析ができるよう、 構造化データ、 準構造化データ、 非構造化データをスキーマ・ オン・リードまたはスキーマ・オン・ライトで 容易に扱うことができます 優れたパフォーマンス:業界最高のユーザ ー同時並列性能で、他に比べ30倍近い速 度を誇ります 拡張性:データの移動や変換なしに、Hadoop のデ ータに 直 接クエリをか けられること で、Hadoopのもつ低レイテンシさとインタ ラクティブなパフォーマンスを維持できます 優れたコスト効果:単一のシステムで高度な ユーザー並列性をサポート、 システムを分割 したり複数用意する必要がありません 総合的なビュー:単一のデータストレージに 対する完全な行および履歴データのクエリ が可能。データ集約や固定スキーマによる 情報の損失がありません オープン:Apacheライセンスのオープン ソースとマルチベンダーサポートにより、 ベンダーロックインがありません 使い易さ:コストベースのクエリ自動最適 化機能と既存のビジネスインテリジェンス ツールの併用で、ユーザーフレンドリーな データ検索と分析ができます 互換性:標準SQLやベンダー独自の拡張 SQLと互換性があり、使い慣れたSQLのス キルを活かすことができます セキュリティ:HadoopとClouderaのセキュ リティを連携させたとシンプルなKerberos 認証とApache Sentryによるロールベース の認可。いずれもCloudera Managerで簡単 に設定できます DATA SHEET 分析データベースをHadoopに実装 Impalaでは、SQL文の記述、または好みのビジネスインテリジェンスツールを使って、従来の並列RDBと同じように、Hadoopのデータにインタラクティブに SQLを発行することができます。SQL文を作成する場合、Impalaでは標準SQLに準拠した、以下のようなコアとなるSQL機能を使用することができます: • 分析 / ウィンドウ関数 • ディスクベースのクエリ処理 • WHERE句およびEXISTS句の相関および非相関サブクエリ • 従来のデータベースからあるベンダー独自の拡張SQL レイテンシを最小に抑えるため、ImpalaはHDFSのデータを(中間処理を行うSpark、Tez、MapReduceとは異なり)直接処理、HDFSのキャッシングを使用し、 クエ リ実行中におけるメモリ内データ転送の最適化を図ります。結果的に、同様な処理を行うものに比べ、30倍も高速なパフォーマンスを発揮し、ハードウェアを効 率的に使用することができます。 HadoopのネイティブなコンポーネントであるImpalaは、同じストレージ(HDFSおよびHBase)、 メタデータおよびリソース管理 (YARN) をプラットフォームの 他の部分と共有します。セキュリティについては、Kerberos認証(Cloudera Managerにより自動化)や精緻なロールベース権限付与のためのApache Sentry (インキュベーション中)を統合しています。 さらにImpalaは、 一般的なHadoopネイティブなファイルフォーマットに対するクエリが可能です。 テキストファイル、 SequenceFile、 RCFile、 Apache Avroの行データ にクエリが可能で、優れたパフォーマンスを提供し、Parquetによる列指向のフォーマットによってスペースの効率的な利用を図ることができます。 こうした ファイルフォーマットは無償かつオープンソースであり、他のクエリや、MapReduce、Hive、PigといったHadoopの他の処理機能でも使用することができます。 Impala:目的指向のフレームワーク Impalaは、導入や利用が簡単にできるよう作られています。Impalaは、既存のHive統合との互換性を維持するため、 メタデータ、 スキーマ、 ドライバ、SQL構文 など、主要なインフラストラクチャをHiveから引き継ぐ形で拡張と強化を行なっており、追加で設計や調整、 トレーニングを行うことなく再利用と統合ができる ようになっています。Hiveを理解していれば、Impalaに容易に移行することが可能で、優れたマルチユーザーパフォーマンスと互換性、使いやすさを手に入れ ることができます。 ImpalaとHiveはいずれもHadoopエコシステムの中で重要な役割を果たしています。MapReduceとSparkフレームワークをベースにしたHiveは、長時間にわ たるバッチ処理やデータ変換処理(ETL - データの抽出、変換、ロード)に最適です。Impalaは特に、Hadoopネイティブな分析データベースのために始めから 設計されたもので、単一のHadoopストレージに対して、突出したパフォーマンスと使いやすさ、拡張SQLとの互換性を提供します。Impalaの一般的な適用例 には以下のようなものがあります: • オペレーショナルデータストア:複数のソースからデータを取り込み、内部または外部向けのダッシュボードに表示させる • データディスカバリツール:膨大な量のデータを対象に、使い慣れたSQL機能で高速に検索を実行し、汎用的な可視化ツールにシームレスに連携 • 目的指向アプリケーション向けの分析バックエンド:1つに統一されたプラットフォームで、より多くのユーザーに低いコストでデータとシステムを提供 ClouderaのエンタープライズデータハブにおけるImpala ImpalaはClouderaのエンタープライズデータハブにおける重要なコンポーネントであり、1つに統合されたソリューションとして、データやメタデータをスト アし分析できると同時に、コンプライアンス対応のセキュリティやガバナンス機能、システム全般に対する管理機能を提供します。エンタープライズデータハ ブを形成するImpalaは、世界の先端企業が、 より多くのより多様性に富んだデータから、 これまでにない価値を引き出すことを可能にします。 Cloudera Enterpriseサブスクリプション Cloudera Enterpriseのサブスクリプションライセンをご利用いただくことで、Impalaの能力をフルに活用することができます。Cloudera Enterpriseはまた、 ミッ ションクリティカルなアプリケーションがImpalaを十分に使いこなすための、包括的なテクニカルサポートや必要な機能を提供します。 Impalaのダウンロード cloudera.com/downloads cloudera.com Cloudera株式会社 〒104-0031 東京都中央区京橋2-7-14 ビュレックス京橋211 Cloudera Liveで試す cloudera.com/live © 2015 Cloudera, Inc. All rights reserved. ClouderaおよびClouderaのロゴはCloudera株式会社の商標として米国その他の国に登録されています。その他 の商標については、その商標が表す企業に帰属します。 このデータシートの情報は事前告知なしに変更される場合があります。 ご質問は[email protected]までご自由にお寄せ下さい。 またClouderaニュースレターについては、 [email protected] に「ML_SUBSCRIBE」 という件名でメールをお送り下さい(本文不要)。 cloudera-impala-datasheet-105
© Copyright 2024 ExpyDoc