Cloudera Search

DATA SHEET
Cloudera Search
Hadoop向け検索機能の業界標準
Scalable
• Hadoopのストレージと処理機能を利用し
た、検索プラットフォームの構築
Flexible
• HDFSやHBaseに投入に保存された、あらゆ
るデータに対するインデックスとクエリ
Timely
• 検索可能FlumeとHBaseコンポーネントに
よる、準リアルタイムなデータのインデク
シング
Mature
• Solrコミュニティの豊富なエコシステムと
知識を活用
Secure
• KerberosとApache Sentryの連携による
認証とロールベースの認可
Easy to use
• ファセットナビゲーションや全文検索など、
使い慣れた機能でデータを検索し迅速に
回答を発見
Simple to manage
• Cloudera Managerから導入、運用、監視
Hadoopのためのオープンソースインタラクティブ検索
Cloudera Searchは、Apache Hadoopのネイティブな全文検索ソリューションです。
Apache SolrをベースにしたCloudera Searchは、HDFSやApache HBaseでスケーラブル
なインデクシングを行ない、ビジネスユーザーにデータを提供し、Googleと同じ感覚で
検索できるようにします。
Apache Solrは2006年のリリース以来、
エンタープライズ向けの標準的なオープンソース検索
機能になっています。
Apache Solrは、
活発で熟練したコミュニティの手で幅広い部門や業界
に適用され、
またAPIは機能豊富な拡張性の高いものになっています。Cloudera Search
は、
CDHとCloudera Enterpriseのセキュアなコンポーネントを密接に統合することで、
Apache
Solrの価値をいっそう高めています。
Searchの主な特長
Cloudera Searchを使うことで、HDFSおよびHBase上のデータを、視覚的に見つけ出す
ことができます。Cloudera Searchは、シンプルで標準的な検索用APIと、ファセット
ナビゲーションによる直観的なインタフェースから操作が可能で、他のワークロードと
連携したり補完しながら、
より複雑で大規模な問い合わせにも対応できます。Cloudera
Searchはビッグデータから得られるROIを増大し、実績と信頼ある低コストな環境を使
って、素早くインテリジェンスを提供することができます。
ネイティブな分析SQLと検索機能を持つ、100%オープンソースのビッグデータプラット
フォームと言えるのは、
Cloudera SearchとCDHの組み合わせだけです。
容易なインデックス
のストアと確かな管理、大規模クエリや検索機能の実行、さらに、バルクでのデータイン
デクシングを、オンデマンドかつリアルタイムにCDHで実行することが可能です。
こうした包括的な機能は、インデクシングのためのデータ移動を最小限に抑え、検索や
データのために複数の環境を用意するコストや手間を省くなど、他のスタンドアローン
型のソリューションにはないメリットを提供します。
• アクセス性:誰でも使 い や すい、G o o g l eライクなリアルタイムの 検 索 機 能を
Hadoopに提供。特に非構造化データに有効です
• 標準:オープンソース検索機能の標準であるSolrをベースにした、フル装備の検索
機能。エンタープライズの継続的な変革に不可欠なツールを提供
• 柔軟性:HadoopとSearchを統合し、バッチ、
リアルタイム、オンデマンドでインデク
“既存のCloudera環境にSearchを導入した
ことで、農作物の成長過程の画像をリアル
タイムにインデックスできるようになり、商
品開発を加速しています。
これは、
自然の保
全に配慮しながら、増え続ける人口を支え
る十分な量の作物を育成できるよう、農家
を支援していく、
という当社の取り組みを後
押しすることにつながっています”
Monsanto社 R&D IT ビッグデータエンジニア Jeff Melching氏
シングが可能。さらに多数のユーザーが、高速かつ優れたコスト効果でデータにア
クセスできます
HadoopでSearchを活用
Cloudera Searchは、Apache Solrの強力なSolrCloud機能やApacheの検索関連プロ
ジェクトを、CDHとCloudera Managerに統合したものです。
この統合により、他のビッグ
データアプリケーション同様、検索ライフサイクル全般を同じシステム上で、つまり、同じ
データ、
メタデータ、
フレームワークを使って実行することができます。Apache Solrプロ
ジェクトの統合には、以下のようなCDHの主要なHadoopスタックのコンポーネントが
使用されています:
• Apache HDFS: ストレージのインデクシングと可用性の担保
• Apache Zookeepr: 自動共有とレプリカの管理
• Apache MapReduce: 複数のコンテンツタイプの集約とバッチによるインデクシング
• Apache FlumeおよびLily HBase Indexer:スケーラブルで準リアルタイムなインデクシング
DATA SHEET
• Apache Oozie:ワークフローのスケジューリング
• Apache Sentry:細部にわたるロールベースのアクセスコントロール
• Cloudera Hue:カスタマイズも可能な直ぐに利用可能なUI
• Cloudera Manager:集中管理
Cloudera Searchは、Clouderaの総合的なセキュリティソリューションの一部として、
アクセスコントロールを細部にわたり定義するための認可メカニ
ズム、Apache Sentryを完全に統合しています。ImpalaやHive、
あるいはSearchのユーザーであれ、Sentryは単一のシステムでアクセスを集中管理するた
め、機密データであってもHadoop内にストアしておくことができます。
さまざまなインデクシングオプションをサポート
Clouderaの検索ソリューションは、
ビッグデータのためのスケーラブルなインデクシングオプションを提供します。Cloudera Searchは、新しいSolr Indexer
Sinkを追加してApache Solrプロジェクトを拡張、任意のFlumeアーキテクチャーで使用して、準リアルタイムのドキュメント処理とインデクシングを行なう
ことができます。
これは、
Hadoopと他のFlumeエンドポイントのストレージでデータを転送している間にインデクシングができる、
という画期的な進歩です。
Cloudera SearchをLily HBase Indexerと組み合わせ、HBaseにストアされたデータも検索することができます。IndexerはHBaseのレプリケーション
イベントを監視することで、セカンダリインデックスやHBaseデータを準リアルタイムに検索するための、独立した柔軟なソリューションを提供します。
さらにCloudera Searchは、
Hadoopの大規模なデータストア向けの、
リニアな拡張性を持つオンデマンドバッチのインデクシング機能を、
MapReduceに追加して
います。
この追加されたGoLive機能によって、稼働中の検索サービスを停止せずに、検索結果を直ちに差分更新することができます。
ClouderaのエンタープライズデータハブにおけるSearch
Cloudera Searchは、Clouderaのエンタープライズデータハブの重要なコンポーネントであり、
1つに統合されたソリューションとして、
データやメタデータ
を保存し分析できると同時に、コンプライアンス対応のセキュリティやガバナンス機能、システム全般に対する管理機能を提供します。Cloudera
Searchによって、データの扱いや検索が容易になり、情報に迅速かつ分かりやすい形で直接アクセスしたいビジネスユーザーなど、Hadoopのデータ
をより多くのユーザーに提供することができます。Cloudera Enterpriseを形成するCloudera Searchによって、世界の先端企業はそのデータの価値
を十分に活用し、広範な分析を行ない、ビジネスの可視性を向上し、コストを削減することが、
リスクコントロールやコンプライアンス要件を満たし
た上で、行うことができます。
Cloudera Enterpriseサブスクリプション
Cloudera Enterpriseのサブスクリプションライセンスをご利用いただくことで、Searchの能力をフルに活用することができます。Cloudera Enterpriseは
また、
ミッションクリティカルなアプリケーションがImpalaを十分に使いこなすための、包括的なテクニカルサポートや必要な機能を提供します。
プロセス
ディスカバー
モデル
データ投入
データ変換
分析
データベース
検索
機械学習
サーブ
NoSQL
データベース
ストリーミング
セキュリティと管理
無制限のストレージ
Cloudera Searchのダウンロード
cloudera.com/downloads
cloudera.com
Cloudera株式会社
〒104-0031 東京都中央区京橋2-7-14 ビュレックス京橋211
Cloudera Liveで試す
cloudera.com/live
© 2015 Cloudera, Inc. All rights reserved. ClouderaおよびClouderaのロゴはCloudera株式会社の商標として米国その他の国に登録されています。その他
の商標については、その商標が表す企業に帰属します。
このデータシートの情報は事前告知なしに変更される場合があります。
ご質問は[email protected]までご自由にお寄せ下さい。
またClouderaニュースレターについては、
[email protected] に「ML_SUBSCRIBE」
という件名でメールをお送り下さい(本文不要)。
cloudera-search-datasheet-104