マルチモデル、マルチワークロードの データ

ホワイトペーパー
マルチモデル、マルチワークロードの
データ プラットフォームにより
ビジネス価値を高める
概要
マルチ分析プロセス
先進的な事業体は、自社の中核となる運用システムに
分析研究の処理には、データの探求と発見、予測分析と
高度な分析を取り入れ始めています。その目標は、予測
評価、KPI(重要業績評価指標)レポートとダッシュボード
モデルからの出力結果を、意思決定に動的に利用する
表示など、さまざまなタイプがあります。事業体は、中心
ことです。これには、異なるタイプのさまざまな形で保存
的となるビジネス プロセスに対する重要性に応じて、こ
されているデータにアクセスすること、そして多くのデー
れらのチームをそれぞれに編成します。成功を収めてい
タ処理技術を使用することが必要です。革新的なアプリ
る事業体はこれらのチームを密接に結合させています。
ケーションは、IT の複雑さを回避して、トランザクション処
これは、場合によっては競合を発生させる可能性があり
理と分析の両方を同時に行うことで、ビジネス価値を提
ます。調査チームはすべてのデータに対する非構造的
供します。このことが、マルチモデル、マルチワークロー
アクセスがしたい一方、トランザクション処理チームは特
ドを可能にするデータベースを基盤としたデータ プラット
定のデータに対して組織的で予測可能なアクセスを必要
フォームの必要性を高めています。事業体は、単一の
とします。そのため、組織には、分析目的による柔軟な
データ プラットフォームへの統合を行うことで、トランザク
データアクセスに加え、トランザクション処理を高速化す
ション時に洞察を提供し、同時に、異なるテクノロジによ
る高性能なアクセスとデータ取り込みをサポートできる
る サイロを回避し、データの遅延を最小限に抑えること
データ プラットフォームが必要です。
で、新しい価値を生み出しています。
データの相互運用性
事業体の新しいデータ ソースを予測的手段に使用でき
るようになり、IT 組織には、将来のプロジェクトで使用す
るかどうかわからないさまざまな形式の膨大なデータを
保管することが求められています。従来、さまざまなデー
タタイプが別個のデータ ストアで管理されていました。そ
の結果、ビッグデータと分析は一般的にトランザクション
処理システムとは別に配備されています。このことで、ビ
ジネス トランザクションに影響を与える洞察の適用が遅
れるという結果を招いています。トランザクション処理と
分析のコンポーネントを組み合わせ、複数のデータ モデ
ルへの柔軟なアクセスをもつハイブリッド アプリケーショ
ンは、IT への負荷を増大させることなく、新しい価値の創
出機会を提供することができます。
マルチワークロードのサポート
運用プロセス、予測分析、自然言語の処理、およびデー
分析研究の処理では、分析ツールを使ったデータプラッ
トフォームとの相互運用性が必要です。このツールは、
最先端のデータ サイエンス アルゴリズムをもつ外部の
データ プラットフォームから適用する場合もあります。こ
れらのツールでは必ずしも SQL を使用する必要はあり
ません。むしろ、Spark または他の種類の機械学習ツー
ルを活用する傾向があります。成功に導くには、データ
プラットフォームは研究の側面をサポートし、同時にその
研究結果を実行する高性能アプリケーションを使用でき
る必要があります。多くの場合、データは、サード パー
ティのデータ ソースやスマート デバイスまたは IoT を介
して提供されます。これらを処理するには、データの相互
運用性だけでなくその場の状況を適用する機能が必要
です。例えば、医療機器からのデータを患者の医療記録
と組み合わせるには、医療データの相互運用性が必要
です。
タの探求には、トランザクション処理とは異なるワーク
ロードの特性や、固有のシステム レベルの要件がありま
す。個々の分析毎の要件に応えるために、多くのオープ
ン ソース プロジェクトが誕生しています。NoSQL オープ
ン ソースを利用したプログラムによるデータ アクセスが
増大しているにもかかわらず、SQL は、レポートとトラン
ザクション処理の両方で、組織のデータアクセスと処理
の中心的な方法となっています。次世代のアプリケー
ションを成功させるには、開発者が SQL クエリ によるア
クセスだけでなく、プログラムによる API アクセスによっ
て、さまざまな種類のデータ モデル、さまざまなワーク
ロード、さまざまなスキル セットをサポートすることが重
要です。
2
非構造化テキストの解明
次世代のアプリケーションは自然言語処理技術を活用し
ています。ここでの主要な要件は、同じものを意味する
単語やフレーズと関連するオントロジまたは語彙を構築
し、そのコンテキストを予測モデルで使用する機能です。
例えば、ドイツのアパート検索サービスでは、データ プ
ラットフォームを導入して、オーナーが、寝室と浴室の数
といった構造化情報と、アパートについての非構造的な
テキストを入力できるようにしています。顧客のキーワー
ド検索を分析することで、非構造的なテキストでのみ検
出された、好みに関する重要な知見が明らかになりまし
た。この検索サービスでは自然言語処理を使用して、ア
パートをインテリジェントな方法で検索できるようにしてい
多くの事業体は、トランザクション処理や運用ワークロー
ます。
ドの拡張ができるインフラストラクチャの設計に何年も費
やしています。また、研究重視のワークロードの拡張に
医療での別な例があります。医療で使用されるデータの
労力と時間を投資している事業体もあります。事業体が
かなりの部分は、非構造化のテキストとしてのみ検出さ
現在直面している課題は、この両方の要素を結合する
れます。医師は所見を書き、それがテキストとして記入さ
ハイブリッド ワークロードを処理するシステムを、いかに
れます。分析の質を向上させるには、それらの記述を診
設計するかにあります。
断や症状などの構造化されたデータに変換する必要が
あります。例えば、大手の製薬会社は C 型肝炎のリスク
業務側は、大量のトランザクションを信頼性と一貫性を
が高い患者の特定をしたいと考えていました。重要リス
もって並列処理することに集中してきました。分析側は、
ク指標の中には、投獄歴や入れ墨の数が含まれていま
少数のデータサイエンティストに代わって大量のデータ
した。こうしたデータは、一般的には、構造化された記録
を同時に処理するために、これまでバッチ指向のアプ
には含まれませんが、患者についての記述に記入され
ローチに集中してきました。この手法には大量の並列ア
ています。これらの記述の分析に自然言語処理を使用
クティビティは含まれません。メモリ、計算、およびネット
して、製薬会社は構造化されたデータだけを調べる場合
ワーキング ハードウェアの拡張については、これらの 2
よりも 50% 以上の正確さで C 型肝炎の患者を特定でき
つのアプローチの要件は異な ります。データ プラット
ます。
フォームを利用すると、ジョブに必要な適切な特性を保
ちながら、自動的に多数のサーバに対するアプリケー
タイム ラグ
データ集約のための独立したアーキテクチャとして、デー
タ レイクおよびデータ ウェアハウスがありました。ログ
価値創出への手順の能率化
データと分析が別々に保存され、トランザクション データ
次世代のアプリケーションを構築しようとしている事業体
から独立して分析される場合、タイム ラグが起こります。
は、ビジネス価値をもたらすための最も効率的な方法を
企業は、リアルタイムに起こっていることに影響を与える
考慮する必要があります。ビジネス価値は、インフラスト
ことを求めています。データ レイクおよびデータ ウェアハ
ラクチャではなくアプリケーションの開発からもたらされま
ウスには、追加のデータ統合および変換手順が必要で
す。統合されたデータ プラットフォームは、複数のデータ
す。そのため、追加のデータ フローが生じ、インライン分
モデルと処理技法の利用を簡素化して、事業体がビジネ
析を実施する機能が妨げられます。よりリアルタイムの
ス価値に集中できるようにします。インターシステムズ の
インライン分析に依存する業界 (世界金融市場、荒天警
テクノロジ ポートフォリオがその一例です。これはそのマ
報、公共事業供給業者など) は、最善の決定や予測を行
ルチモデル、マルチワークロードのデータベースである
うためにリアルタイム分析モデルを適用できるかどうか
Caché に基づいており、統合、分析、および自然言語処
にビジネスが左右されます。
理に関連するツールのエコシステムを構成します。
データ モデル全体でのセキュリティ、ガバ
ナンス、およびスケーラビリティの集中化
世界に通用するアプリケーションを構築するための要件
異なるシステムにおけるセキュリティ、プライバシ、およ
びデータ ガバナンスはより複雑です。複数のデータ シス
テムの維持に関する課題は、データ ストアごとに別個の
管理ツールとプロセスが必要であることです。集中 型
データ プラットフォームの主要な利点は、すべてのデー
タ ストアで単一のセキュリティ モデルを持つ単一の集約
されたアクセス ポイントを提供することです。データ プ
ラットフォームを使用すると、事業体はリレーショナル
データベースを超えて他のデータ モデルにもこれを拡張
できます。
3
ションの拡張を簡素化できます。
は変化しており、今後も変化を続けます。開発者がビッ
グデータを利用し、アナリティクスを活用するアプリケー
ションを構築していない場合、成功は困難です。企業は、
必要なものを総合的なプラットフォームから得られるの
か、それとも複数の別個の部分を導入することから得ら
れるのかを考慮する必要があります。長期的には、多く
の企業が、バックエンドの複雑さに対処する統合された
プラットフォームが時間とコストの節約を可能にし、この
新たなスタイルのハイブリッドの運用/分析アプリケーショ
ンの開発を加速できることに気付きます。
インターシステムズ の概要
新しいアプリケーションの開発を簡素化するためには、
ビッグデータおよび分析技術を統合したエンタープライズ
アーキテクチャに組み込む必要があります。これにより、
事業体は迅速に、コストを削減しながら新しい価値を創
出できます。
インターシステムズ は、世界で最も重要なアプリケーショ
ンに力を与えている情報エンジンです。1978 年以降、イ
ンターシステムズ は医療、金融、行政、および生活や生
命にかかわるその他の分野で、戦略的なテクノロジ プロ
バイダとしての役割を果たしています。インターシステム
事業体は、データ モデルおよび異種データ ソースにお
ズ は、米国マサチューセッツ州ケンブリッジに本社を置く
いてハイブリッド ワークロードを迅速に実装するための
株式非公開の企業で、世界各地に拠点があります。また、
最善のアプローチを考える必要があります。複数のデー
そのソフトウェア製品は毎日 100 カ国以上で何百万もの
タ ストレージおよび処理プラットフォームをまとめて導入
人々に使用されています。詳細については、
すると、アプリケーション開発のスピードを落とし、スケー
www.InterSystems.com/jp/ を参照してください。
ラビリティの問題を引き起こす可能性があります。また、
ガバナンス、リスク管理、およびコンプライアンスを複雑
にします。
データをまとめてオフラインのデータ ウェアハウスまたは
データ レイクに取り込むことは有用なことですが、複雑さ
と遅延が増大します。インターシステムズの統合データ
プラットフォームであれば複雑さを解消でき、事業体は組
織内でより多くのユーザに価値をもたらすものに集中で
きます。インターシステムズの データ プラットフォームは、
30 年以上にわたり、多くのお客様に対してこの約束を果
たしています。
インターシステムズ が迅速に、オーバーヘッドを削減し
ながら貴社の価値実現を支援する方法については、
www.intersystems.com/jp/ を参照してください。
インターシステムズジャパン株式会社
〒160-0023
東京都新宿区西新宿 6-10-1
日土地西新宿ビル 15F
Tel: 03-5321-6200
InterSystems.com/jp/
1
4
『The Digital Universe of Opportunities: Rich Data and the Increasing Value of the Internet of Things』、
IDC、2014 年 4 月