データアクセスを最大限に活かす Sandra Swanson

データアクセスを最大限に活かす
Sandra Swanson
:
薦
推
セルフ
サービス
分析
Talend Data Fabricは、データに基づく意思決定を実現
するための完全なプラットフォームを提供します。
Talend Data Fabricが実現するリアルタイムソリューション、
製品のレコメンド、予測分析、不正検出、
リスク管理、
ダイナ
ミックプライシング等の多くの付加価値は、状況の変化へリ
アルタイムで対処可能な組織へ変革します。
全てのデータを統合
リアルタイム
インサイトに基づくアクション
ビッグデータ
統合
クラウド
統合
データ
統合
マスタデータ
管理
アプリケーション
統合
セルフサービス分析
データアクセスを最大限に活かす
Sandra Swanson
セルフサービス分析
著者:Sandra Swanson
©2016 Talend Inc.
本資料は原文(英語版)Self-Service Analytics ©2016 O’Reilly Media, Inc. の認可された翻訳版です。
本翻訳版は、出版および販売の権利を有する O’Reilly Media, Inc. による許可の元に制作されています。
©2016 Talend Inc.
Authorized Japanese translation of the English edition of Self-Service Analytics ©2016 O’Reilly Media, Inc.
This translation is published by permission of O’Reilly Media, Inc., which owns or controls all rights to
publish and sell the same.
編集者:
Tim McGovern
内部装丁デザイン:
David Futato
表紙デザイン:
Randy Comer
発行者及び著者は、本書に含まれる情報及び指示が正確であることを確実にするために誠実な努力を払っ
ていますが、発行者及び著者は、本書の使用または依拠に起因する損害の責任を含むが、これに限定され
ない、誤謬または脱落に対するあらゆる責任を放棄します。
本書に含まれる情報及び指示の使用は、自己責任で行ってください。
本書に記載されているコードサンプルやその他の技術がオープンソースライセンスや他者の知的財産権の
対象である場合、その使用がそのようなライセンスや権利に準拠していることを確認するのは使用者の責
任です。
表紙イメージ :
Nicholas Boos:"La Boqueria"(CC BY)
* オリジナルの彩度を減じて使用
Nicholas Boos
https://www.flickr.com/photos/subpop77/
"La Boqueria"
https://www.flickr.com/photos/subpop77/3507769435/
CC BY
https://creativecommons.org/licenses/by-nd/2.0/
目次
セルフサービス分析
1
十分な検討と意見収集による適切なツールの提供
1
事業部門ユーザーへのデータ中心ツールの移行
3
「What-If」探索を拡大するためのパスの作成
4
メタデータの利点
6
データリテラシーの文化の啓発
7
データガバナンスの重要性
8
IT 部門との協業
10
集中化の堅持とサイロの回避
10
V
セルフサービス分析
現在、組織はかつてないほど膨大なデータを利用できるようになっています。
しかし、それによって必ずしもビジネスの知見が急拡大するわけではありません。
Forrester Research の調査では、企業が分析しているデータの割合は 12% 程度にとどまってい
ます。
組織がデータ駆動型の文化を強化していくうえで注目されるようになってきているのが、セル
フサービス分析です。
このアプローチによって、企業内のより多くの人々がデータにアクセスし、個別のデータソー
スを組み合わせて独自にカスタマイズした分析を作成できるようになります。
「この分析へのアプローチにより、IT 部門の支援を仰ぐことなくデータにアクセスして利用でき
るようになります」と述べるのは、Talend 社の製品マーケティング担当ディレクター、JeanMichel Franco 氏です。
「必要な情報を見つけることで自律的に活動できるので、レポートやダッシュボードの作成だけ
でなく、分析に必要なデータセットの収集、形成、関連付けを他者に行ってもらうのを待つ必
要がなくなります。」
十分な検討と意見収集による適切なツールの提供
米国シカゴ市のチーフデータオフィサー、Tom Schenk 氏は、データアクセスの拡大によるメ
リットを実際に認識しています。
シカゴ市では、ごみ収集から警察や消防のような公安サービス、図書館、建築検査官まで、30
の部局で 33,000 人の職員が活動しています。
「シカゴ市のような大規模組織では、個々のユーザーがデータにアクセスでき、局長や上司の質
問に対応できることが不可欠です」と、Schenk 氏は語ります。
33,000 人の職員全員というわけではありませんが、数百人の職員がデータにアクセスできるよ
うになっています。「これによって、業績指標のような基本的なデータを活用して関係部局が意
思決定を推進できます。」
1
セルフサービス型への移行によって、市の職員はそれぞれの所属部局に対する応答力が高くな
り、必要なデータを他者から提供されるまで待つことがなくなりました。
Schenk 氏は、セルフサービスの真の利点は、多変量解析により一連の変数から相関を導き出す
ことができる点であると指摘しています。
同氏の組織は、特に予測分析の分野でこの機能を提供することを目指しています。
シカゴ市はすでに、予測分析を使用して食品違反が最も起きやすいレストランを特定するため
に役立てています(天候、近隣でのごみ関連の苦情などの変数を使用)。
3-40 人ほどの検査官で 15,000 件以上の飲食店を監督しなければならない状況を考えると、
この機能には非常に大きな意義があります。
「現在は人的介入の余地が大きく、このような調査プロジェクトに多くの時間を割く必要があり
ます」と、Schenk 氏は説明します。
その代わりに、分析への依存度が高い作業の一部に機械学習などの手法を用いて、セルフサー
ビスのアプローチをとることが可能になりつつあります。
ほとんどすべての自治体が何らかの検査を実施する責任を担っていることに触れ、「そのような
段階に到達することを目指しています。そうすることで長時間を費やす必要がなくなります」と、
同氏は展望します。
セルフサービスのアプローチにより、これらの検査の効率が大きく改善されると考えられます。
効果的なセルフサービスを実現するには、データ探索のために適切なツールをユーザーが使用
できるようにすることが大きな課題となります。
「完備されたツールセットを利用できることは、個々のユーザーがデータを使いこなすうえでの
鍵となります」と、Schenk 氏は語ります。
これを達成する最善の方法は、多様なツールを単に提供するのでなく、実際に必要とされるツー
ルを提供することです。
そのためには、ユーザーの声に注意深く耳を傾ける必要があります。
Schenk 氏は、アドバイザリーグループを結成して、ユーザーから継続的にフィードバックを受
けることを推奨しています。
「たとえば、マッピングは市の事業運営に非常に重要ですが、他の組織では必要ではないかもし
れません。」
Schenk 氏はまた、簡単なデモだけでツールを購入して導入すれば済むのでなく、ツールを十分
に試すことが重要だと指摘しています。
「実用的な視覚化ツールを必要としているのであれば、適当に 1 つ選んで実装するだけでは意味
がありません。」
いくつか試験的に使ってみて、ユーザーにとって最も効果的なものがどれかを判断する必要が
あります。
また、意図されていない方法でツールを使用している従業員に注意し、未対応のニーズを掘り
起こすうえでの手がかりとします。
Schenk 氏は、そのようなことが起こっている状況を何度か見て、根底により深い問題があるこ
とに気付きました。
たとえば、シカゴ市のある職員は大変な手間をかけてダッシュボードのようなレポートを作成
していました。
2 セルフサービス分析
これはかなりの時間と能力を擁するものでしたが、これによって適切なダッシュボードアプリ
ケーションがなかった場所が明らかになりました。そのようなアプリケーションが存在してい
れば、作成者は時間をかけずに利用可能なデータに集中できたはずでした。
「私たちが適切なツールセットを提供していなかったという問題を表していたのです」と、同氏
は述べています。
「これらの部局の職員が仕事をしやすいように、私たちにできることは何かという点に注意を
払っています。」
ユーザーの声を聞かなければ、セルフサービス分析の試みは成功しません。したがって、エン
ドユーザーサービスは非常に重要です。
Yahoo! 社のクラウド/ビッグデータプラットフォーム(Cloud and Big Data Platform)製品管
理担当シニアディレクターの Sumeet Singh 氏は、「セルフサービス」という言葉はデータ民主
化の重要な側面を的確に表していないという理由から、使用には消極的です。
「データ使用を拡大するには、いかに使いやすいかが重要です」と、Singh 氏は述べます。
Yahoo! 社のデータプラットフォームは、豊富な知識を持ちデータに熟練したエンジニアから、
あまり知識のないセールス/マーケティング担当者まで、多様なエンドユーザーに対応してい
ます。
その使いやすさを実現するために、Singh 氏の組織は「ツールにとらわれない」体制に変わり
ました。つまり、従業員がさまざまな種類の BI 及び分析ツールをプラットフォームに持ち込む
ことができるようにしているのです。
「SAP、Excel、Tableau など、任意のツールを使用できます。」
各ツールの学習曲線は大きく異なるため、これは重要です。
このアプローチにより、従業員は快適にツールを使用できます。
「これを Data to Desktop と呼び、データ形式や使用方法をユーザーの希望に合わせてデスクトッ
プにデータを提供します」と、Singh 氏は説明します。
それまで、Yahoo! 社のプラットフォームの使い易さに問題があると、従業員は同社の中央報告
チームに連絡をとって要望を出していました。
要望が複雑な場合は、カスタマイズされたレポートソリューションを完成させるのに 6 か月か
かることもありました。
しかし現在では、わずか 10 秒で実現可能となっています。
「カスタムの要求に基づく環境では、データ及びレポートツールの知識を持つ中央チームが社内
のユーザー向けにレポートを作成します。このような環境とセルフサービス環境とはまったく
異なるものです」と、同氏は語ります。
「前者のモデルは存続可能なものはなく、必要とされる迅速な対応をとることができませんでし
た。」
事業部門ユーザーへのデータ中心ツールの移行
データ主導の意思決定に焦点を当てる組織が増え、データアクセスの需要が拡大しています。
事業部門ユーザーへのデータ中心ツールの移行
3
そのようなデータ中心ツールの事業部門ユーザーへの移行を認識している Talend 社の JeanMichel Franco 氏は、「たとえばマーケティング部門は、マーケティング上のすべての意思決定
をデータにより検証可能なものにしたいと考えるでしょう」と述べます。
Talend 社は、ユーザーが使用可能な情報を準備できるように組織を支援するデータ統合機能を
提供しています。
「仕事をこなすためだけであっても、データアクセスがますます必要になっています。日常業務
の一部であれば、第三者には依存していられません。」
Franco 氏は、これをマネージャーが負う財政上の責任になぞらえて、マネージャーが自律的に
損益を管理しながら会社規則にも準拠する能力が求められるように、データの使用でも同じこ
とが起こっていると説明しています。
アクセスと分析のほかに、セルフサービス型のデータ準備は次なる新しい領域であり、新しい
と同時に急成長している市場です。
Gartner 社は次のように予測しています。
「2017 年までに、組織の大半のビジネスユーザーやアナリストはセルフサービスツールを使用
して分析用のデータを準備します。」
これは、IT 部門から事業部門へのさらなるパワーシフトを意味し、より迅速でカスタマイズさ
れたデータプロビジョニングという利点がもたらされます。
より広範なデータアクセスへの移行は、必要に応じて顧客に追加のガイダンスを提供するため
の組織の取り組みを反映しています。
Franco 氏は、パーソナライズされたガイダンスを顧客に提供する必要性を抱える医療サービス
企業を、Talend 社の製品ユーザーの一例として挙げて説明しています。
「アシスタントは、個人が加入する保険に応じて利用する病院を判断する必要があるため、最良
の助言を提供するには多くのデータをすぐに利用できなければならず、また俊敏なデータアク
セスを必要とします。」
今日の顧客は多くの業界からより多くのガイダンスを期待していると、同氏は述べています。
この要求に応えるためには、組織は従業員が使用可能なデータ量とアクセスを拡大する必要が
あります。
「What-If」探索を拡大するためのパスの作成
金融取引業規制機構(FINRA)は、証券業界を規制する非営利組織であり、膨大のデータに対
して速度と精度のニーズをバランスさせる必要があります。
金融市場で詐欺や操作が行われていないかを監視する中で、毎日約 60 億株近くの取引を監視し、
約 6 テラバイトのデータを処理し、多様な株取引やオプション取引や債券市場からデータセッ
トを取り込む必要があります。
4 セルフサービス分析
およそ 2 年前、FINRA がプラットフォームのアップデートを開始したとき、セルフサービス分
析はその背後にある全体的な戦略の一部でした。
FINRA の事業は市場規制とメンバー規制の 2 つですが、それぞれがインサイダー取引、市場操作、
コンプライアンスなどに特化したさまざまな作業グループを抱えています。
つまり、0.5 秒で行われる活動を対象とするユーザーがいる一方で、1 年にわたる活動を精査す
るユーザーも存在するのです。
FINRA の市場規制技術担当シニアディレクターである Scott Donaldson 氏は、「質問は多岐にわ
たり、ユニークです」と語ります。
「従来のプラットフォームは、データを取り込んで分析モデルを構築するものでした。
しかし、ようやく構築したかと思えば、ユーザーからは別の質問が出されるという状況でした。
これでは非常に時間がかかってしまいます。
これらの情報要求は、基本的にはすべてが小さなテクノロジープロジェクトでした。」
更新されたプラットフォームにより、FINRA の従業員は適切なデータを使用して自らの質問に
対処できるようになり、IT に電話をかける必要がなくなりました。
この目的のために開発された Diver というアプリケーションによって、ユーザーが FINRA の膨
大なデータの何兆ものレコードからデータスライスを取得できるようになりました。
FINRA がプライベートデータマートと呼ぶこれらのデータチャンクは、ユーザーの問い合わせ
に応じて 100 個のレコードを含むことも数十億個のレコードを含むこともあります。
ユーザーは、そのデータセットを取得して調査し、一連の調査を実行できます。
「私たちはこれを、ユーザーとデータの対話と呼んでいます」と、Donaldson 氏は語ります。
「データを使っているときには、データに対して質問したいと考えるでしょう。」
アナリストが時間の経過とともに注文に何が起こったかについて全体像を迅速に把握できれば、
ルール違反が起きたかどうかを判断するうえで役立ちます。
「ユーザーにはより直感的な探索的分析が提供されます」と、Donaldson 氏は述べます。
ユーザーは、詐欺や操作が発生していないかどうかを判断するうえで重要となる「What-If」の
質問をさらに投げかけることができるようになりました。
「完全性と正確さは非常に重要です」と、Donaldson 氏は続けます。
「特定の時点での注文を対象としている場合も、他のすべての注文や、その市場や他の取引所で
の状況を考慮する必要があります。」
これは、ユーザーが複数のレベルでコンテキストを照会して構築する必要があることを意味し
ます。たとえば、特定の時点でのさまざまな市場条件、特定企業の市場操作となり得るパター
ンや行動といった要素を検討する必要があります。
「What-If」探索を拡大するためのパスの作成
5
「私たちがデータ使用における障壁を低くすることで、ユーザーはより複雑な分析を大規模に行
うことができます。」
セルフサービスによって、IT が数時間または数日かかって完了していたような要求を、ユーザー
が数秒で実行できるようになっています。
メタデータの利点
FINRA は、ETL からユーザーとデータの最後のやりとりまで、メタデータを追跡します。
これによって FINRA は、データが従業員の仕事にどのように役立つかについてより多くのこと
を学ぶことができるため、最終的にはユーザーエクスペリエンスが向上します。
「エンドユーザーの視点で、ユーザーがどのようなクエリパラメーターを含めたか、データに対
してフィルタリングやソートなど、どのような操作を実行したかをすべて追跡しています」と、
Donaldson 氏は説明します。
「そのような機能を私たちが提供することにより、必要に応じて 1 年後でも同じ手順を再現でき
ます。」
Donaldson 氏と彼のチームは、ユーザーによるデータ使用状況を観察し、ユーザーエクスペリ
エンスを簡素化するパターンを探します。
「ユーザーが集計ステップや要約を常に実行しているのであれば、それは私たちがユーザーのた
めに実行すべきものかもしれません」と、同氏は述べます。
「重要なのは俊敏性と適応性です。
私たちは、ユーザーの行動を常に監視し、プラットフォームで提供すべき将来の機能や、他に
使用すべきデータモデルについて見極めようとしています。10 人中 9 人が同じことを実行して
いるのであれば、それは自動化の対象になり得ると考えることができます。
それによって、結果的にプラットフォームの効率がさらに向上します。」
Yahoo! 社は、約 3 年前から中央メタストアにデータを登録するようユーザーに奨励しています。
これによって従業員は、個々のクラスターを参照して利用可能なデータセットを確認したり、
特定のデータセット(クリックストリームデータの「オーディエンス」など)に関連付けられ
る一般的な語句を検索することもできます。
Yahoo! 社の Singh 氏は、「当社のすべてのデータを中央ストアに登録すれば、カタログを集中
管理された方法で公開できます」と述べます。
スキーマ、セマンティクス、データに関するあらゆる種類の詳細は、従業員が透過的に利用で
きます。
「しかしデータを公開しているわけではありません」と、Singh 氏は説明します。
「データに関する情報を公開しているのです。」
従業員が仕事上価値のあるデータセットを見つけた場合、そのデータセットを参照及び検索す
るために、使用している同じポータルからのアクセスを要求できます。
6 セルフサービス分析
このプラットフォームを使用している従業員の数はこの 2 年間で急増していますが、Yahoo! 社
の推進の取り組みがなければ実現しなかったであろうと Singh 氏は考えています。
「かつて、マーケティングや販売担当でプラットフォームを使っていた人は存在しませんでした。
これは、技術的熟練が必要であるか、または難しすぎると考えられていたためです」と、Singh
氏は振り返ります。
「しかし、そのような状況は変化しました。部下にレポート作成を求めるのではなく、自ら実行
できるようになったのです。
Hadoop のジョブを実行するシニアバイスプレジデントもいるほどです。これが、プラット
フォームを利用できることの利点です。」
Singh 氏は、最も価値のあるのはデータそのものではなく、データの状況を追跡する機能であ
ると見ています。
特定のファイルを誰が開いて何をしたのかといった細かいレベルまで、必要に応じてプラット
フォームでの個人の活動を監視できます。
数十億のファイル、3,000 人のユーザー、600 テラバイトのストレージスペースを抱える
Yahoo! 社の場合、プラットフォームを監査する適切な機能がなければ、セルフサービス環境の
活用は非常に困難になると考えられます。
「過去 3 か月間にこのデータセットに誰がアクセスしたかという質問に対して迅速に答えを出す
ことができるのは、非常に重要です。
たとえば、法令遵守への対応や消費者のプライバシー保護のための臨時監査に役立ちます。」
ほとんどの組織では、そのような監査を迅速に行う簡単な方法がなく、それが大きな問題となっ
ていると、Singh 氏は述べます。
「セルフサービスへの移行が進むにつれて、監査能力は重要となります」と、同氏は語ります。
「ユーザーによるデータへのアクセスと使用が大幅に簡単になる一方で、セキュリティのリスク
が拡大する点が落とし穴の 1 つです。」
セキュリティとアクセスという競合する課題を解決する最善の方法は、監査と監視です。
データリテラシーの文化の啓発
データへのアクセスを民主化するために、組織が従業員をデータ専門家に変える必要はありま
せん。
しかし、ベースラインのデータリテラシーを育成することが、特に意思決定者にとって重要で
あると、眼鏡の小売企業、Warby Parker 社でデータサイエンス担当ディレクターを務める Carl
Anderson 氏は述べます。
同社は店舗データへのアクセスを拡大し、各店舗マネージャーが来店客数と売上高やスタッフ
数との相関を把握できるようにしました。
「オープンサービスの文化があれば、誰もがビジネスインテリジェンスツールを使用するスキル
を習得することが望ましくなります」と、Anderson 氏は語ります。
これは、意思決定者の間で広範なデータリテラシーを実現することを意味します。
これらの意思決定者は、分析を行って重要な戦略的決定を下す当事者ですが、その多くはデー
タに関する知識を持たないと、Anderson 氏は指摘します。
データリテラシーの文化の啓発
7
意思決定者やマネージャーが習得すべきスキルはいくつかあります。
Anderson 氏は、Warby Parker 社のマネージャーや意思決定者がそのようなスキルを学ぶため
のクラスを開設しました。さらに同社は、実験的なデザインに関する社内文書も用意し、広範
に使用しています。
「意思決定者はデータに懐疑的でなければならず、少なくとも実験的デザインについて確固とし
た知識を持っている必要があります。
データを拡大解釈していないかどうかを、意思決定者が判断できることが求められます。」
これらのクラスは、Warby Parker 社がデータ分析を評価する共通言語と幅広い能力を実現する
ための 1 つの方法となっています。
データガバナンスの重要性
データアクセスの拡大を検討する企業は、データのセキュリティと品質を確保するために、ま
ずデータガバナンスのプロセスを慎重に検討する必要があります。
セルフサービス環境では、レポートの精度が大きな問題となります。
Gartner 社の調査担当バイスプレジデント、Kurt Schlegel 氏は、経営会議でセルフサービスの
BI データが一致しないことがわかったときに、初めて精度の問題が検出されることが多いと述
べています。
Schlegel 氏は、パフォーマンス管理と意思決定の支援のために、組織がデータをどのように報
告し、分析するかを調査しています。
「この問題は、SQL ステートメントが行と列を返すために正しく見える一方で、論理的欠陥が隠
れているレポートをエンドユーザーが作成することに起因しています。
多くの場合、これらはファクトテーブルとディメンションテーブルの結合の誤りによって過大
評価または過小評価された指標によって起こります」と、Schlegel 氏は説明します。
これらの問題は識別が難しいために欠陥のあるレポートで検出されずに残されることがあり、
これを下敷きに重要なビジネス上の意思決定が下される可能性があります。
解決策として、単純なセマンティックレイヤーのみ、つまり基本的なディメンションテーブル
を使用する単一のファクトテーブルをレポート作成用としてビジネスユーザーに提供する方法
を、Schlegel 氏は提示しています。
もう 1 つのアプローチとして、Schlegel 氏は、臨時の報告や分析を事業運営のための SoR
(Systems of Record)として使用すべきではないという認識を組織文化として確立することを
提案しています。
「ユーザーが独自のレポートを作成してパブリックフォルダーで共有できるようにすることで成
功を収めている企業には、これらのレポートが厳格な検証プロセス(通常は中央 BI チームが実
施)を経る場合を除いて、予備的な結果を含むものとして扱われるべきであると理解する組織
文化があります」と、同氏は述べています。
「これらのレポートは、検証されて初めて SoR フォルダーに配置されます。」
8 セルフサービス分析
FINRA の Donaldson 氏は、セルフサービス環境における厳格なデータガバナンスの必要性を強
調しています。
「セルフサービスについては、さまざまなデータセットにツールを指定するだけでデータを自在
に利用できるようになると誤解されていることがあります」と、同氏は語ります。
しかしこれは、データガバナンスにどのように対応し、データの解釈にばらつきがないように
どのように確認するのかという重大な問題につながると、Donaldson 氏は指摘します。
「データの内容、及びデータが実際に意味するセマンティクスに関して、全員が等しい認識を持っ
ているわけではありません。
したがって、安全対策と保護の枠組みを設けることが非常に重要となります」と、同氏は述べ
ます。
市場システムが異なれば、注文の種類にも微妙な相違があります。しかし、そのわずかな違い
を認識していない FINRA のユーザーがいる可能性もあるので、Donaldson 氏のチームは正規化
と標準化によりデータの取り扱いを等しくする必要があります。
FINRA は、最終的に仲裁や法的罰金の対象となる可能性がある違反を特定する役割を担ってい
るため、正確を期することが重要です。
Donaldson 氏は、「データのセマンティクスは非常に重要であり、セルフサービス分析と併せ
てすべて一貫性のある形で確実に保持する必要があります」と説明し、データが使用されるた
めには信頼性が求められると指摘します。
これは、業界が要求するどのような基準にも、組織がガバナンスを適合させる必要があること
を意味します。
Donaldson 氏は、
「高度に規制されたこの業界では、データの誤差は許容されません」と語ります。
「マーケティングでは、たとえば特定のシャツを購入する顧客は特定の靴を購入する可能性があ
るなど、確率的要素を扱うことになります。
要求される活動タイプによって、そのデータガバナンスの側面が定義されます。」
ほとんどの組織では、ガバナンスを課題とみなしています。
しかし、最初からガバナンスに注力していれば、それが恩恵の大きなものであると認識するは
ずであると、Singh 氏は述べます。
「ガバナンスに基づいて適切にプロセスを設計することで、驚くほど役に立ちます。」
いくつかの基本的なステップを踏むことが、組織のデータガバナンスへの対応に役立ちます。
「1 つは非常に単純な分類です。たとえば、感度のレベルや誰かがアクセスした場合の影響を分
類します」と、同氏は説明します。
たとえば、一部の財務データについては、株取引のブラックアウトが適用される内部関係者と
して扱われることに同意する限り、アクセスが可能となる場合があります。
データガバナンスの重要性
9
IT 部門との協業
組織がセルフサービスを検討する際には、IT(またはデータの配信を担う他の組織)の必要性
が排除されないことを覚えておく必要があります。
その代わりに、新しいコラボレーションの方法が必要とされます。
Talend 社の Franco 氏は、
「セルフサービスは、特に IT 担当者にとって脅威と受け取られること
があります」と語ります。
これは、セルフサービスが完全に DIY 式のデータエクスペリエンスであり、制御とセキュリティ
の面で混乱を招く可能性があるという誤解から生まれます。
「セルフサービスのデータ準備ツールを使用することで、アナリストは、認められたソースとし
て IT から提供されたデータを含めることができるデータインベントリを作成できます。つまり、
このようなデータインベントリは使用準備が整っており、品質水準が保証され、詐欺的な使用
から保護されているのです。これらの機能により、ユーザーは単なる原材料ではなく再利用の
準備ができている付加価値のあるデータセットを得ることができ、IT はデータの使用状況を制
御できます。データガバナンスの必要性に対する認識につながるため、セルフサービスと DIY
式の区別は重要です。」
セルフサービス環境によって、IT には異なる役割が生まれます。
「これまでは、ユーザーが必要とする情報は IT 部門が提供していました」と、Franco 氏は述べ
ます。セルフサービスでは、IT はガイダンスを提供し、ユーザーの自律的活動を支援します。
IT は、ルールと標準を遵守しながら、ユーザーがデータ目標を達成するのを手助けするチェン
ジエージェントとして機能します。「セルフサービスは、事業部門か IT かの競合状態として考
えられる場合もありますが、両方であるべきというのが真の答えです」と、Franco 氏は説明し
ます。
集中化の堅持とサイロの回避
ほとんどの企業ではデータが断片化して孤立していますが、そのような状況には大きな問題が
あると、Yahoo! 社の Singh 氏は述べます。組織がセルフサービス環境を構築する際は、これを
避ける必要があります。企業は最初に取り組むべきこととして、「あらゆるデータから価値を最
大限に引き出せるようにプラットフォームを構築するにはどうすべきかという点を考える必要
があります。
しかし、これを考慮する企業はほとんどありません」と、Singh 氏は述べます。企業データを
1 か所にまとめることには、大きな重要性があります。セルフサービスを実現するうえで、こ
れがデータを使いやすくするための第一歩となります。
組織が収集するデータの複雑さを考慮すると、データのサイロよりも単一プラットフォームで
データを検索する方がはるかに容易です。このように集中化されたデータは、データレイクま
たはエンタープライズデータハブとも呼ばれる場合もあります。これはデータを統合するとい
う考え方であり、これによってユーザーは組織全体のデータを簡単に発見できます。
10 セルフサービス分析
Singh 氏の組織は Hadoop とオープンソースを採用していますが、すべての企業がこれに該当
するわけではないことを認識しています。
「プラットフォームを構築するときにデータを集中管理することに重点を置く限り、組織は適切
なツール選択を行うことができます。」
Singh 氏の組織では、データへのアクセスが増えたことで、ビジネスの意思決定に関する議論
がより効果的になりました。
「2 時間分の議論が必要とされていた問題の討議が、今は 10 秒で終わります」と、彼は述べます。
「たとえば、ユーザーは特定の機能をリリースしたときにエンゲージメントがどのように変化し
たかを説明できるようになりました。それが特定の製品の成功に直結するわけではありません
が、少なくとも何が効果的で何に効果がないかが明確になりました。より多くの意思決定が、
勘、経験、予感といったものではなくデータに基づいて推進されるようになっています。これは、
組織にとって大きな価値があります。」
集中化の堅持とサイロの回避
11
著者紹介
Sandra Swanson は、報道のために飛行機から飛び降りたこともあります(それはスカイダイ
ビングの記事の仕事でした)。
それ以来、Swanson は時速 200 キロで急降下しなくても活力の出る多数の仕事との出会いを経
験してきました。
シカゴを拠点とするライターとして、Swanson はテクノロジー、科学、ビジネスを扱う多数の
著作を発表しています。
また、その中で予期せず出会うトピックにも熱心に取り組んでいます。
たとえば、ScientificAmerican.com 向けの記事「Toys That Inspired Scientific Breakthroughs(科
学の飛躍的躍進を引き起こす玩具)」などを執筆しています。
Twitter(@saswanson)または自身の Web サイト(www.saswanson.com)で Swanson とつな
がりましょう。
WP209-JP-17Q1