ビッグデータからの洞洞察でビシネスを変える 方法

ビッグデータからの洞洞察でビシネスを変える⽅方法
サービス事業統括本部
ソリューションアーキテクト部
駒澤 健⼀一郎郎
“The true sign of intelligence is not
knowledge but imagination.”
- Albert Einstein
Copyright © 2015 Red Hat K.K. 2
アルゴリズム取引
出典:http://matome.naver.jp/odai/2138793458490937701
Copyright © 2015 Red Hat K.K. 3
ファクトリーオートメーション
出典:http://www.town.kaminokawa.tochigi.jp/f_̲sangyousinkou/industrial_̲products.htm
Copyright © 2015 Red Hat K.K. 4
⼯工事現場の作業
出典:https://www.pakutaso.com/20151022287post-‐‑‒999.html
業務担当者の意思決定のためのインテリジェンス
従来
現在
アクション
業務担当者
マニュアルの
作業指⽰示
業務担当者
アクション
アクション可能な
作業指⽰示
⼈人間
データ分析
分析担当者
⼈人間
IT
データ分析
⼈人間/IT
オペレーショナル
インテリジェンス
分析担当者
Copyright © 2015 Red Hat K.K. 6
オペレーショナルインテリジェンス
ビジネスインテリジェンス
• 
• 
• 
• 
戦略略的な意思決定
オペレーショナルインテリジェンス
周期的な分析サイクル
定常的なパターンを⾒見見つける •  戦術的な意思決定
BAM+CEP
データ指向
•  リアルタイムな分析サイクル
•  特別なパターンを⾒見見つける
•  イベント指向
本⽇日のトピック
Copyright © 2015 Red Hat K.K. アナリティクス
+
BRMS
7
第3のBRMSユースケース
ルールソース
BRMS
アナリティクス
+
BRMS
Copyright © 2015 Red Hat K.K. 8
意思決定のスピードは従来よりも早さが求められる
従来
収集
分析
施策
⽴立立案
実⾏行行
計測
?
⽉月次/四半期毎
現在
収集
施策⽴立立案
(パターンA)
実⾏行行
計測
施策⽴立立案
(パターンB)
実⾏行行
計測
分析
×
リアルタイム/週次
Copyright © 2015 Red Hat K.K. 9
ケーススタディ: ⼤大⼿手サービス業の例例
ビジネスの課題
Ø  当社のサービスにおける、申込者のエントリーを最適なコンサルタ
ントにアサインする仕組みが、属⼈人的で精度度が低かった
解決策
Ø  複雑なマスタテーブルとプログラムロジックをBRMSによる変更更し
やすい仕組みに置き換え
Ø  マッチングルールの変更更プロセスを統計解析ツールとBRMSにより
⾃自動化
導⼊入効果
Ø  変更更反映頻度度を⽉月次から週次に⾼高速化
Ø  マッチングの⾃自動化が4割から7割に向上
Copyright © 2015 Red Hat K.K. 10
ケーススタディ: ⼤大⼿手サービス業の例例
従来
マスターへの登録が煩雑
運⽤用担当者が
⼿手作業でマスタ編集
統計解析の結果を
反映したいのだが。
運⽤用担当者
データ
サイエンティスト
申込者
登録
顧客属性に応じて
適切切なグループに
担当をアサイン
⼿手作業でのアサイン業
務が多い
マッチ
ング
サービス
提供
運⽤用担当者が
⼿手作業で集約
履履歴
DB
毎⽉月のルール決めにも
時間がかかる
マネージャー
・・・・
Copyright © 2015 Red Hat K.K. 各マネージャーが毎⽉月
マッチングルールを
⼿手作業で編集
11
ケーススタディ: ⼤大⼿手サービス業の例例
現在
統計解析ツールが
決定⽊木を⽣生成
BRMS
マスターへの登
録が無くなった
統計解析
ビジネスルールを
BRMSに⾃自動読込
決定⽊木をビジネス
ルールに⾃自動変換
分析結果を直接業務に
活かせるようになった
申込者
登録
マッチ
ング
サービス
提供
マネージャー
アサイン業務が
減って楽になった
運⽤用担当者
履履歴
DB
データ
サイエンティスト
履履歴DBの実績デー
タを統計解析ツール
で分析
毎⽉月のルール決めが
無くなり楽になった
・・・・
Copyright © 2015 Red Hat K.K. 12
R⾔言語による実⾏行行イメージ
l  ユースケース:離離反者の多い顧客層には特別キャンペーンを提案する
PMML形式の決定⽊木モデル
分析データ
"place",”sex",”churn_̲flag"
“東京都”,“男性","あり"
“東京都”,“女性","あり"
"東京都","女性","あり"
"東京都","男性","あり"
"東京都","男性","あり"
"東京都","男性","あり"
"その他","男性","あり"
"東京都","女性","あり"
"東京都","女性","あり"
"東京都","男性","あり"
"東京都","男性","あり"
"その他","女性","あり”
:
:
:
決定⽊木
<PMML version=“4.2” xmlns=“http://www.dmg.org/PMML-‐‑‒4_̲2” xmlns:xsi=“http://www.w3.org/…
(省略)
<Node id="1" score="なし" recordCount="100000" defaultChild="3">
<True/>
<ScoreDistribution value="あり" recordCount="5000" confidence="0.05"/>
<ScoreDistribution value="なし" recordCount="95000" confidence="0.95"/>
<Node id="2" score="なし" recordCount="13602" defaultChild="4">
<SimpleSetPredicate field="population" booleanOperator="isIn">
<Array n="1" type="string">&quot;20万人未満&quot;</Array>
</SimpleSetPredicate>
<ScoreDistribution value="あり" recordCount="4101" confidence="0.301499779444199"/>
<ScoreDistribution value="なし" recordCount="9501" confidence="0.698500220555801"/>
<Node id="4" score="あり" recordCount="4284">
<SimpleSetPredicate field="place" booleanOperator="isIn">
<Array n="1" type="string">&quot;東京都&quot;</Array>
</SimpleSetPredicate>
<ScoreDistribution value="あり" recordCount="3347" confidence="0.781279178338002"/>
<ScoreDistribution value="なし" recordCount="937" confidence="0.218720821661998"/>
</Node>
<Node id="5" score="なし" recordCount="9318">
<SimpleSetPredicate field="place" booleanOperator="isIn">
ノード
判定条件
次ノード
アクション
<Array n="1" type="string">&quot;その他&quot;</Array>
</SimpleSetPredicate>
1
true
2, 3
<ScoreDistribution value="あり" recordCount="754" confidence="0.0809186520712599"/>
<ScoreDistribution value="なし" recordCount="8564" confidence="0.91908134792874"/>
</Node>2
sex = “男性”
4, 5
</Node>
<Node id="3" score="なし" recordCount="86398">
3
sex = “⼥女女性”
なし
<SimpleSetPredicate field="population" booleanOperator="isIn">
<Array n="1" type="string">&quot;20万人以上&quot;</Array>
4
place = “東京都”
特別クーポンの作成
</SimpleSetPredicate>
<ScoreDistribution value="あり" recordCount="899" confidence="0.010405333456793"/>
5
place = “その他”
なし
<ScoreDistribution value="なし" recordCount="85499" confidence="0.989594666543207"/>
</Node>
</Node>
</TreeModel>
</PMML>
BRMS形式のディシジョンテーブル
Copyright © 2015 Red Hat K.K. 13
ステップ1:分析データを読み込む
data1 <-‐‑‒ read.csv(”testdata1.csv")
1
2
3
4
5
6
place
東京都
東京都
その他
東京都
その他
東京都
sex
男性
⼥女女性
⼥女女性
男性
男性
男性
churn_flag
Yes
Yes
Yes
No
No
Yes
契約を解約
したか?
:
:
Copyright © 2015 Red Hat K.K. 14
ステップ2:決定⽊木を⽣生成する
model1 <-‐‑‒ rpart(churn_̲flag ~∼ place+sex, data1)
n= 100000
場所+性別のデータを元に
node), split, n, loss, yval, (yprob)
解約率率率の傾向を分析する
* denotes terminal node
1) root 100000 5000 No (0.95000000 0.05000000)
2) sex=⼥女女性 86398 899 No(0.98959467 0.01040533) *
3) sex=男性 13602 4101 No(0.69850022 0.30149978)
6) place=その他 9318 754 No (0.91908135
0.08091865) *
7) place=東京都 4284 937 Yes (0.21872082
0.78127918) *
Copyright © 2015 Red Hat K.K. 15
ステップ3:決定⽊木をグラフ化する
plot(as.party(model1))
性別は?
東京に住む男性の場合、
解約率率率が⾼高いから何か
施策を打たねば。
sex
女性 男性
女性 男性
場所は?
その他 東京都
問い合わせ時に特別
キャンペーンを案内
してみては?
Copyright © 2015 Red Hat K.K. 解約率率率が
⾼高い!
16
ステップ4:分析モデルをPMML変換する
pmml(model1)
<PMML version="4.2………………pmml-4-2.xsd">
<Header copyright="Copyright (c) 2015 kkomazaw" description="RPart Decision Tree Model">
<Extension name="user" value="kkomazaw" extender="Rattle/PMML"/>
<Application name="Rattle/PMML" version="1.4"/>
<Timestamp>2015-10-17 23:12:49</Timestamp>
</Header>
<DataDictionary numberOfFields="3">
<DataField name="churn_flag" optype="categorical" dataType="string">
<Value value="No"/>
<Value value="Yes"/>
</DataField>
<DataField name="place" optype="categorical" dataType="string">
<Value value=”その他"/>
<Value value=”東京都"/>
</DataField>
<DataField name=”sex" optype="categorical" dataType="string">
<Value value=”男性"/>
<Value value=”⼥女女性"/>
</DataField>...以下省省略略
Copyright © 2015 Red Hat K.K. 17
ステップ5:BRMSに変換する
RuleTable
キャンペーン判断ルール
CONDITION
CONDITION
ACTION
ACTION
$n : RuleNode
$d : RuleData
id == $1
$param
<内容省省略略>
setAction($param)
ノード
条件
次ノード
施策
1
eval(true)
2,3
2
sex contains “男性"
4,5
3
sex contains “⼥女女性"
4
place contains "東京都"
特別キャンペーン対象
5
place contains "その他"
Copyright © 2015 Red Hat K.K. 施策は⼿手動または
⾃自動で設定する
PMMLから
⾃自動⽣生成
18
ステップ6:業務アプリケーションに即座に反映する
会員番号 123456789
性別
⽒氏名
⾚赤帽⼦子 太郎郎
住所
東京都町⽥田市・・・・
男性
対応ガイダンス
お客様は特別キャンペーン対象者です。
下記ガイダンスに従いご案内ください。
・・・
Copyright © 2015 Red Hat K.K. 19
分析モデルの例例
l  データサイエンティストは様々な⼿手法により分析モデルを作成している
決定⽊木分析
契約データ
回帰分析
広告費を増やすとX
の割合で売上⾼高が
向上する
⼥女女性で42歳以上の
場合、解約率率率が⾼高
い
アソシエーション分析
POSデータ
パンとバターを購
⼊入した⼈人の90%は
ミルクも購⼊入して
いる
売上データ
分析モデルのアウトプットを
ダイレクトにシステム化できれ
ば意思決定のスピードがあがる
Copyright © 2015 Red Hat K.K. 20
PMML (Predictive Model Markup Language)
l  分析モデルをコンピュータで操作するための共通⾔言語
変換ライブラリ
クラスター
SAS
スコアカード
アソシエーション
SPSS
PMML
ニューラルネットワーク
回帰
サポートベクターマシン
R
ナイーブベイズ
決定⽊木
Copyright © 2015 Red Hat K.K. 21
分析モデルのユースケース
購買予測/キャンペーン
マーケティング
信⽤用予測/不不正検知
リスク管理理
業務オペレーション
需要予測/ガイダンス
Copyright © 2015 Red Hat K.K. 22
「分析モデル⾃自動実⾏行行ソリューション」
全体アーキテクチャ
収集
ビッグデータシステム
分析
アクション
データサイエンティスト
業務システム
業務ユーザー
分析ツール
集
約
機
構
結果
分析モデル分析モデル
分析モデル
変
換
機
構
ビジネス
ルール
ビジネス
ルール
ビジネス
ルール
ルール
エンジン
業務アプリ
アプリケーション
実⾏行行基盤
ソリューション
範囲
Copyright © 2015 Red Hat K.K. 23
JBoss Middlewareを利利⽤用したアーキテクチャ
収集
ビッグデータシステム
分析
アクション
データサイエンティスト
JBoss Data Virtualization
結果
XML
CSV
PMML
JBoss Fuse
SPSS/SAS/R等
業務システム
ビジネス
ルール
ビジネス
ルール
ビジネス
ルール
JBoss
BRMS
業務ユーザー
業務アプリ
JBoss EAP/
JBoss Data Grid
ソリューション
範囲
Copyright © 2015 Red Hat K.K. 24
理理想的なインテリジェントシステム
情報系(分析システム)
基幹系(業務システム)
分析結果
+
施策
Plan (分析)
Do (実⾏行行)
実績データ
改善結果
+
施策
Check (検証)
実績データ
データ
サイエンティスト
/経営者
Act (改善)
現場
担当者
Copyright © 2015 Red Hat K.K. 25
まとめ
データの分析結果をダイレクトに業務に活かすことで、
より競争⼒力力のあるサービスを提供することができます
分析モデルを施策と紐紐づけることでビジネスルールと
して企業の資産にすることができます
BRMSを基幹システムに組み込むことによりビジネス
ニーズを迅速に反映する超⾼高速開発が実現できます
Copyright © 2015 Red Hat K.K. 26
分析モデル
(条件)
ビジネス
ルール
施策
(アクション)
Copyright © 2015 Red Hat K.K. 27
Red Hat Forum 2015
Energize Your Enterprise