チャンス発見のプロセス - 高間研究室

高間研究室研究紹介(4)
http://krectmt3.tmit.ac.jp
チャンス発見のプロセス(1)
チャンス発見におけるデータアノテーション
岩瀬 徳宏
瀬尾 優太
チャンス発見とは
「意思決定にとって重要な事象または状況に気づき、これを理解し行動
すること」 [大澤幸生,03]
2重らせんモデル
大量に収集されたデータの中からチャンスを発見
・希少な事象に着目
・人間が考え,計算機がサポート
チャンス発見にいたるプロセス
関心⇒理解⇒発案⇒行動⇒評価
2重らせんプロセスモデル
[大澤幸生,03]
チャンス発見の応用例:ある父親のPOS(売り上げ)データから購買行動を理解
POSデータ
タバコ,週刊誌,ビール.
ビール,つまみ.
ビール,つまみ,タバコ,週刊誌.
週刊誌,オムツ,おもちゃ,菓子.
ヤサイ,肉,フルーツ,牛乳,鮮魚.
おもちゃ,菓子,インスタント食品.
ヤサイ,肉,鮮魚.
タバコ,ライター.
フルーツ,コーヒー.
おもちゃ,オムツ.
惣菜,牛乳,インスタント食品.
タバコ,週刊誌,ビール,オムツ.
菓子,インスタント食品,牛乳.
タバコ,週刊誌,ライター,鮮魚.
ヤサイ,肉,鮮魚,牛乳.
オムツ,タバコ,おもちゃ.
牛乳,フルーツ.
菓子,ビール,フルーツ.
ビール,つまみ,鮮魚.
ヤサイ,鮮魚.
フルーツ,牛乳,肉.
ビール,オムツ.
インスタント食品,ビール,惣菜.
おもちゃ,菓子,インスタント食品.
惣菜,ビール,つまみ.
菓子,コーヒー.
解釈が難しいデータを計算機を用いて可視化
計算機による
可視化
キーグラフB
キーグラフA
データ可視化アルゴリズム KeyGraph
[大澤幸生,03]
- 同時に多数出現しているものの集まり(島)
- 出現頻度が高くないキーワードによる島の間のつながり(橋)
パラメータを用いたユーザとのインタラクティブな可視化
人の心理をチャンスに気づきやすい環境へ
チャンス発見のプロセス(2)
可視化されたデータをユーザが経験や知識を用いて解釈
データアノテーション
データアノテーションとは?
データ自身にそのデータについての情報をタグを用いて付与 ⇒ Smart Data
シナリオからユーザの島,橋の解釈結果を元データに対してアノテーション
アノテーション
キーグラフA
キーグラフB
人間による解釈
人間の経験や知識には個人差が存在
チャンスの発見には多人数による考察が有効
収集されたシナリオを比較・検討する中から チャンス or 新たな関心 を発見
k2
k1,k3,…,kn.
k2,k3.
k5
k1.,k3,kn.
ビール、タバコ、週刊誌という本人が好むもの、重いため買ってくるのを頼まれる
オムツが一つの島をなしている。オムツを買うとき子供を思い出しおもちゃ、菓子
を、またビールを買うときつまみや惣菜と一緒にインスタント食品や菓子も買って
しまうのではないだろうか。
kn
k1
k3
k4
k7
k8
Source Data
scenario1
The island made up
from k4 and k5 has a
bridge to island ...
k6
KeyGraph1
:
The island of k1, k2
and kn has a bridge to
island ...
kn
k2
k1
scenario2
・・・・
scenario3
The big island of k1,
k2 and kn contains k3,
k4 ...
従来では
シナリオの比較・
検討が困難
scenario4
KeyGraph2
データアノテーションの利点
⇒データの再利用が容易に
シナリオ間の客観的比較,異なったキーグラフからのシナリオ比較,データの絞込み
1
高間研究室研究紹介(4)
http://krectmt3.tmit.ac.jp
データアノテーションの有用性
データアノテーションアルゴリズム
ビール、タバコ、週刊誌という本人が好むもの、重いため買ってくる
のを頼まれるオムツが一つの島をなしている。オムツを買うとき子供
を思い出しおもちゃ、菓子を、またビールを買うときつまみや惣菜と
一緒にインスタント食品や菓子も買ってしまうのではないだろうか。
シナリオを解析しユーザの着目点を抽出
着目した島,橋を構成する要因となったデータに対してアノテーション
ユーザが着目している
島,橋の抽出
食材の島の中でもフルーツや牛乳など朝によく買うものから、コー
ヒーを橋渡しに菓子やインスタント食品などの島へつながっている。
朝の菓子やおもちゃの売り上げはどうなのだろうか?
2.シナリオ解析
⇒全く異なった部分について述べているシナリオ
キーグラフA
3.データアノテーション
k1,k3,…,kn.
k2,k3.
1.キーグラフの構造解析
元データ
<s01
<s01
<s01
<s01
<s02
<s01
・
・
・
k1とk3の島は…
k2
シナリオ
k6
k5
k7
author="A" type="島"><s03 author="C" type="島">タバコ,週刊誌,ビール.</s03></s01>
author="A" type="橋">ビール,つまみ.</s01>
author="A" type="島,橋"><s03 author="C" type="島">ビール,つまみ,タバコ,週刊誌.</s03></s01>
author=“A” type=“島,橋”><s02 author=“B” type=“島”><s03 author=“C” type=“島”>週刊誌,オムツ,おもちゃ,菓子.</s03></s02></s01>
author="B" type="島"><s03 author="C" type="島">ヤサイ,肉,フルーツ,牛乳,鮮魚.</s03></s02>
author="A" type="橋"><s02 author="B" type="島"><s03 author="C" type="島">おもちゃ,菓子,インスタント食品.</s03></s02></s01>
kn
k1
k3
k4
k1.,k3,kn.
:
アノテーションされたデータ
k8
両シナリオのタグがついたバスケットの抽出
{菓子、インスタント食品、牛乳}(橋)
キーグラフ
従来のチャンス発見プロセス
アノテーションされたデータを用いてシナリオを比較することで新たな関心を創出
今後の発展:BBS方式
アノテーション機能を実装したBBSの開発
• シナリオ作成のインタフェースを提供
• シナリオを幅広く収集
• アノテーション結果を利用したシナリオの
作成支援
牛乳、インスタント食品の組み合
わせが惣菜と菓子とをつなぐ鍵?
{週刊誌、オムツ、おもちゃ、菓子}(島)
{惣菜、牛乳、インスタント食品}(橋)
島・橋の定義機能の利点
BBS方式でシナリオを蓄積するシステム
・定義情報をタグの形式で蓄積
<island name=“本人が好む物の島”>
タバコ、週刊誌、ビール</island>
<bridge name=“調理の必要がない物の橋”>
つまみ、惣菜、インスタント食品</bridge>
シナリオ:
タバコ、週刊誌、ビールを島と見ると、本人の好む物
の島である。ビールからつまみ、惣菜、インスタント
食品と調理の必要がないものがつながっている。
自然言語による記述
→コンピュータによる解析が困難
シナリオを記述
タグを用いた定義の表現
→コンピュータによる解析が容易
シナリオ解析が容易に
シナリオのデータを蓄積
・シナリオとキーグラフの対応を表示可能
[シナリオ]
島・橋の定義機能
タバコ、週刊誌、ビールを島と見る
と、本人の好む物の島である。
BBSの入力画面
ユーザが島や橋を定義する機能を提供
・ シナリオ作成を支援
・ シナリオ解析に有用な情報を獲得
クリックして選択できる
選択した部分を島や橋に定義できる
ビールから調理の必要がない物の
橋がつながっている。
・キーワードを定義された島や橋ごと
に色分け
・キーグラフの対応する部分に同じ
色でマーク
シナリオとキーグラフの対応
関係が明瞭に
・定義情報を用いたシナリオの検索が可能
(例)
この部分について、
他の人はなんと言っ
ているのだろう?
注目した部分と類似
した島を定義している
シナリオを検索
2