ECビッグデータチャレンジ - スキルと実践を重視したビッグデータ

慶應義塾大学 ビッグデータ・イノベーションシンポジウム
(文部科学省委託事業)
2014年3月17日
ECビッグデータチャレンジ
慶應義塾大学 理工学部 教授
鈴木秀男
1
ECビッグデータチャレンジ
ECデータの解析 & プロスポーツデータの解析
 ECデータの分析:
関連協力企業(楽天技術研究所、GDO、リクルートなど)からの提供データ
の解析
 顧客属性、WEBアクセスログデータ、商品属性データを提供。
 プロスポーツのデータ解析:
多様なデータを紐付けさせてたデータの分析
 スタジアムでのアンケート調査データ
 公開データ(観客数)
 ネット上のマイクロブログなどの情報
⇒
ビジネス価値創造を目指した分析の取り組みをしてもう。
2
ECデータの分析フレームワーク(例)
ゴルフ関連ECサイトのデータ
顧客・ユーザ属性
•性別、年齢
•ハンディキャップ
アクセスログデータ
 新規会員/新規顧客獲得の効率化
 優良顧客候補の特別育成2回目、
購買率の向上など
購買データ
•購買商品
•金額
•頻度
•ユーザID、セッションID
•訪問日時、滞在時間
•PV数、CV数
パイロット分析の提供データサイズ: 300GB
実行フェーズ
分析フェーズ
分析準備
提供データの
種類・形式・受
け渡し方法の
確認
データ分析
【データ分析】
データ抽出
分析項目/手法の
検討
データ加工・分析
予測モデルの構築
テスト
マーケティング
【テストプラン策定】
分析項目・分析手
法の検討
検証項目の設定
検証方法・期間の
検討
【テストの実行】
モデルの修正
運用準備
運用
【テスト結果分析】
データ抽出
データ加工・分析
【分析モデルの修正】
分析モデルの結果検証
各予測モデルの修正
アクションプラン策定
テストマーケティングが実施可能な
レベルのデータ分析を目指す。
企業と大学が連携して行える範囲
3
ECビッグデータチャレンジ(2)
データデータ解析コンペティションとの連携(その1)
 本プログラムのデータ解析コンペティション発表会への協賛
ECビッグデータチャレンジの取り組みとして、経営科学系研究部会連合協議会およ
び日本OR学会ビッグデータとマーケティング分析研究部会部門に協賛し、データ
解析コンペティションを共同運営する。
 協賛することによる活動内容
 参加チーム・メンバーには、開発された教材の提供を行い、フィードバックをもらう。
 コンペ優秀チームには、慶大ビッグデータチャレンジ賞(仮称)を授与する。
 共同運営することで、ネットワーク形成の強化につながる。
 参加者をから、ビッグデータ人材育成に関連する聞き取り調査を行う。
(2013年度は、アンケート調査を行った。)
 「ビッグデータ実践」での活用
本プログラムの「ビッグデータ実践」において、履修者の一部がデータ解析コンペ
ティション参加。ビッグデータの分析の実践を行う。
⇒ 人材育成の観点からは、データ解析コンペティションの活用は有効である。
4
ECビッグデータチャレンジ(2)
データ解析コンペティションとの連携(その2)
データ解析コンペティションとは
 平成6年より「共通の実データを元に、参加者が分析を競う」ことを目的と
した「データ解析コンペティション」を実施。
http://jasmac-j.jimdo.com/
 主催: 経営科学系研究部会連合協議会 (10組織の連合体)
–
–
–
–
日本オペレーションズ・リサーチ学会先端マーケティング分析研究部会
日本マーケティング・サイエンス学会ID付POSデータ活用研究部会
日本計算機統計学会データ解析スタディグループ
日本データベース学会 ビジネスインテリジェンス研究グループ 等
 最近の提供データ
–
平成23年度
ECサイト・アクセス,購買データ (提供元:ゴルフダイジェストオンライン)
– 平成24年度
ウェブサイトアクセス・購買データ (提供元:リクルートテクノロジーズ。グループの事業SUUMOおよ
びポンパレに関するウェブアクセスデータ)
– 平成25年度
ECサイト購買・閲覧データとスキャンパネル・パネル調査データの2種類 (データ提供:スキャンパ
ネル・パネルはマクロミル、ECサイトは非公開)
2013年度の日本OR学会データ解析コンペティション部門
学生、一般、課題設定部門を合わせて38チーム、延べ220人程度の参加者
5
ビッグデータ活用人材:
データサイエンティストが求められる能力
技術・知識的な側面
ビッグデータを処理するための
情報技術
分散処理、
データベース、知識工学等
ビッグデータの解析力
統計解析、機械学習、
マイニング、最適化など
ビッグデータ解析を活用できる
適用分野の知識・経験
ビジネス、マーケティング、医
学、生命科学、環境など
意識・メンタル・感性的な側面
マネジメント・
インテグレーション力
関連の技術・知識を集約する能力
ビッグデータと向き合うた
めのメンタリティ
忍耐力・集中力・好奇心
事実に基づく管理
データからの気づき・発見⇒企画・提案・実行力
6