ビジネスは科学足りえるか? 統計科学への期待

ビジネスは科学足りえるか?
統計科学への期待
独立行政法人 統計センター
The National Statistics Center
椿 広計
2015/5/23
応用統計学会セミナー
統計におけるオープンデータの高度化
独立行政法人
統計センターの
最近の活動
「統計を活かす」
統計データの提供方法を高度化し、新たな付加価値を創造するサービスや革新的な事業の創
出などを支援する取り組みを、総務省統計局と連携し行っており、政府が取り組んでいる
オープンデータの推進を先導。
2014.10.31から運用開始
API機能による統計データの提供
統計データを機械判読可
能な形式で提供するAP
I機能(Application
Programming Interface)
を提供中
開発支援情報も提供中
活用例1:利用者の情報シス
テムにe-Statのデータを自動
的に反映
利用登録者数 3162人
統計データへのリクエスト件数 約2272万件
(平成27年3月26日現在)
活用例2:ユーザー保有やイ
ンターネット上のデータ等と
連動させた高度な統計データ
分析
2015.1.20から運用開始
地図による小地域分析(jSTAT MAP)
任意に指定したエリ
アによる集計や利用
者が保有するデータ
の取り込み集計する
機能などを提供
2015/5/23
利用登録者数 2334人
ログイン件数 約23000件
(平成27年3月26日現在)
ユーザー保有
のデータ
活用例1:任意に指定したエリアによる集計や、
応用統計学会セミナー
利用者が保有するデータと統計データを組み合
わせ、集計結果を地図上で視覚的に把握可能
タブレット用アプリも
提供中
活用例2:選択したエリア
の年齢構成等の基本的な分
析結果のレポート作成
6
「ビジネスモデルって統計モデルのことだったのですね」
ある起業した筑波大学大学院ビジネス科学研究科院生
• ビジネスとは?⇒変革と挑戦 (米国:マルコムボルドリッジ国家品質賞からのメッセージ)
• 誤解1:統計はただの数学
• 誤解2:ビジネスは科学ではない
•
「ビジネスは科学と相容れない」
•
平成13年3月:内閣法制局のビジネス科学研究科設置に対するクレーム
• ビジネス・データ・マネジメント
• 「ビジネス情報」に付加価値を与える一連のマネジメント体系
• ビジネスとして関心のある事象の集合
• ⇒予測・制御・デザイン・最適化といった経営アクションに利用できる便利な法則を事実(Data)に基づいて付与
• ⇒法則基づいて最適なアクション
•統計数理科学のビジネスに対する主機能
•Plan: 表現(モデル化):レベルの表現、変化の表現、構造の表現
•Do: デザイン(最適化)
•Check: 問題発見(モデルに基づく期待値と現実との乖離発見)
2015/5/23
応用統計学会セミナー
今日の話題:ビジネスは統計科学たりえるか?
• お品書き: ビジネスを科学にする10の指針
•
•
•
•
•
•
•
•
•
•
2015/5/23
指針1:XXを科学せよ
指針2:入出力システムに法則有
指針3:ダイナミックスを知りたいから微分や差分が必要
(指針4:ベストパフォーマンスに学ぶことも可能)
指針5;利益は指標であり、法則の帰結ではない
指針6:ネットワーク(連立方程式)思考でシステムをモデル化
指針7:ビジネスモデルの計画はパス図の設計
指針8:効果=直接効果+間接効果
(指針9:測りつらい「コト」の評価はその成果を束ねて計測)
指針10:統計的品質管理へのモデル利用
応用統計学会セミナー
指針1:XXを科学せよ:統計科学の目指すもの
なぜビジネスは科学になりえるのか?
• 統計科学の目的は,関連する事実の集団に関する情報を
議論に適した簡潔な表現に要約することである.
•F. Galton(1883): Inquiries into Human Faculty and its Development
• 何でも科学になる!
• 「科学」とは、その対象で定義するのではなく、拠るところの方法で定義
• 認識科学の古典的方法: Man gives law to Nature.
• K. Pearson, (1892): The Grammar of Science
• 諸事実の周到かつ精確な分類、これらの事実の相関関係の観察
• 想像力の支援に基づく科学的法則の現象への付与
• 法則が妥当性を持つか否かの検証 :必要に応じて再分類
2015/5/23
応用統計学会セミナー
ビジネスは科学たりえるか?
指針2:入出力システムに法則在り
筑波大学ビジネス科学研究科編(2003)ビジネス数理への誘い、朝倉書店
2015/5/23
応用統計学会セミナー
ビジネスを科学するプロセス
序の口:科学は理想を許す
• 入出力関係と理想機能
• 線形システム(フックの法則のようなもの)
• ⊿=F(x)-F(0)
• ⊿(x1+x2)=⊿(x1)+⊿(x2)
• 対数線形システム
• ρ=F(x)/F(0)
• ρ(x1+x2)=ρ(x1)×ρ(x2)
• 理想機能からの乖離の尺度
• 法則のperformance尺度
• Galton-Pearsonの相関係数:決定係数r2
• 線形法則の平均値周りのばらつきと法則による予測値周りのばらつきとを比較
• 赤池情報量規準(AIC)
• 統計的法則の予測性能の一般的評価規準
2015/5/23
応用統計学会セミナー
単純過ぎる重回帰モデルを例にして
連関図(パス図)=ビジネス成果モデルの質的表現
• 実証データ:財務カルテ(東洋経済)
• 96年上場企業(金融保険を除く)
• 2091社中1626社を解析対象
資金
外乱
人材
情報
2015/5/23
• 水産・農林業・鉱業・空運業・
• 情報通信業
1
成果
資材
• 86年にも存在した企業
• 一業種(中分類)10社以下を除外
• 25業種(会社数,証券コード)
•
•
•
•
•
•
•
•
•
•
•
建設業(144,2050)、食料品(97,3050)、
繊維製品(89,3100)、パルプ紙(28,3150)、
化学(134,3200)、医薬品(37,3250)、
石油・石炭製品(13,3300)、ゴム製品(17,3350)、
ガラス・土石製品(50,3400)、鉄鋼(55,3450)、
非鉄金属(37,3500)、金属製品(55,3550)、
機械(166,3600)、電気機器(172,3650)、
輸送用機器(93,3700)、精密機器(93,3750)、
その他製品(42,3800)、電気・ガス(18,4050)、
陸運(45,5050)、海運(22,5100)、卸売(106,6050)、
小売(75,6100)、不動産(24,8050)、サービス(48,9050)
応用統計学会セミナー
12
• 棄却されない
• 対数売上高(100万円)-従業員数>6.5
8
10
売上高
14
16
従業員人数→売り上げ:労働生産性の比例性を両対数プロットで認識
対数売上= 4.06+0.992 (±0.028)x 対数従業員数:決定係数74.4%
• 変数は全て自然対数変換
• 比例性法則(フックの法則的法則)
4
6
8
10
従業員数
売上
400
300
200
100
2
2015/5/23
上位13社
TOYOTA TSUSHO, Mitsui O.S.K.Lines,
Toshoku,
TOKYO SANGYO
Mitsubishi
KANEMATSU
Nissho Iwai
Nichimen
MITSUI & CO. TOMEN
ITOCHU
Marubeni
SUMITOMO
• 卸売業12社、海運業1社
0
Frequency
500
Histogram of
•
•
•
•
•
•
•
3
4
5
6
売上高 - 従業員数
7
8
応用統計学会セミナー
ヒト+(モノ+カネ)→売上
売上=1.21+1.03従業員数+0.41一人当固定資産+0.37一人当流動負債+030(流動資産/固定資産)+残差
若干規模の効果:決定係数:91.4%
予測残差のヒストグラムと
1.全平均を予測値とした場合の予測残差、
2.従業員数による単回帰予測
3.重回帰予測の予測誤差のBoxplot比較
600
400
0
200
Frequency
Histogram of residuals(d.lm2)
-2
-1
1
0
2
• 重回帰モデルの予測残差
•
•
•
•
•
•
•
• 古典的には分類の必要性
residuals(d.lm2)
4
• 業種ごとに異なる重回帰予測
• ⇔業種ごとに異なるビジネスモデル
-2
0
2
• 当然のことですが
-4
2015/5/23
正の予測残差大のベスト10社
Marubeni
ITOCHU
SUMITOMO
OSAKAUOICHIBA
CHUBU SUISAN
TSUKIJI UOICHIBA DAITO GYORUI
TOHTO SUISAN CHUO GYORUI
TOKYO SANGYO
1
2
3
応用統計学会セミナー
業種ごとに古典的分類を行った重回帰
係数は書ききれない(パラメータ120個)ので省略
予測残差の比較とヒストグラム:決定係数96.0%
0.74
0.43
0.31
-4
-2
0
2
4
残差標準偏差
1.47
1
2
3
4
• 予測残差上位10社
•
•
•
•
•
• それでも卸売業に若干癖が残る
• 教師無し分類モデルの必要性
300
0
100
Frequency
500
Histogram of residuals(d.lm3)
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
residuals(d.lm3)
2015/5/23
COPYER
DAIKI ALUMINIUM INDUSTRY
Asahi National Lighting OSAKA UOICHIBA
NANKAI WORSTED SPINNING DAITO GYORUI
CHUO GYORUI
TOHTO SUISAN
TSUKIJI UOICHIBA
TOKYO SANGYO
応用統計学会セミナー
分類とは別のモデル戦略
変量効果モデル(回帰係数を変量と見なす)
• 個々の産業ごとに回帰係数は推定し
ない
• 業種ごとの回帰係数の期待値、標準偏
差、相関係数行列を最尤推定
• 売上=b0+b1従業員数
+b2一人当固定資産
+b3一人当流動負債
+b4(流動資産/固定資産)
+残差(標準偏差=0.31)
• E[b0,b1,b2,b3,b4]
=(1.42,1.03,0.47.0.22,0.36)
• S. Dev[b0,b1,b2,b3,b4]
=(0.45,0.03,0.12,0.08,0.16)
2015/5/23
• Cor[b0, b1, b2, b3, b4]
= 1 -0.60 -0.70 -0.35 -0.62 b0
1
0.40 0.06 0.16 b1
1
-0.20 0.78 b2
1 -0.20 b3
1 b4
• 寄与率は95.8%:AICは若干悪化
• 予測残差上位10社
•
•
•
•
•
応用統計学会セミナー
YORK-BENIMARU
Asahi National Lighting
TOKYO SENPAKU
OSAKA UOICHIBA
NANKAI WORSTED SPINNING DAITO GYORUI
CHUO GYORUI
TOHTO SUISAN
TSUKIJI UOICHIBA
TOKYO SANGYO
ビジネスのダイナミックス
指針3:ダイナミックスを知りたいから微分や差分が必要
2015/5/23
応用統計学会セミナー
1996年と1986年の対数売上の差の変動をさ
モデル化(説明変数も差分化)
• Δ売上高=0.02
• 思うように成長できなかった
+0.92Δ従業員数
• 残差の下位10位とΔ売上(対数)
+0.37Δ一人当固定資産
•
会社名
Δ売上高
+0.20Δ一人当流動負債
• 548
Green Cross -1.4709716
+0.30Δ流動資産/固定資産
• 1142
SANYO ELECTRIC -0.9202199
• 決定係数60%残差標準偏差0.27
• 業種別モデル
• 決定係数71%残差標準偏差0.24
2015/5/23
•
•
•
•
•
•
•
311
JOMO TWISTING THREAD
568 INTERNATIONAL REAGENTS
955
ISEKI & CO.
480
KYOWA HAKKO KOGYO
895
ISHII PRECISION TOOL
1706
SOGO
1167
AKAI ELECTRIC
応用統計学会セミナー
-1.5471764
-1.2805645
-1.4831766
-1.0943952
-0.2601283
-0.3767048
-0.8332346
分布の裾に潜むビジネス情報
指針4:ベストパフォーマンスに学ぶことも可能
2015/5/23
応用統計学会セミナー
Selection by Erking & Amadeus
魔王と神々の選択:バスタブカーブ
The Erl King", by Albert Sterner, ca.
1910
http://www.answers.com/topic/dererlk-nig
弱集団
The Oldest Twins; Kin-san
Gin-san
http://www.geocities.co.jp/SilkR
oad-Ocean/2002/nati0000.htm
強集団
質的選択モデル&統計的フロンティアモデル
ランクロジットモデル⇔コックスの生存時間回帰
比例ハザードモデルと比例逆ハザードモデル
• Qualitative Choice by Ascending Order
• Proportional Hazard Model: Weak population
• Log(f/(1-F))=log λ(t) + βTX
• Erl-king Selects Children.
• 生存力の弱さで順位付け:弱集団分析
• Qualitative Choice by Descending Order
• Proportional Reverse Hazard Model: Strong Population
• Log(f/F)=log ρ(t) + βTX
• God Celebrates Kinsan and Ginsan: Amadeus
• 生存力の強さで順位付け:強集団分析
• 椿広計, 大野忠士 (2008), 定量的リスク評価と定性的リスク評価との架橋-定量的リス
ク評価モデル当てはめにおける質的選択モデルの役割- , 計量生物学, Vol 29 Special
issue 2, S133-S141.
連立方程式とは
ネットワーク思考
指針5:利益は指標であり法則の帰結ではない
指針6:ネットワーク思考でシステムをモデル化
2015/5/23
応用統計学会セミナー
統計技術と統計科学の差異
• 技術ニーズに即した分析の誤謬
• 例:売上ではなく,売上利益の予測?
• 目的変数は?
• 技術的接近ならば予測したい変数が目的変数
• 科学的接近:理想機能を考えるために分析的思考
• 売上げには入出力関係がありそう
• (売上げ-売上利益)≒原価にも入出力関係ありそう
• 原価の決定要因と(売上/原価)の決定要因とは違いそう
2015/5/23
応用統計学会セミナー
統計技術の立場:利益を目的変数:といってもどう処理するのか?
赤字企業は負のデータ:電気電子機器業界
2
Residuals vs Fitted
1563
-4
-2
0
945
Residuals
• log(売上総利益+65000)
=9,26+0.24従業員数
+0.14一人当固定資産
+0.03 (流動資産/固定資産)
R2=0.54
一人当流動負債は有意でない!
しかし残差プロットに非線形性
-6
8
10.5
2015/5/23
応用統計学会セミナー
11.0
11.5
Fitted values
lm(log(
12.0
12.5
科学的接近:売り上げと殆ど同じなのでスキップ
第一段階:対数原価(売上高ー売り上げ利益)
3
Residuals vs Fitted
1301
1
2
1269
-2
-1
0
Residuals
• 原価=1.03+
+1.02従業員数
+0.29一人当固定資産
+0.49一人当流動負債
+0.26流動資産/固定資産
• R2=0.93
• 原価の世界の対数線形性に
問題は少ない
• 勿論業種ごとに層別の必要性有!
455
8
10
12
Fitted values
lm(I(
2015/5/23
応用統計学会セミナー
14
第2段階:対数(売り上げ/原価):価値率
2.0
Residuals vs Fitted
1.5
1380
1.0
1589
0.0
0.5
1395
-0.5
• 寄与率58%, 残差標準偏差0.14
残差上位10社(1996)
Shiseido
Denny’s Japan YOMEISHU SEIZO SUNSTAR
SKYLARK
ONO PHARMACEUTICAL KYOTARU
RINGER HUT
OS
SEVEN-ELEVEN JAPAN
Residuals
• 対数(売上/原価)=0.18+
0.01従業員数
+0.12一人当固定資産
-0.13一人当流動負債
+0.05(流動資産/固定資産)
• 寄与率19%, 予測残差標準偏差0.19
• 法則性としては弱いが
非線形性などは顕著ではない.
• 業種ごとに異なる係数のモデル
-0.2
0.0
0.2
0.4
0.6
Fitted values
lm(
2015/5/23
応用統計学会セミナー
0.8
1.0
1.2
連立方程式モデルからの解釈の統合
Seemingly Unrelated Regressionの話は当面無視
• 売上利益=e対数原価×(e対数価値率-1)
• 非線形性が出るのが当然
• 利益は人間が作り出している目標
指標
• ビジネスの法則による記述の対象
ではない
モノ
カネ
• 連立方程式モデルの必要性
• グラフィカルモデリングへの期待
ヒト
• 日本品質管理学会編(1999)「グラフィカ
ルモデリングの実際」,日科技連出版
2015/5/23
原価
応用統計学会セミナー
利益率
ビジネス構造モデルと
ビジネス測定モデル
指針7:ビジネスモデルの計画はパス図の設計
指針8:効果=直接効果+間接効果
指針9:測りつらい「コト(Concept)」の評価はその成果を束ねて計測:測定モデル(スキッ
プ)
2015/5/23
応用統計学会セミナー
統計手法→ビジネス統計モデリングへ
収益が生まれるプロセスを記述
• 構造モデリングは統計科学の対象とそのシステムを記述する言語
• データがなくても現象を仮説的にモデル化することが肝要
• データがなくても定量的関係性の符号ないしはどの程度になるべきかを設定
• ベイズ統計における事前分布の責任設定と同じ意味
• これがPDCAのP段階
• データ分析はPDCAのC段階
2015/5/23
応用統計学会セミナー
連立方程式で考えるとはあちらこちらの因果関係を
ネットワーク化する:Balanced ScoreCardの定量化
資金
単位当原価
対数
活動指標1
人材
売上単位数
対数
活動指標2
情報
資材
2015/5/23
応用統計学会セミナー
市場規模単
対数
典型的ビジネス構造モデリング
マネジメント1
マネジメント2
オペレーション1
品質2
品質1
品質3
マネジメント3
オペレーション2
中間パフォーマンス
最終パフォーマンス
満足1
満足2
中間パフォーマンス
オペレーション1
購買意図
推奨意図
マネジメント1
マーケティング
2015/5/23
オペレーション2
マネジメント2
マネジメント3
経営戦略,組織経営
応用統計学会セミナー
連立思考で見えること!
総合効果=直接効果+間接効果
コストのかかる仕掛け(認証取得活動)の直接効果は負になる
トップのリーダーシップ
経営戦略
の妥当性
自社のマネジメントシステム
の確立・強化
認証取得活動強化
トップの方針に合致した
無駄のないオペレーション
経営パフォー
マンスの向上
社員の志気
中小企業研究センター編,2002 「中
小企業の環境経営戦略」,同友
館より
お客様の信頼向上
利益
(実践は正の直接影響、破線は負の直接影響)
2015/5/23
応用統計学会セミナー
実際の計量事例:角埜氏の研究
Kadono & Tsubaki,(2002)IT Management Effectiveness: an Empirical
Study in Japanese Companies,Proc. PACIS 2002, Tokyo.
Top management's awareness and actions on IT
Management
Indicator
0.57
0.29
Linkage between
Operational
Indicator
management and IT
IT development
capability
0.38
0.18
0.22
Business value
Performance
Indicator
creation from IT
0.16
0.39
deployment
0.24
0.30
IT readiness
Fig. 4. Estimation of the modified structural model
2015/5/23
IT investment and
応用統計学会セミナー
0.11
「テロ」の定義(集合論)から「テロらしさ」の測定へ
無形の概念測定モデルの意義(Skip)
• 統計科学の対象
•
ばらつきという不確実さを持つ
• 「テロ」というよりは、「テロらしさ」という「概念」の強弱を測定した
い
• 「因子モデル」による測定
誤差1
1
暴力の程度
誤差2
1
影響の範囲
•
誤差3
1
政治的意図
特性の強弱の測定
• 「政治的意図の強さ」
• 「影響の範囲」
• 「暴力の程度」を通じて行う。
• 測定モデル
•
•
•
テロらしさ
隠れた無形の「親概念」の強さが、
観測された「子供たち(特性群)」の強さに
どのように影響するかを示すモデル
• ある事象の「暴力の程度」が、
「テロらしさ」という概念の測定モデル
2015/5/23
•
その事象の背後にある「テロらしさ」だけで決まるはずはない!
•
•
•
•
•
「暴力程度」には「誤差」が付随
この「誤差」のバラツキが
「特性」のバラツキに占める割合を「特性」の「独自性(Uniqueness)」
1から独自性を引いた値は、
潜在要因による特性の決定係数「共通性(Communality)」
応用統計学会セミナー
統計的品質管理へのモデル導入
指針10:統計的品質管理は今風にすれば活きるぞ
2015/5/23
応用統計学会セミナー
管理のための統計的概念
歴史的には下流から上流へ
• 最下流:検査⇔仮説検定:統計的決定理論
• 統計的意思決定(大変重要:今回はスキップ)
• Shewhart流プロセス管理⇔適合度検定:外れ値
• 重要だが見過ごされがち
• 新たな問題・課題の発見:探索的データ解析・知識発見
• ビッグデータへの期待の中枢
• 技術改善・工程改善⇔データ解析・実験計画法
• 統計的改善・最適化(データは集めるものではなく創るもの)
• 最上流:企画改善⇔市場調査・実験計画
• これらの方法は全て統計モデルを精緻化することが経済的メリットに直結
2015/5/23
応用統計学会セミナー
例)シューハート管理(異常値の発見によるデータを超えた改善)の見直し
統計的管理状態の管理図⇔妥当な統計モデルの残差の管理
時系列分析(加法モデル、残差へのモデル当てはめ)
プロセス管理としての位置付け
2015/5/23
応用統計学会セミナー
ビジネスデータマネジメントのValue Creation Cycle:
日常管理(Control)と 改善活動(Improvement)
データを収集・分析し、実社会のソリューション提供を支援
検査&統計的意思決定
統計的プロセス管理
Do
Planの
着実な実施
統計家
Demingの
PDCAサイクル
Plan
目標
人・設備・予算・
情報の提供
2015/5/23
Check 効果検証:GAP (残差)分析、探索的解析
あるべき姿と
実際とのずれ
What, Who,
When, Where,
How
Problem
Plan
解くべき
価値ある
問題の発見
どう解くか
何を計るか
質的調査計画
量的調査計画
実験計画
日本発のQCストーリー
改善のサイクル
PPDACサイクル
Data
英米の初中等
Action = Conclusion
統計教育へ移転 現場の情報:ミクロ
ソリューション 問題を解く
提供
社会の統計:マクロ
方針
多目的最適化
+実装効果確認の解析
応用統計学会セミナー
Analysis
要因の分析
原因と結果
因果モデリング:検証的解析
回帰分析・時系列解析
機械学習
ご清聴ありがとうございました
Man Gives Law to Nature
Business People can improve Law for themselves
2015/5/23
応用統計学会セミナー