企業間取引のモデル化へ向けた付加量率推定法

DEIM Forum 2014 F3-1
企業間取引のモデル化へ向けた付加量率推定法
伏見 卓恭†
斉藤
和巳†
武藤
伸明†
郷古
浩道††
† 静岡県立大学経営情報イノベーション研究科 〒 422–8526 静岡県静岡市駿河区谷田 52-1
†† 株式会社豊田中央研究所 〒 480–1192 愛知県長久手市横道 41-1
E-mail: †{j11507,k-saito,muto}@u-shizuoka-ken.ac.jp, ††[email protected]
あらまし
本研究では,企業間取引構造を精緻にモデル化するため,各企業に対する「付加量率」という概念を導入
し,業種やティアなどのカテゴリごとに付加量率を推定することを試みる.企業間取引におけるモノの流れを考えた
場合,各企業は親ノードから仕入れた部品・原材料を加工し,子ノードへ売り上げる.各企業は,単純に仕入れた金
額分を売り上げるのではなく,付加価値を付与し売り上げている.さらに,業種やティアごとに付与する付加価値の
大きさは異なると考えられる.そこで,カテゴリごとの固有の特性である付加価値に,データに反映されていない取
引関係とのモノの流れ量を合わせた「付加量」を導入することで,モデルを精緻化し,付加量を推定,考察する.実
際の企業間取引ネットワークを用いた評価実験により,付加量率を導入しない単純なモデルと比較して,各企業の価
値を意味する売上高の推定誤差を減少させることができたことを示す.また,使用するカテゴリを変えることで,ど
のカテゴリで推定したときに最も推定誤差を減少できるかについても評価する.さらに,業種やティアと推定した付
加量率の関係についても考察する.
キーワード
企業間取引ネットワーク,付加量率,パラメータ推定,EM アルゴリズム
1. は じ め に
得る.したがって,企業間取引ネットワーク上のモノの流れを,
何らかの方法で推測する手法が必要になる.筆者らは以前,モ
近年,企業間取引の大規模なネットワークについての研究が
ノの流れを推計するモデルを作ったが [5],本論文ではそれを改
増えつつある.例えば,ネットワーク全体の特徴を様々な観点
良する.まず,国内の企業間取引だけでなく,輸出や最終消費
から調べた研究や [1],連鎖倒産について分析した研究 [2] があ
などの影響もモデル化する.その上で,本論文では,データの
る.これらの研究では,日本の企業の大部分を含むデータ用い
不完全さを如何に補うか,ということに焦点を当てる.具体的
て,日本の企業間取引ネットワーク全体の数理的な特徴につい
には,1) データに反映されていない取引関係からのモノの流れ
て分析している.また,企業間取引ネットワークのページラン
や,2) 企業が生み出す付加価値について考える.これらは,企
クについても,分析されている [3].さらに最近では,銀行など
業間のモノ・カネの流れを考察する際には必要な要素である.
の金融機関間の貸付金データから取引ネットワークを構築し,
本来,1) と 2) はわけて論じるべきものであるが,本論文では,
「困窮度」を各ノードに割り当て,伝播させるモデルを想定し,
1) と 2) を合わせて,
「付加量」として扱う.この「付加量」を,
ネットワークにおける各ノードの重要度や脆弱性を分析する指
業種や取引ネットワーク上での位置など,その企業の属性をパ
標(DebtRank)も提案されている [4].
ラメータとして推計する.付加量を生み出すことは,企業の存
企業は一般に,国内の取引先企業,輸出・輸入先企業,最終
在意義そのものであり,どのような企業がどのくらいの付加量
消費者など,様々な取引関係の中で活動している.たとえば,
を生み出すのか,という問題について考察することは,学問上
製造業の場合,最終的に製品が完成するまでに,多数の企業を,
のみならず,実務においても重要な意義を持っている.付加量
部品・半完成品が流れることになる.この状況を,企業をノー
率はどのような要因で決まるか,本稿では,大規模な実データ
ド,取引関係をリンクとするネットワークととらえれば,ある
を用いて,その問題に数理的にアプローチする筆者らの研究の
ノードから他のノードへと,次々と流れが伝播してく現象と捉
第一歩である.
えることができる.つまり,
「ネットワーク上の流れを扱う研
本論文は以下のような構成である.2 章では,本論文で扱う
究」と言える.この流れを正確に把握することは,企業戦略上
問題を定式化し,3 章では,定式化したモデルにおけるパラメー
も,経済政策上も非常に重要だと考えられる.しかし,筆者の
タの推定法について述べる.4 章では,分析結果について述べ
知る限り,企業間のモノ・カネの流れを(たとえば,産業全体
る.最後に本論文のまとめと今後の展望について述べる.
や,一国経済全体といったレベルで)詳細に記述したデータは
存在しない.仮にあったとしても,時々刻々と変動する流れを
記録することは不可能に近い.また,企業間の取引関係そのも
2. 問 題 設 定
この章では,本論文で扱う問題を定式化する.企業をノード,
のについても,データは完全ではない.つまり,本来取引があ
企業間の取引関係をリンクとし,ノード集合 V ,リンク集合
るはずなのに,データ上,そのことが反映されないこともあり
E からなる有向ネットワーク G = (V, E) を対象とする.ノー
図1
図 2 各ノードの企業価値と売上高
企業間取引ネットワークとリンクの向き
ド数を N = |V |,リンク数を L = |E| ,ノード u の子ノード
集合を F (u),親ノード集合を B(u) と表す.リンクの向きは
モノ(価値)の流れを表し,ノード u から v への有向リンク
z=
∑

s(u) 1 −
u∈V
∑

ru,v  =
∑
z(v)
(3)
v∈V
v∈F (u)
(u, v) は,ノード v が u へ発注し,u が v へ製品を売り上げ,
が得られる.すなわち,各ノードの輸出・最終消費へ回る分の
納品し,v が u へ対価を支払ったことを意味する(図 1 参照).
総和(式 3 の第 2 辺)と各ノードの付加量の総和(式 3 の第 3
ノード u の売上高 s(u) は,ノード u の子ノード,および,
辺)は等しくなる.ここで,z は輸出・最終消費の総和,およ
ネットワーク外のインスタンス(最終消費や輸出,ネットワー
ク外企業)への価値の流れの和に分割して表すことができる.
s(u) =
∑

s(u)ru,v + s(u) 1 −
v∈F (u)
∑

ru,v 
び,付加量の総和を意味する.
本論文では,各ノードの輸出・最終消費へ回る分の総和と各
ノードの付加量の総和が等しくなる(式 3)という仮定に基づ
(1)
き,輸出・最終消費へ回った分を,各ノードの付加量として還
元するモデルを提案する.一般に,取引量だけからは,各ノー
v∈F (u)
ここで,ru,v はノード u の売上高 s(u) のうち,ノード v へ売
ドの付加量率はわからないが,還元する付加量率をモデルにし
り上げた割合を表す.式 1 第 1 項は子ノードへ売り上げた割合
たがい推定する.また,付加量率は業種などにより大きく異な
の和を,第 2 項はネットワーク外インスタンスへ売り上げた割
るため,所属する業種やティア,所在地都道府県などのカテゴ
合を意味する.
リごとに推定する.
一方,各ノードが売り上げたモノ(価値)は,親ノード u か
各ノードの売上高は,ネットワークに沿って売上比率で流れ
ら原材料として x(u, v) だけ仕入れ,そこに付加量 z(v) を付
る.すなわち,売上比率を推移確率とした際の PageRank [6], [7]
与するため(図 2 参照),ノード v の価値は以下のように定義
によりネットワークを流れる.ノード v の 1 ステップ後の推定
できる.
売上高(企業価値)を以下のように定める.
s(v) =
∑
sˆ(v) =
x(u, v) + z(v)
∑
s(u)ru,v + z(v)
(2)
式 1 と式 2 をそれぞれ全ノードで足し合わせると,式 1 は,
s(u) =

∑ ∑

u∈V
u∈V
(4)
ここで c(u) は,ノード u の属するカテゴリを意味する.そし
てパラメータ wc は,カテゴリ c の付加量率を表す.付加量
u∈B(v)
∑
s(u)ru,v + s(v)wc(v) z
u∈B(v)
u∈B(v)
=
∑

s(u)ru,v + s(u) 1 −
v∈F (u)
∑
v∈F (u)
率はノードの売上高に比例するという直観に基づき,パラメー
 タに売上高を乗算している.式 4 は,ノード v の企業価値が,
 ネットワーク内の親ノードからの取引量 ∑
s(u)ru,v と
u∈B(v)
ru,v 
 カテゴリごとに定まる付加量(本論文の仮定では,
「売上高に比
例して還元される輸出・最終消費分」と等しい) s(v)wc(v) z の
となり,式 2 は,
∑
s(v) =
v∈V

∑ ∑
v∈V

u∈B(v)


s(u)ru,v + z(v)

和で定まるとしたモデルである.
式 4 の sˆ(v) が真の売上高 s(v) になるように,カテゴリ数
K の次元のパラメータベクトル w = [wk ] を推定する.すなわ
ち,全ノードの総売上高 s =
∑
u∈V
s(u) とすると,各ノード
となり,短時間にカネが増加・減少することはないと仮定した
の真の売上高分布 pv = s(v)/s と推定売上高分布 pˆv = sˆ(v)/s
場合,
の KL ダイバージェンスが最小になるようにパラメータを推定
(
する.
{
∑
ˆ = arg min
w
w
v∈V
{
= arg max
w
}
pv
pv log
pˆv
∑
w
v∈V

pv log 
∑
u∈B(v)


pu ru,v + pv wc(v) z 

従って,ノード v がネットワーク内の親ノードから仕入れた原
材料などの価値の和を x(v) =
∑
x(u, v) とし,以下の
u∈B(v)
目的関数を最大化する問題として定式化する.
J(w) =
∑ s(v)
s
v∈V

∑
1
log 
s
s(u)ru,v
u∈B(v)

s(v)
+
wc(v) z 
s
{ (
)
}
1∑
=
s(v) log x(v) + s(v)wc(v) z −log(s) (5)
s
v∈V
に不要な定数倍と定数を除くと以下のようになる.
J(w) =
s(v) log(x(v) + s(v)wc(v) z)
K ∑
∑
yk w k
(11)
s(v) log(x(v) + s(v)wk z)
∑
v∈Ck
¯
s(v)(1 − qv (w))
wk
− λyk = 0
(12)
を得る.また,式 12 の両辺に wk を掛け,k に関して和をと
ると,
λ=
K
∑
∑
¯ =
s(v)(1 − qv (w))
k=1 v∈Ck
∑
¯
s(v)(1 − qv (w))(13)
v∈V
˜ w)
¯ を最大にするパラメータを以下
となるため,目的関数 J(w|
のように更新する.
∑
v∈Ck
w
ˆk =
¯
s(v)(1 − qv (w))
yk λ
∑
¯
s(v)(1 − qv (w))
v∈Ck
∑
=
v∈V
¯
s(v)(1 − qv (w))
(14)
上述した E ステップと M ステップを推定パラメータである付
加量率が収束するまで繰り返す.
4. 評 価 実 験
v∈V
=
˜ w)
¯
∂ J(w|
=
∂wk
yk
カテゴリ k に所属するノード集合を Ck とし,目的関数最大化
∑
)
˜ w)
¯ をパラメータ wk で微分し,
次に,M ステップで J(w|
pv log pˆv

∑
1−
K
∑
k=1
}
v∈V
= arg max
˜ w)
¯ = Q(w|w)
¯ +λ
J(w|
(6)
k=1 v∈Ck
4. 1 デ ー タ
日本のある自動車メーカーを始点として,取引ネットワーク
を構築する.そのために,帝国データバンクの保有する,2008
3. 推定アルゴリズム
年と 2012 年の企業間取引データを用いる.このデータには,
目的関数 6 を EM アルゴリズムにより解く.EM アルゴリズ
ある企業の属性(売上高,業種等)と,その取引先企業が記載
ムの E ステップでは,各ノード v に対して,現在のパラメー
されている.具体的には,以下のステップでデータを構築した.
¯ において取引量 x(v) の起こる事後確率を以下のよ
タ推定値 w
1: 日本のある自動車関連企業の取引先のうち,以下の産業分
類(業種)に属する企業を 1 次先,2 次先,3 次先の順番で抽
うに計算する.
¯ =
qv (w)
x(v)
x(v) + s(v)w
¯c(v) z
(7)
出(括弧内の数字は,帝国データバンクの業種分類コード)
染色整理業 (2260),プラスチック製造業 (2836),石油製品・
¯ を用いて,目的関数 J(w) を以下のように Q
事後確率 qv (w)
石油製品製造業 (29),ゴム製品製造業 (30),皮革・同製品・毛
関数と H 関数に分解する.
皮製造業 (31),板ガラス製造業 (3211),鉄鋼業,非鉄金属製造
業 (33),金属製品製造業 (34),一般機械器具製造業 (35),電気
K
∑
∑
¯ =
Q(w|w)
機械器具製造業 (36),輸送用機械器具製造業 (3711-3719),時
¯ log x(v)
s(v) {qv (w)
計・同部品製造業 (3870),卸売業 (4011-4024)
k=1 v∈Ck
¯ log s(v)wk z}
+(1 − qv (w))
(8)
2: 帝国データバンクでは,各社の事業内容を記したデータ
ベースを持っているが,この中に「自動車」という単語が含ま
¯ =
H(w|w)
K
∑
∑
れる企業については,上記分類に入っていなくても抽出
¯ log qv (w)
¯
s(v) {qv (w)
3: これとは別に,様々な資料等の情報から,
「この企業は入っ
k=1 v∈Ck
¯ log(1 − qv (w))}
¯
+(1 − qv (w))
(9)
ているはず」という企業を筆者が提示し,1 と 2 の作業で抽出
されていない場合,データベースに追加.なお,追加された企
こ こ で ,カ テ ゴ リ Ck に 所 属 す る ノ ー ド の 総 売 上 高 を
yk =
∑
∑
v∈V
v∈Ck
s(v) とすると,以下が成り立つ.
s(v)wc(v) =
K
∑
業のほとんどは,1 次先である.
構築されたデータは,一般のサプライチェーンの用語では,
始点の自動車メーカーから見ると,ティア 3 までのサプライ
yk w k
(10)
k=1
各カテゴリの付加量率の和が 1 になるようラグランジュ乗数 λ
˜ w)
¯ を以下のように再定義する.
を用いて目的関数 J(w|
ヤーを含むものになっている(サプライヤー以外の企業も多
く含んでいる)2008 年のデータには,49,203 社(ノード),
192,933 の取引関係(リンク),2012 年のデータには 51,895
社,229,990 の取引関係が含まれている.
4. 2 取引量の推定
テゴリカル還元法,赤棒が売上高に比例させた提案法の誤差改
1) 業種間での取引量の特定産業連関表 [8] を用いる.まず,帝
善率である.属性として,中分類業種の 6 業種,小分類業種の
国データバンクの産業分類は,産業連関表の分類(日本標準産
151 業種,所属する都道府県,愛知県にある自動車メーカを起
業分類)とは異なるので,両分類の対応関係を,著者が規定し
点としたサプライチェーンにおけるティアと,それらの可能な
た.これにより,本論文で用いる業種間の取引比率(ある業種
組み合わせを用いる.
の全産出中,特定の産業へ納入される比率)が求まる.ただし,
図 3(a) を見ると,いずれの属性を用いても,提案法の方が
数社の企業については,分類の対応関係の決定が困難であった.
誤差の改善率が高いことが見て取れる.ティアは 4 つのカテゴ
これらの企業(未分類企業),以降の計算で別途の扱いをする
リ(4 階層)しかないが,ティアごとのパラメータである付加
が,詳細は [5] を参照されたい.
量率を導入することで,導入しない場合での誤差の 1 割 5 分を
改善している.すなわち,どのティアに所属するかは,付加量
2) 取引量の比率を計算
業種 A の企業 a から,業種 B の企業 b に流れたモノの流れ
率に幾分か関係があることが示唆された.
の量を近似的に求める.企業 a の売上高を s(a),業種 A の国
一方,属性として 47 都道府県を用いた場合,どちらの手法
内生産額(Total)を TA ,内生部門計(Domestic)を DA と
でも有意な誤差の改善度は見られない.すなわち,どの都道府
すると,国内最終需要,および,輸出分は TA − DA となる.
県に所属するかは,付加量率に関係ないことが示唆された.
従って,産業連関表の業種 A から B への投入量 RA,B を用い
さらに,属性として 151 業種とティアを用いた場合では,提
て,企業 a から b への取引量 ra,b を以下のように近似する.
案法が 4 割以上の誤差を改善できたことがわかる.すなわち,
輸出・最終消費分へ流れた価値を各企業の売上高に比例して還
R
r˜a,b
A,B
s(b)
DA
D ×T
= s(a) ×
× ∑ AR B
A,C
TA
s(c)
c DA ×TC
(15)
が,4 割以上も減少したことになる.これは,企業間取引をよ
り精緻にモデル化できたことを意味する.
3) 規格化
2) で求めた取引量の比率を,企業 a からそのすべての取引先へ
ことになる.
r˜a,b
ra,b = ∑
r˜
c a,c
(16)
ただし,右辺分母の和は,企業 a から生産物を納入される,未
分類企業以外のすべての企業 c についてとる.
各ノードに関して,データとして与えられている真の売上高
s(u) とモデルにより推定した 1 ステップ後の売上高 sˆ(u) の L1
誤差により評価する(式 17).
|s(u) − sˆ(u)|
4. 4 推定パラメータに関する考察
この節では,実際に推定したパラメータについて考察する.
一般に,自動車産業においては,ティア(階層)別に,部品の
種類,複雑さ,加工度,データ外の企業との取引の度合いなど
4. 3 推定誤差の改善度
E1 =
図 3(b) を見ても,提案法が有意に誤差を改善しており,ほ
ぼ同様の結果が得られた.すなわち,安定した結果が得られた
の納入の総和が 1 になるように,規格化する.
∑
元して計算した 1 ステップ後の売上高と真の売上高の L1 誤差
が異なり,それぞれの階層で,付加量率も大きく異なると考え
られる.このことが,ティアによる改善度が大きさに反映して
いると考えられる.階層ごとの付加量率の違いは,データの性
質を反映していると考えられる.つまり,第 0 階層については,
(17)
u∈V
その主要な取引相手が,データに含まれていると考えられるの
で,比較的付加量率が少ないと考えられる.それに対して,第
実際には,カテゴリにかかわらず,各ノードの売上高に比例し
3 階層は,その取引相手がデータに含まれていない割合が高い
て按分する手法による誤差 E0 と比較した際の誤差の改善度に
ので,付加量率を高くしないとうまく売上を再現できない.本
より以下のように評価する.
論文の手法は,使っているデータが取引関係のどの程度の割合
E=
を再現しているのかを調べるためにも使える可能性があること
(E0 − E1 )
E0
(18)
提案法の有効性を評価するために,提案モデルのうち輸出・
が分かる.2008 年と 2012 年のパラメータを比べると,総じて
似たような傾向にあると言える.このことは,本論文の手法が,
国内最終消費の還元部分を売上高に比例させないモデル(以下,
特定のデータだけではなく,一般的に適用可能である可能性を
単純カテゴリカル還元法)と比較する.式 4 と比較すると以下
示している.
のようになる.
sˆ(v) =
∑
5. お わ り に
s(u)ru,v
u∈B(v)
wc(v)
+∑
z
wc(u)
u∈V
(19)
本論文では,企業間取引ネットワークにおけるモノの流れの
モデルを構築する上で重要な,
「付加量」について考察した.本
単純カテゴリカル還元法も,カテゴリにかかわらず全ノードに
論文のアプローチは,企業間ネットワークのモノの流れを正確
一様に按分する手法による誤差と比較した際の,誤差の改善度
に把握する,という観点で,有効なものであることが確認され
により評価する.
た.今後は,業種別の付加価値のデータなどを用いて,
(付加量
図 3 に誤差の改善度を示す.図 3(a) は 2008 年取引データ,
図 3(b) は 2012 年取引データであり,それぞれ,青棒が単純カ
ではなく)付加価値そのものが,企業間ネットワークとどのよ
うな関係にあるのか,分析したい.
(a) 2008 年取引データ
(b) 2012 年取引データ
図 3 売上高推定値の改善度
(a) 6 業種
(b) ティア
(c) 6 業種とティア
図 4 推定パラメータ
謝辞
本研究は,株式会社豊田中央研究所との共同研究および,
[4] Battiston, Stefano and Puliga, Michelangelo and Kaushik,
科学研究費補助金 (No.25・10411) の補助を受けた.企業間取
Rahul and Tasca, Paolo and Caldarelli, Guido : DebtRank:
引データの作成については,帝国データバンク産業調査部産業
Too Central to Fail? Financial Networks, the FED and Systemic Risk, Scientific Reports, vol.2,(2012)
分析課の協力をいただいた.
文
献
[1] 大西立顕, 高安秀樹, 高安美佐子 : 企業間ネットワークの数理構
造, 応用数理, vol. 20, No. 3, pp. 223-235 (2010)
[2] Yoshi Fujiwara and Hideaki Aoyama : Large-scale structure
of a nation-wide production network, Euro. Phys. Journal
B , vol. 77, pp. 565–580 (2010)
[3] 大西立顕, 高安秀樹, 高安美佐子 : 企業間取引ネットワークの
ページランク, IPSJ SIG Technical Report, (2010)
[5] 郷古浩道,斉藤和巳,武藤伸明:企業間取引データからの脆弱性
抽出,社会システムと情報技術研究ウィーク, (2013)
[6] Lawrence Page, Sergey Brin, Rajeev Motwani and Terry
Winogr : The PageRank Citation Ranking: Bringing Order
to the Web, Technical report, Stanford University (1998)
[7] Langville, A. N. and Meyer, C. D.: Deeper inside pagerank,
Internet Mathematics, Vol. 1, p. 2004 (2004)
[8] 総務省統計局:2005 年産業連関表 108 部門表