福岡大学都市空間情報行動研究所 斎藤参郎 [email protected] 地域システム論 A II ハフモデルの理論と展開 4 4.1. ハフモデルの修正・拡張とその応用例 ハフモデルの修正と拡張 4.1.1. 4.1.2. 4.1.3. 4.1.4. 1) 2) 3) 4) 修正ハフモデル 拡張ハフモデル 流出率の考慮 非集計モデル 問題の背景 確率的効用と選択確率 多項ロジットモデル 非集計ハフモデル 4.2. 実際の応用例 4.2.1. 延岡商業近代化モデルによる拡張ハフモデル、流出率、非集計ハフモデルの推計 1) 集計拡張ハフモデル推定と解釈 2) 流出率の考慮 • 自宅周辺の商業地 3) 非集計ハフモデルの推定と解釈 • 売場面積の効用 • 時間の効用 4.2.2. 延岡商業近代化モデルによる政策実験、商圏分析 • 商圏の推定 • 限界売場効率 • 政策実験 4. ハフモデルの修正・拡張とその応用例 4.1. ハフモデルの修正と拡張 4.1.1. 修正ハフモデル 仮定 3 の修正 U ij = S µj , i = 1,..., n, j = 1,..., m Tijλ 修正ハフモデルの確率式は次となる。 Pij = S µj Tijλ Skµ ∑ T λ , i = 1,..., n, j = 1,..., m k =1 ik m (4.1) 演習 式(4.1)を導け。 理由 仮説例で居住地2は、ショッピングセンターA,B への時間距離が同じ。このとき、明 らかに、行先選択確率は、ハフ原モデルでは、売場面積に正比例する。すなわち、 5000 :15000 = 1: 3 である。どのように観測選択確率が変化しても、予測選択確率は P2 A = 0.25, P2 B = 0.75 で、変らない。いいかえると、モデルのパラメータをどんなに動 かしても、居住地2の観測選択確率へのあてはまり(再現率)が改善されない。 パラメータ µ を導入することで、この欠点を改善したもの。 4.1.2. 拡張ハフモデル 仮定3の拡張 (魅力要因の多様化) µ U ij = F1µj1 F2µj2 " Fpj p Tijλ , i = 1,..., n, j = 1,..., m ただし、 Fkj , k = 1,..., p は j 商業地の第 k 番目の魅力要因 拡張ハフモデルの確率式は次となる。 µ Pij = F1µj1 F2µj2 " Fpj p Tijλ m ∑ k =1 µ F1µk 1 F2µk2 " Fpkp Tikλ , i = 1,..., n, j = 1,..., m (4.2) 演習 式(4.2)を導け。 背景 従来のハフモデルへの批判に、魅力要因が売場面積だけに限定されている、との批判 があった。商業地の売場面積は、「品揃えの豊富さ」といった要因が、売場面積に比例す ると考えると、ワンストップショッピングの利便性を高め、その商業地の吸引魅力を表 わしている、と考えられる。 しかし、吸引魅力には、交通アクセスのよさや、駐車場の充実、また、センスのよさ や、買い物の楽しさ、などの要因も考えられる。これらの魅力要因を F1 ,..., Fp の p コの 魅力要因を明示的に導入したモデルである。 4.1.3. 流出率の考慮 背景 行先商業地として、すべてを列挙することはできない。市街への流出、あるいは、自宅 周辺といった、その他の商業地への流出率 β i , i = 1,..., n を考慮する必要がある。ここで、 歩留り率 α i = 1 − β i とすると、商業地 j の販売額は次となる。 n RS j = ∑ α i ⋅ ci ⋅ I i ⋅ POPi ⋅ Pij i =1 この α i の推定問題。 4.1.4. 非集計ハフモデル 1) 問題の背景 旧来のハフモデルでは、行先商業地選択に対する選択主体の個人属性を説明変数として、 導入することができなかった。 なぜなら、居住地別に購買行動調査のデータを集計した結果である、行先商業地選択確 率を説明するモデルが、従来のハフモデルであり、そこでは、個人属性は、集計によって、 識別できなくなっているからである。このことから、従来のハフモデルは、「集計型」 (aggregate)ハフモデルと呼ばれている。 これに対して、ノーベル経済学賞を受賞した、McFadden らによる、多項ロジットモデ ルやプロビットモデルの理論の進展によって、ハフモデルの非集計化が可能になった。 現在の主流は、この非集計型ハフモデルである。非集計ハフモデルの推定は、最小二乗 法ではなく、最尤推定法を用いる。 これらの流れを正しく理解するためには、まず、 (a) 効用関数に:確率を導入した、確率効用関数と消費者の選択確率との関係を理解する こと、次いで、 (b) 多項ロジットモデルの考え方、そして、これを応用した、 (c) 非集計ハフモデルの考え方 を理解することが、大事である。 とくに、従来の効用最大化行動の理論的枠組みが、確率的効用関数によって、自然に拡 張され、確率的効用関数のもとでの効用最大化行動の帰結として、消費者の選択確率が求 まるという、考え方は画期的であり、これを理解することが、重要である。 2) 確率的効用関数と選択確率 非集計モデルでは確率的効用関数と選択確率との関係を理解することが基本である。 従来の経済学では、各商業地に確定的な効用を付与すれば、消費者行動は最大の効用 を与える商業地を 1 ヶ所選択するのみで、複数の商業地をある確率にしたがって、同時 に選択するといった、消費者行動を導くことはできなかった。 この点を理論的に解決したのが確率的効用関数の考え方である。この考え方は、多項 ロジットモデルと密接な関連をもち、非集計ハフモデルの推定につながっている。 これは次のサイコロのモデルを用いて考えると理解しやすい。 • サイコロによるモデル 2 つのサイコロ A とBがある。それぞれ 1、2、3 と 1.5、2.5、3.5の目をもつ。ある 消費者が商業地Aに行くかBに行くかを決めるのに、A,Bのサイコロをふって、出た目の 大きい商業地に行くと考えよう。 この考え方を整理すると次のようになる。サイコロAの出る目の数を表わす確率変数を U A 、サイコロBのそれを U B とする。 これをA、Bのもつ、確率的効用関数であると考える。消費者が商業地Aを選択する確率 PA は次のように表わされる。 PA = Pr(U A > U B ) • 商業地Aの選択確率 PA の計算 サイコロの目はそれぞれ 1 3 の確率で一様に出ると考え、サイコロAとBは独立であると しよう。出る目の組み合わせは 9 通りあり、それぞれ 1 9 の確率である。 UB UA U A =1 U A =2 U A =3 U B =1.5 U B =2.5 U B =3.5 ● ● ● ○ ● ● ○ ○ ● ○の場合が、 U A が U B よりも大きな目がでる場合である。 PA は 3 × (1 9) = 1 3 である。 3) 多項ロジットモデル 簡潔に多肢選択ロジットモデルの考え方と推定方法について説明しておく。詳しくは 参考文献をみられたい。 1) 多肢選択ロジットモデルの考え方 いま属性 S をもって選択主体 i がいて、2 つの選択対象 1,2 のいずれかを選択する状 況を想定する。選択対象 1,2 は、主体 i にとって、 x1 , x 2 の属性をもっているとする。 選択主体が選択対象 1,2 から得る効用は x と S の関数であり、その関数型は主体が変わ っても同一としよう。更に、効用関数は確定的なものではなく、そこに確率的変動が含 まれていると考える。この確率的変動を η で表わし、効用関数を U で表わすと、 U は U ( x, s, η ) と書ける。 U の具体的な形が必要であり、これを未知パラメータ β の線型関数、 β ′Z ( x, s ) と η と の和と考え、次のように定式化する。 U ( x, s, η ) = β ′Z ( x, s ) + η ( x, s ) ① さて選択主体 i が対象 1 を選択する確率とは、 ① で求める 1 の効用が 2 の効用を上まわ る確率と考えるのが妥当であろう。すなわち i が 1 を選択する確率を P1 とすると、 ② と なる。 P1 = Pr ob (U 1 ≥ U 2 ) = Pr ob ( β ′Z ( x1 , s ) + η ( x1 , s ) ≥ β ′Z ( x 2 , s ) + η ( x 2 , s ) ) = Pr ob (η ( x 2 , s ) − η ( x1 , s ) ) ≤ β ′ ( Z ( x1 , s ) − Z ( x 2 , s ) ) β ′Z を V と略記すると、 ② は ②′ となる。 ② P1 = Pr ob (η 2 − η 1 ≤ V 1 − V 2 ) ②′ ②′ は η 2 − η1 の確率分布を求めるものであり、 η の分布によって決まることになる。 一般に V 1 − V 2 = ∞ のとき P1 = 1 であるから次のようなロジスティック関数と呼ばれる ものを考えると都合がよい。 P1 = Pr ob (η 2 − η 1 ≤ V 1 − V 2 ) = ③ 1 1 + e − (V 1 −V ) 2 そして独立な確率変数の差の分布が ③ の形になる η の分布にはワイブル分布があるこ とが知られている。 更にワイブル分布には多肢選択モデルへ展開するのに都合のよい次の性質をもつ。 η1 , ⋅ ⋅ ⋅,η j をもつ独立的なワイブル分布とするとき max (η1 , ⋅ ⋅ ⋅,η J ) もまたワイブル分布。 j Pr ob (V 1 + η1 ≥ V j + η j , = 1 J 1+ ∑ e V j −V1 = j =2 j = 2, ⋅ ⋅ ⋅, J ) for 1 J ∑e ④ V j −V1 j =1 すなわち、④ は選択対象が 1,2,⋅ ⋅ ⋅ ⋅⋅,J コある場合に、1 が選択される確率とみることがで きるからである。 そこで選択対象 k, l ∈ J の選択確率の比の対数、すなわちロジットをとり、 ⑤ の定式化 を得る。 log Pk = β ′ ( Z ( x k , s) − Z ( xl , s) ) Pl ⑤ β の推定方式 2) β の最尤推定値を推定する。選択主体が i = 1, ⋅ ⋅ ⋅, I 、選択主体 i の選択対象の集合を J i と し、 i が j ∈ J i を選択する確率を Pji とすると、尤度は観測頻度 f ji を用いて、 ⑥ となる。 I Ji ∏∏ Pji ji , 但し i j f Ji ∑f j =1 ji =1 ⑥ 対数尤度 L( β ) は以下となる。 Ji I ⎡ Ji ⎤ L( β ) = −∑∑ f ji log ⎢ ∑ exp ( β ′( Z ki − Z ji ) ⎥ i =1 j =1 ⎣ k =1 ⎦ これの最大値を Newton-Raphson 法によってもとめる。 (v) でステップを表わすと、 これは β ( v +1) =β (v) ⎡ I Ji ′⎤ + ⎢ ∑∑ ( Z ji − Z i( v ) ) Pji( v ) ( Z ji − Z i( v ) ) ⎥ ⎣ i =1 j =1 ⎦ −1 ⎡ I Ji ⎤ × ⎢ ∑∑ ( Z ji − Z i( v ) )( f ji − Pji( v ) ) ⎥ ⎣ i j ⎦ ⑦ Ji 但し Z i( v ) = ∑ Z ji Pji( v ) j =1 となる。 ⑦ がここでの推定方式である。 参考文献 T. A. Docmencich and D. McFadden 『Urban Travel Demand』 North-Holland 1975 コックス 『ニ値データの解析』 朝倉書店 1980 Moshe Ben-Akiva and Steven R. Lerman 『Discrete Choice Analysis』 The MIT Press 1985 土木学会編 『非集計行動モデルの理論と実際』 土木学会 1995 4) 非集計ハフモデル ロジットモデルからハフモデルを導くことができる。これを非集計ハフモデルとよぶ。 • ロジットモデル(Logit Model)の要点。 ロジットモデルの要点は、選択対象 j = 1,..., m があるとき、その確率効用関数を、確定的効 用 V j と確率項 ε j の和として、 U j = Vj + ε j と表わすとき、 j を選択する確率 Pj は、 V e j , j = 1,..., m Pj = V e 1 + " + eVm (4.3) となることである。これより、非集計ハフモデルを次のように導出する。 • 非集計ハフモデルの導出 商業地 j の効用関数の定数項部分を次のように考える。 V j = µ log S j − λ log T j すると、 j を選択する確率 Pj は、 (4.4) V µ log S − λ log T j j e j e = Pj = V e 1 + " + eVm e µ log S1 −λ log T1 + " + e µ log Sm −λ log Tm S µj = T jλ Smµ S1µ + " + T1λ Tmλ となり、ハフモデルが導かれた。ここで選択主体 i は固定されているので、その記号を略 していることに注意されたい。 4.2. 実際の応用例 4.2.1. 延岡商業近代化モデルによる拡張ハフモデル、流出率、非集計ハフモデルの推計 1) 拡張ハフモデル推定と解釈 延岡地域商業近代化計画において使用されたハフモデルを例に取り上げる。 延岡地域での居住地ベース購買行動調査の概要は次の表の通り。 調査対象居住地は、延岡市内 22 小学校区と延岡市周辺の 1 市 5 町である。 (①-1, ①-2 参照) この購買行動調査データを用いて、ハフモデルを推定する。 ハフモデルの推定にあたっては、14 品目の品目別に推定するとともに、市内居住者と市外 居住者に対して別々に推定を行っている。 市内居住者のハフモデルの推定には、行先商業地は、市内の 17 商業地に、自宅付近をくわ え、市外 5 商業地を含めて、全部で 23 商業地を取り上げている。市外居住者の場合には、 延岡商業地を 7 商業地にまとめている。品目はいずれの場合も 14 品目である。 ここでは、市内居住者の生鮮食品、洋服呉服(高額、外出用)の 2 つの推定結果を例示す る。 log Pij = −0.6498log Tij + 0.0858log S j +0.0873log SDEPj + 0.4908KDUM + 1.0783RECOM 1 +1.3007 RECOM 2 + 1.7601RECOM 6 + 1.5786 RECOM 7 +1.3385 RECOM 8 + 居住地ダミー Pij : i 居住地消費者の j 商業地選択確率 Tij : i 居住地から j 商業地への時間距離(分) S j : j 商業地全業種小売売場面積( m 2 ) SDEPj : j 商業地百貨店売場面積( m 2 ) KDUM :恵比須(寿屋)ダミー RECOM 1 :レーヨン通り・居住地ダミー RECOM 2 :旭サービス本店・居住地ダミー1 RECOM 7 :幸町(アヅマヤ)恵比須(寿屋)居住地ダミー2 RECOM 6 :旭サービス本店・居住地ダミー3 RECOM 8 :南町・居住地ダミー log Pij = −0.4668log Tij + 0.0323log S j + 0.0795log SDEPj +0.0451log SAPPj + 0.4133寿屋ダミー +0.8818山下新天街ダミー + 1.6848 RECOM 3 +1.6049 RECOM 4 + 0.5502 RECOM 6 + 居住地ダミー SAPPj : j 商業地衣料品売場面積 RECOM 3 :旭サービス本店・居住地ダミー2 RECOM 4 :幸町恵比須・居住地ダミー1 時間距離、百貨店売場面積が有意に出ている。また、寿屋ダミーも有意である。寿屋ダミ ーは、同じ売場面積でも、百貨店や大型店では、平均的な吸引力よりも、このダミーの係 数分だけ高い吸引力を持っていることを示しており、いわば、大型店のプレミアム効果と もいうべきものである。 時間距離の係数を生鮮食品と洋服呉服で比較すると、生鮮食品のほうが、絶対値が大きい。 これは、生鮮食品のほうが、距離抵抗が高いことを示している。つまり、距離が大きくな るにつれて、急激に選択する人が減ることを意味している。一般に、買い回り品目といわ れる衣料品は、距離抵抗が低い。 市内居住者、市外居住者に対する、14 品目別のハフモデルのの実際の推定結果が、表 A、 B である。決定係数を高めるために、魅力要因の多様化とともに、様々なダミー変数を用 いていることが分かる。 (②-1 ~ ②-4, ③-1 ~ ③-4 参照) 2) 流出率の考慮 問題の所在: 延岡地域の購買行動調査では、行先商業地の選択肢の中に、自宅付近の商業地、という選 択肢を設けている。このような選択肢を設定すると、2 つの意味で困難が生ずる。 (a) 回答者ごとにその選択肢の意味が異なる。すなわち、A 地区の人のこの選択肢への解答 は、B 地区の人のそれと全く異なること。 (b) この選択肢をハフモデルの推定に加えるとなると、売場面積などのデータが、必要であ るが、その確定が困難である。 延岡商業近代化ハフモデルでは、自宅付近以外への流出率、すなわち、自宅付近以外の行 先選択肢への歩留まり率を α i として、これを次のように推定している。 居住地 i の消費者の自宅付近以外(居住地 i 以外)への流出率 α i とすると、 i 居住地消費者 が j 商業地を選択する確率 Pij は次となる。 Pij = α i ⋅ S µj Tijλ Skµ ⎛ ∑ T λ = ⎜αi k =1 ik ⎝ m µ Skµ ⎞ S j ∑Tλ ⎟Tλ k =1 ik ⎠ ij m m ここで、 ∑ Skµ k =1 Tikλ の項は、 i に:関して、一定であるが、 α i と推定上、識別ができない。 そこで、 ⎛ Ci = log ⎜ α i ⎝ Skµ ⎞ ∑Tλ ⎟ k =1 ik ⎠ m とおいて、次を考える。 log Pij = Ci + µ log S j − λ log Tij これから、最小二乗法によって、 Ci , λ , µ の推定値、 Cˆ i , λˆ, µˆ を求め、次式によって、自宅 付近以外への流出率 α i の推定値 αˆ i を求めている。 ⎛ m S µˆ αˆi = ⎜ ∑ kˆ ⎜ k =1 T λ ik ⎝ ⎞ Cˆ ⎟e i ⎟ ⎠ 3) 非集計ハフモデルの推定と解釈 延岡での非集計ハフモデルの推定結果とその解釈を述べる。 非集計ロジットハフモデルの利点は、その解釈が、商業地選択確率と効用の概念が直接結 びつくことである。 市内居住者の場合の推定結果から、その解釈を試みよう。 4 品目間の距離抵抗を比較すると、外出着が最も低く、保存食品で最も大きい。 1 分に対する効用の比率を、保存食品と外出着で求めてみると、 e0.1401−0.0361 = 1.110 保存食品のほうが、外出着よりも、負の効用が 1.11 倍だけ高いことが分かる。 興味深いことに、売場面積は、その逆であり、保存食品で最も高く、外出着で最も低い。 e0.0834−0.0223 = 1.063 保存食品のほうが、外出着より、倍、効用が高いことが分かる。これは、売場における商 品密度などが関係しているともいえ、興味深い。 (④-1, ④-2 参照) 4.2.2. 延岡商業近代化モデルによる政策実験、商圏分析 1) 商圏距離の推定 ハフモデルを、一度推定すると各商業地の商圏距離を推定することができる。 延岡の場合は、14 品目ごとに各商業地の商圏距離を、求めることができる。 ハフモデルは、売場面積、居住地と商業地間の距といった、説明変数を、推定式に代入す ることで、各商業地の選択確率を予測するものである。しかし、逆に、その商業地が5% で選択されるとの仮定を代入し、それを満たす時間距離を算出することができる。 当然、定数項は、居住地によって異なるし、また、拡張ハフモデルでは、様々な変数や、 ダミー変数も含まれているので、正確には、居住地ごとに、異なった商圏距離が出てくる。 ここでは、平均的な居住地を想定し、例えば、5%の商圏距離を、次式で求めている。 ここでは、T j 以外の変数は、すべて固定し、式(4.5)を、T j に:関する方程式とみて、解いて いる。 0.05 = ⎛ µ ⎜ S j 1 n m Skµ ⎜Tλ + n ∑∑ Tλ i =1 k =1 ik ⎜ j k≠ j ⎝ S µj T jλ ⎞ ⎟ ⎟ ⎟ ⎠ (4.5) このようにして、5%、10%、20%の吸引力をもつ時間距離を、商業地別、品目別に推定 したのが、次表である。 小さな商業地、生鮮食品といった品目では、商圏が小さく、大き な商業地、買回り品目で、商圏が大きくなっているのが、分かる。 (⑤ 参照) 2) 限界売場効率 売場面積を一単位増やしたときどれだけ売上高の増分に寄与するかをはかる、限界売場効 率ともいうべき指標を、を算出することができる。 式(4.3)の V j に式(4.4)を代入し、居住地の添字 i を加えて考えると、次がえられる。 Vij dPij dS j = d dS j e ∑ k =1 eV m = µ Pij Sj e Vij ∑ m ∑e dS j = (∑ k =1 eVik ) − e ij e m m e = µ Pij Sj ∑ µ k =1,k ≠ j m k =1 m eVik k =1 ) Vij dVij dS j 2 (4.6) λ Sk Tik ∑ Skµ k =1 V (∑ ik Vik k =1, k ≠ j m Vik dVij Tikλ 演習 式(4.6)の第 3,4 番目の等式を示せ。 式(4.6)を用い、 S j を動かしたときの、 j 商業地の販売額の増分は、次となる。 m n dPij n µ Pij d = ∑ ci Ii POPi RS j = ∑ ci I i POPi dS j dS j i =1 Sj i =1 ∑ k =1, k ≠ j m Skµ Tikλ ∑ Sk k =1 µ (4.7) λ Tik 次の表は、延岡ハフモデルを用いて算出した、品目別、商業地別の限界売場効率である。 ただし、簡単のため、式(4.7)の最後の項は、無視している。 (⑥ 参照) 3) 政策実験 政策実験の例をあげておこう。 次の表にしたがって、延岡商業近代化計画の政策実験を行っている例である。 (⑦-1 ~ ⑦-5 参照)
© Copyright 2025 ExpyDoc