スライド 1

4.一般化線形モデル
目次
•
•
•
•
•
•
•
•
•
•
•
•
•
4.1一般化線形モデルとは
補:プロビット分析とロジット分析
4.2.二項ロジット・モデル
4.3.二項プロビット・モデル
4.4標本データからの推定と検定
4.4.1.パラメータの推定
4.4.2.パラメータの検定
4.4.3.数値計算例:デフォルト分析
4.5.二項モデルの拡張
4.5.1.逐次ロジット・モデル
4.5.2.順序ロジット・モデル
4.5.3.数値計算例:信用ランク分析(1)
4.6.ポアソン回帰モデル
4.一般化線形モデル
• 3章 判別分析:デフォルトするか否か
• 4章 一般化線形モデル:累積デフォルト確率はいくらか(離
散型確率変数)
•
•
•
•
個体が反応を起こす確率p
m個の共変量
モデル
ここで共変量の影響を
(4.1)
• とすると(4.1)は一般化線形モデル(generalized linear
model)
4.一般化線形モデル
• zがどうpに影響するかを考えるため
• リンク関数
• ex
①線形モデル(linear model)
しかし確率が負になったり1を超えることも。
②二項ロジット・モデル(binomial logit model)
ロジスティック分布の分布関数
4.一般化線形モデル
③二項プロビット・モデル(binomial probit model)
標準正規分布の分布関数
④対数モデル(logartithm model)
指数分布の分布関数
代表例:ポアソン回帰モデル
②~④はpは[0,1]に納まる
目次
•
•
•
•
•
•
•
•
•
•
•
•
•
4.1一般化線形モデルとは
補:プロビット分析とロジット分析
4.2.二項ロジット・モデル
4.3.二項プロビット・モデル
4.4標本データからの推定と検定
4.4.1.パラメータの推定
4.4.2.パラメータの検定
4.4.3.数値計算例:デフォルト分析
4.5.二項モデルの拡張
4.5.1.逐次ロジット・モデル
4.5.2.順序ロジット・モデル
4.5.3.数値計算例:信用ランク分析(1)
4.6.ポアソン回帰モデル
プロビット分析とロジット分析
Chester Bliss
1920年代 米国農務省昆虫学研究
殺虫剤実験
• 昆虫の集団をガラス瓶に入れ、異なる殺虫剤を撒布
⇒どんな強い殺虫剤でも数匹生き残る
どんな弱い殺虫剤でも数匹死ぬ
⇒Ronald Aylmer Fisher
William Sealy Gosset
の範囲外
⇒薬の分量とその分量で昆虫が死ぬ確率(probability)を関係づける
=プロビット(probit)分析つくる
LD-50:50%致死量。50%の死亡率を持つ殺虫剤の分量
プロビット分析とロジット分析
毒物学の数学的基礎付け
16C パラケルスス
「分量が大なら潜在的には毒となり、分量が小なら無
毒となる」
Blissはこれに不確実性を導入
1933年 世界恐慌の中失業
英国へ渡り、Fisherとともにプロビット分析を研究
その後、ソ連レニングラード植物研究所
一時はスパイ容疑をかけられたことも。
正規分布を使う→プロビット分析
ロジスティック曲線を使う→プロビット分析
目次
•
•
•
•
•
•
•
•
•
•
•
•
•
4.1一般化線形モデルとは
補:プロビット分析とロジット分析
4.2.二項ロジット・モデル
4.3.二項プロビット・モデル
4.4標本データからの推定と検定
4.4.1.パラメータの推定
4.4.2.パラメータの検定
4.4.3.数値計算例:デフォルト分析
4.5.二項モデルの拡張
4.5.1.逐次ロジット・モデル
4.5.2.順序ロジット・モデル
4.5.3.数値計算例:信用ランク分析(1)
4.6.ポアソン回帰モデル
4.2.二項ロジット・モデル
• 共変量ベクトル
•
•
•
•
非デフォルト s=1
デフォルト s=2
リンク関数
デフォルト状態の確率
4.2.二項ロジット・モデル
• (4.6)より共変量の
•
が変化した時のデフォルト確率の変化の大きさ
4.2.二項ロジット・モデル
• よって共変量
弾性値
に関するデフォルト確率の
4.2.二項ロジット・モデル
• (4.6)を
• ∴
• ∴
• ∴
について逆関数
4.2.二項ロジット・モデル
•
•
•
•
•
項目反応理論(item response theory)
刺激の総和 U
観測される刺激量 u
観測されない刺激量
しきい値
4.2.二項ロジット・モデル
4.2.二項ロジット・モデル
• 項目反応モデル:しきい値を超えるかどうか
を判断するモデル
• ex.金融:デフォルトor非デフォルト
• ⇒しきい値を下回るとデフォルトと考える
4.2.二項ロジット・モデル
とする。デフォルトが発生するのは
• 刺激の総和 U
• 観測される刺激量
• 観測されない刺激量
• しきい値
• とおくと
4.2.二項ロジット・モデル
• だから
• より
• デフォルト確率は
4.2.二項ロジット・モデル
• ここで
がロジスティック曲線に従うとすると
• このときのデフォルト確率は
目次
•
•
•
•
•
•
•
•
•
•
•
•
•
4.1一般化線形モデルとは
補:プロビット分析とロジット分析
4.2.二項ロジット・モデル
4.3.二項プロビット・モデル
4.4標本データからの推定と検定
4.4.1.パラメータの推定
4.4.2.パラメータの検定
4.4.3.数値計算例:デフォルト分析
4.5.二項モデルの拡張
4.5.1.逐次ロジット・モデル
4.5.2.順序ロジット・モデル
4.5.3.数値計算例:信用ランク分析(1)
4.6.ポアソン回帰モデル
4.3.二項プロビット・モデル
• リンク関数:標準正規分布の分布関数
• デフォルト状態の確率:
4.3.二項プロビット・モデル
○(4.11)の
が標準正規分布に従うと二項
プロビット・モデル
• とすると、デフォルト確率
4.3.二項プロビット・モデル
○標準正規分布の分布関数の逆関数値
=重回帰モデル
• ∴
• ∴
4.3.二項プロビット・モデル
○正規分布はロジスティック分布で近似できる
• ロジスティック分布の分布関数
(4.13)
• 成長曲線
4.3.二項プロビット・モデル
• 確率変数Xがロジスティック分布(4.13)に従う
とすると
• Xの積率母関数
•
4.3.二項プロビット・モデル
• 積率母関数の性質より
•
D=1.7
で近似している。
4.3.二項プロビット・モデル
• この近似をデフォルト確率に適用すると
※
=1
• しかし尖度について
裾野の部分が正規分布よりも厚くなってしまう