11月20日版

2014年11月26日 M 情報幾何学(藤岡敦担当)授業資料
1
§9. α 接続
§6 において扱ったように, 統計的モデルは Fisher 計量に関して Riemann 多様体とみなすことが
できるから, Levi-Civita 接続を考えることができる. 更に, 統計的モデルに対しては実数のパラ
メータ α に対して, α 接続というアファイン接続を考えることができる.
まず, 多様体のアファイン接続を局所的に表してみよう.
M を n 次元 C ∞ 級多様体, ∇ を M のアファイン接続, (U, φ) を M の座標近傍とし,
φ = (x1 , x2 , . . . , xn )
と表しておく.
このとき, ∇ は U 上で
∑
∂
∂
∇ ∂
=
Γkij
∂xi ∂x
∂xk
j
k=1
n
(∗)
と表すことができる. ただし, Γkij (i, j, k = 1, 2, . . . , n) は U 上で定義された C ∞ 級関数である.
Γkij を Christoffel の記号という.
定理
∇ が捩れのないアファイン接続ならば, 任意の i, j, k = 1, 2, . . . , n に対して
Γkij = Γkji .
逆に, 任意の座標近傍に対して上の式がなりたつならば, ∇ は捩れをもたない.
証明 T を ∇ の捩率とする.
i, j = 1, 2, . . . , n とすると,
)
[
]
(
∂
∂
∂
∂
∂
∂
,
=∇ ∂
−∇ ∂
−
,
T
∂xi ∂x
∂xj ∂x
∂xi ∂xj
∂xi ∂xj
j
i
n
∑
( k
) ∂
Γij − Γkji
=
.
∂xk
k=1
□
次に, Riemann 多様体の Levi-Civita 接続を局所的に表してみよう.
(M, g) を n 次元 C ∞ 級 Riemann 多様体, ∇ を M の Levi-Civita 接続とし, 上のように座標近傍
を選んでおく.
∇ は計量的だから, i, j, k = 1, 2, . . . , n とし, (∗) を用いると,
(
)
(
)
(
)
∂
∂
∂
∂
∂
∂
∂
g
,
=g ∇ ∂
,
+g
,∇ ∂
∂xi ∂x
∂xi ∂x
∂xi
∂xj ∂xk
∂xj
j ∂xk
k
( n
)
(
)
n
∑
∑
∂
∂
∂
∂
=g
Γlij
,
,
Γlik
+g
.
∂xl ∂xk
∂xj
∂xl
l=1
(
よって, gij = g
∂
∂
,
∂xi ∂xj
l=1
)
とおくと,
∂i gjk =
n
∑
l=1
Γlij glk
+
n
∑
l=1
Γlik gjl .
§9. α 接続
2
(gij ) は正定値実対称行列に値をとり, ∇ は捩れをもたないから, 上の定理より,
∂i gjk + ∂j gki − ∂k gij =
n
∑
Γlij glk
l=1
n
∑
=2
+
n
∑
Γlik gjl
+
l=1
n
∑
Γljk gli
+
n
∑
l=1
Γlji gkl
−
n
∑
l=1
l=1
Γlki glj
−
n
∑
Γlkj gil
l=1
Γlij glk .
l=1
(g ij ) を (gij ) の逆行列とし, m = 1, 2, . . . , n とすると,
n
∑
g
km
(∂i gjk + ∂j gki − ∂k gij ) = 2
k=1
n
∑
g
km
k=1
=2
=
=
n ∑
n
∑
n
∑
Γlij glk
l=1
Γlij glk g km
l=1 k=1
n
∑
2
Γlij δlm
l=1
2Γm
ij .
ただし, δlm は Kronecker の δ である.
したがって, m を k, k を l と置き替えると,
1 ∑ lk
g (∂i glj + ∂j gil − ∂l gij ).
=
2 l=1
n
Γkij
また,
Γij,k
(
=g ∇
∂
∂
,
∂
∂xi ∂x
j ∂xk
)
とおくと,
Γij,k =
n
∑
Γlij glk
l=1
n
1 ∑ ml
g (∂i gmj + ∂j gim − ∂m gij )glk
=
2 l,m=1
=
n
1∑
(∂i gmj + ∂j gim − ∂m gij )δmk
2 m=1
1
= (∂i gkj + ∂j gik − ∂k gij ).
2
Γij,k も Christoffel の記号という.
さて, 統計的モデルに対して Fisher 計量を考え, Levi-Civita 接続に対する Christoffel の記号を
計算してみよう.
Ω を高々可算集合または Rk とし,
S = {p(x; ξ)|ξ ∈ Ξ}
を Ω 上の n 次元統計的モデルとする.
§9. α 接続
3
§6 において扱ったように, S を ξ = (ξ1 , ξ2 , . . . , ξn ) を局所座標系とする n 次元多様体とみなすと,
その Fisher 計量は
)(
)
∫ (
∂
∂
gij (ξ) = Eξ [∂i lξ ∂j lξ ] =
log p(x; ξ)
log p(x; ξ) p(x; ξ)dx (i, j = 1, 2, . . . , n)
∂ξi
∂ξj
Ω
によりあたえられるのであった.
i, j, k = 1, 2, . . . , n とすると,
∂k gij = Eξ [(∂k ∂i lξ )(∂j lξ )] + Eξ [(∂i lξ )(∂k ∂j lξ )] + Eξ [(∂i lξ )(∂j lξ )(∂k lξ )]
だから,
2Γij,k = ∂i gkj + ∂j gik − ∂k gij
= Eξ [(∂i ∂k lξ )(∂j lξ )] + Eξ [(∂k lξ )(∂i ∂j lξ )] + Eξ [(∂k lξ )(∂j lξ )(∂i lξ )]
+ Eξ [(∂j ∂i lξ )(∂k lξ )] + Eξ [(∂i lξ )(∂j ∂k lξ )] + Eξ [(∂i lξ )(∂k lξ )(∂j lξ )]
− Eξ [(∂k ∂i lξ )(∂j lξ )] − Eξ [(∂i lξ )(∂k ∂j lξ )] − Eξ [(∂i lξ )(∂j lξ )(∂k lξ )]
= 2Eξ [(∂i ∂j lξ )(∂k lξ )] + Eξ [(∂i lξ )(∂j lξ )(∂k lξ )].
すなわち,
1
Γij,k = Eξ [(∂i ∂j lξ )(∂k lξ )] + Eξ [(∂i lξ )(∂j lξ )(∂k lξ )]
2 )
[(
]
1
= Eξ ∂i ∂j lξ + ∂i lξ ∂j lξ (∂k lξ ) .
2
ここで,
Tijk = Eξ [(∂i lξ )(∂j lξ )(∂k lξ )]
とおき, 変数変換 η = η(ξ) を考えよう. 新しい局所座標系 η に対しても上と同様に T˜rst を定め
ると,
T˜rst = Eη [(∂˜r lη )(∂˜s lη )(∂˜t lη )]
n
∑
∂ξi ∂ξj ∂ξk
Tijk
=
∂η
r ∂ηs ∂ηt
i,j,k=1
となるから, Tijk は S 上の (0, 3) 型のテンソル場を定める.
よって, 任意の α ∈ R に対して
[(
)
]
1−α
(α)
Γij,k = Eξ ∂i ∂j lξ +
∂i lξ ∂j lξ (∂k lξ )
2
(α)
とおくと, Γij,k は S のアファイン接続 ∇(α) を定める. ∇(α) を α 接続という.
特に, 0 接続 ∇(0) は Fisher 計量に対する Levi-Civita 接続に他ならない.
また, 任意の i, j, k = 1, 2, . . . , n に対して
(α)
(α)
Γij,k = Γji,k
がなりたつから, 上の定理より, ∇(α) は捩れをもたない.
§9. α 接続
4
関連事項 9. Chentsov の定理
1 つの多様体に対して考えることのできる Riemann 計量やアファイン接続はもちろん一通りで
はない. それでは, 統計的モデルに対する Fisher 計量や α 接続はどのように特徴付けられるの
であろうか.
まず, §8 において扱ったように, あたえられた統計的モデルから別の統計的モデルへの変換が十
分統計量であるとき, Fisher 計量に対して不変性がなりたつのであった.
このとき, α 接続に対しても不変性がなりたつ. 実際, 上の変換の下で確率関数または密度関数
が p(x; ξ) から q(F (x); ξ) へ写されるとすると, F が十分統計量であることから,
∂i log p(x; ξ) = ∂i log q(F (x); ξ)
がなりたち, それぞれの統計的モデルに対する α 接続の Christoffel の記号は一致するからである.
有限集合上の統計的モデルに対する Fisher 計量や α 接続は上に述べた不変性を用いて特徴付け
ることができる.
n ∈ N に対して
Ωn = {0, 1, 2, . . . , n}
とおき, Sn を §5 において扱ったような Ωn 上の n 次元統計的モデルとしよう. すなわち,
Sn = {p(x; ξ)|ξ ∈ Ξ}
で,
}
n
∑
(ξ1 , ξ2 , . . . , ξn ) ξ1 , ξ2 , . . . , ξn > 0,
ξi < 1 ,
{
Ξ=
i=1
また, ξ = (ξ1 , ξ2 , . . . , ξn ) ∈ Ξ に対して

ξi
p(i; ξ) =
1 −
n
∑
(i = 1, 2, . . . , n),
ξi
(i = 0)
i=1
である.
また, 各 n ∈ N に対して Sn の Riemann 計量 gn とアファイン接続 ∇n があたえられていると
する.
ここで, Ωn 上の統計的モデル S があたえられているとしよう. ただし, S は Sn の部分多様体で
あると仮定する. このとき, S の Riemann 計量とアファイン接続として, それぞれ gn の誘導計
量と ∇n の誘導接続を考えることができる.
更に, n ≥ m をみたす n, m ∈ N に対して Ωn から Ωm への全射 F があたえられているとしよう.
ただし, S と F により定まる統計的モデル SF は Sm の部分多様体であると仮定する. このとき,
SF の Riemann 計量とアファイン接続として, それぞれ gm の誘導計量と gm による ∇m の射影
を考えることができる.
さて, n ≥ m となる任意の n, m ∈ N と Ωn 上の任意の統計的モデル S と Ωn から Ωm への任意
の全射 F に対して, F が S に関する十分統計量ならば, S と SF の Riemann 計量とアファイン
接続は不変であると仮定しよう. このとき, gn は Sn 上の Fisher 計量の定数倍で, ∇n は Sn の α
接続に一致することが分かる. この事実は Chentsov の定理として知られている.