非正規性の下での高次元正準相関分析のための AIC 規準量の一致性

非正規性の下での高次元正準相関分析のための AIC 規準量の一致性
広島大・理 福井 敬祐
正準相関分析とは, 二つの多変量ベクトル x = (x1 , ..., xq )′ と y = (y1 , ..., yp )′ の線形結合による合成変量の相関
を分析する多変量解析の手法である. z = (x′ , y ′ )′ の共分散行列を Σ とし, Σ の x, y に対応する分割を,
(
)
Σxx Σxy
Σ=
,
Σyx Σyy
−1
とする. このとき, 2 つの合成変量の相関係数の 2 乗は Σ−1
xx Σxy Σyy Σyx の固有値として得られ, ℓ 番目に大きな固
有値の平方根が第 ℓ 正準相関係数と呼ばれる. 正準相関分析においては 2 変数間の関係に有効でない変数を削除
し, 分析を行うことで安定した解析結果を得ることができる可能性がある. すなわち, 精度の高い解析のために, 冗
長な変数の選択を行うことが必要である. 本研究においては, これを冗長性モデルの選択とみなし, 1 組の変数 x
からの変数選択問題を考える. j = {j1 , ..., jqj } ⊆ {1, ..., q} を冗長でない変数を表すための x の要素番号の集合と
する. 例えば, j = {1, 2, 4} であれば, xj = (x1 , x2 , x4 )′ となる. このとき, x = (x′j , x¯′j )′ (xj : qj -次元), と分割し,
これに対応する Σxx , Σxy の分割を,
(
Σxx =
Σjj
Σj¯j
Σ¯jj
Σ¯j¯j
)
(
,
Σxy =
Σjy
Σ¯jy
)
,
−1
−1
−1
とする. このとき, 変数 x¯j は tr(Σ−1
xx Σxy Σyy Σyx ) = tr(Σjj Σjy Σyy Σyj ) を満たすとき冗長であると定義される.
したがって, 冗長性モデルは共分散構造分析モデルとして定式化できる. 冗長性モデルの選択としては AIC(Akaike
(1973, 1974)) に代表される情報量規準を用いた方法が提案されている (Fujikoshi (1985)). つまり, x¯j が冗長であ
るというモデル Mj の AIC の最小化によってモデルの選択が行われる.
情報量規準を用いたモデル選択においては, その情報量規準が真のモデルを選ぶ確率が漸近的に 1 になるとい
う性質(一致性)を持っているか否かがしばしば議題となる. AIC は大標本漸近理論の下では, 一致性を持たな
いことが知られているが, 近年においては, 大標本のみならず高次元の枠組みにおいても漸近的に近似することに
より, 情報量規準が一致性を持つための条件を解明しようとする研究が行われている (例えば, Yanagihara, et al.
(2012)). 本研究は, これらの研究同様に, 正準相関分析における冗長性モデル選択のための AIC 規準について, 高
次元大標本漸近理論の枠組みの下で一致性の成り立つための条件を明らかにすることを目的としている. ただし,
考察を行うモデルに対しては, 正規性の仮定を置くが, 一般的に真のモデルが実際に正規分布に従うとは限らない.
そこで, より実際の状況に即したものとなるよう, 真のモデル正規分布の仮定を置かない下での一致性の考察を行
うもとのする. なお当日は, AIC のみならず, 対数尤度に基づく種々の情報量規準に対しても一致性の成立条件に
ついて考察した結果を報告し, シミュレーション結果を提示する.
引用文献
[1] Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle, In 2nd
International Symposium on Information Theory, Eds. B. N. Petrov and F. Cs´aki, pp. 267–281. Akad´emiai
Kiad´o, Budapest.
[2] Akaike, H. (1974). A new look at the statistical model identification, IEEE Trans. Automatic Control,
AC-19, 716–723.
[3] Fujikoshi, H. (1985). Selection of variables in discriminant analysis and canonical correlation analysis. In
Multivariate Analysis, Vol. VI (Ed. P. R. Krishnaiah), 219-236, North-Holland, Amsterdam.
[4] Yanagihara, H., Wakaki H. and Fujikoshi. Y. (2012). A consistency property of the AIC for multivariate
linear models when the dimension and the sample size are large. TR 12-08, Statistical Research Group,
Hiroshima University, Hiroshima.