多変量線形モデルにおける高次元漸近理論

成 膜 大 学 理 工 学研 究 報 告
J.Fac.Sci.Tech,SeikeiUniv.
Uo1.50No.2(2013)pp.79-82
多変量線形 モデル における高次元漸近理論
姫野
哲 人*1
High-dimensionalasymptotictheoryformultivariatelinearmodel
TetsutoH-MENO*'
ABSTRACT:Whenastatisticwithacomplicateddistributionisdealt,theasymptoticdistributionisoften
used.Eveniftheexactdistributioniscomplicated,theasymptoticdistributiongenerallybecomessimple
formsuchasnormaldistributionandchisquaredistribution.Therearealsopreviousstudieswhichderive
theasymptoticcorrectionduetoimprovetheapproximation.Howeveritisempiricallyknownthatthe
classicalasymptoticapproximationsbecomeworseasthedimensionbecomeslarge.Sowederivesome
high-dimensionalasymptoticresultsforthemultivariatel血earmodel.Theseresultshavebetter
approximations血spiteofthesizeofdimension.Theseresultsnotonlyderivebetterapproximationbutalso
clarifyasymptoticpropertiesofsometeststatistics.
Keywords:high-dimension,asymptotictheory,multivariatelinearmodel
(ReceivedSeptember2Q2013)
1.は
じめ に
因 で あ る。 そ こ で,本
報 告 で は 多 変 量線 形 モ デル に お け
る パ ラ メ ー タ の 線 形 仮 説 に 対 す る検 定 統 計 量 と して よ く
統 計 学 の 分 野 で は,扱
合 や,そ
の 分 布 が 未 知 で あ る 場 合 は 数 多 く あ り,こ
うな 場 合,一
般 的 に(パ
ラ メ ト リ ッ ク な 手 法 で)デ
を 分 析 す る こ とは 困 難 で あ る 。 しか し,こ
で あ っ て も,そ
知 られ て い る 尤 度 比 検 定 統 計 量,Lawley-Hotelli㎎
う統 計 量 の 分 布 が 複 雑 で あ る 場
ス 規 準,Baエtlett-Nanda-Pillaiト
の よ
ー ス規 準 に対 し
ー タ
,高
の よ うな 場 合
の 近 似 分 布 を 得 る こ とが で き れ ば,様
導 出 す る。 ま た,こ
々
ト レー
レ ー ス 規 準,Dempsterト
レ
次 元 漸 近 理 論 を適 用 し,漸 近 分 布 を
れ ら の 漸 近 分 布 を用 い,検
出 力(帰
無 仮 説 が 正 し く な い 場 合 に 帰 無 仮 説 を棄 却 す る確 率)の
な 統 計 的 分 析 が 可 能 とな る 。代 表 的 な 近 似 手 法 と して は,
漸 近 比 較 を行 う こ と に よ り,様
中 心 極 限 定 理 や 最 尤 推 定 量 の 漸 近 正 規 性,尤
定 統 計 量 を選 ぶ 規 準 を 与 え る。
度比統計量
々 な状 況 下 で の最 適 な 検
や 適 合 度 検 定 の カ イ ニ 乗 近 似 な どが よ く 知 られ て い る 。
こ れ らの 近 似 を使 う こ とに よ っ て,こ
れ ま で に 数 多 くの
検 定 手 法 が 提 案 さ れ て い る 。 しか し,近
タ ー の 発 達 に よ り,我
デ ー タ も 増 え て き て お り,こ
ま ず,多
系 列 デ ー タ な どの 高 次 元
で,アF(Y≫,…,期)'と
来 の 古 典 的 な 漸 近 理 論 は うま く 適 用 で き な い こ と
プ ル サ イ ズNと
項 は0に
典 的 な 漸 近 理 論 で は,サ
パ ラ メ ー タ 数Pに
対 し,p/Nの
収 束 す る 項 と して 扱 わ れ る が,高
変 量 線 形 モ デ ル に っ い て 説 明 す る。P次
観 測 デ ー タ が ア1,…,yNの
の よ うな 高 次 元 デ ー タ に 対
が 知 られ て い る 。 こ れ は,古
変 量線 形 モ デ ル
年 の コ ン ピ ュー
々 が 扱 うデ ー タ の 中 に は マ イ ク ロ
ア レイ デ ー タ や 画 像 デ ー タ,時
し,従
2.多
こ の と き,こ
し,円
よ うにN個
は 転 置 を 表 す 記 号 とす る)。
れ らの デ ー タが 以 下 の線 形 モ デル
Y、=O'x、+ε
よ うな
に 従 う とす る。 こ こ で,θ
次 元 デ ー タで
行 列,x,はk次
、 σ=1,…,N)
はk×Pの
-himeno@st
N(OP,E)に
.seikei.ac.jp)
一79一
未 知 のパ ラ メー タ
元 の 既 知 の 説 明 変 数 ベ ク トル,&はP
次 元 の 誤 差 ベ ク トル で あ り,そ
報 科 学 科 助 教(t
あ る と す る(こ こ
ン
は こ の 比 率 が 無 視 で き な い 程 度 の 大 き さ に な る こ とが 原
*:情
元 の
従 う とす る(賑
れ ぞ れ 独 立 に正 規 分 布
は 成 分 が 全 て0で
あ るP次
Vo1.50No.2(2013.12)
成 践 大 学 理 工 学 研 究 報 告
元 ベ ク トル と し,Σ
はP×Pの
正 定 値 行 列 と す る)。 こ の
モ デ ル は,Y-(y1,…,YNY,X-(xi,…,xrv)',E-(E1,…,ε
TLR-一 夙N÷9〕
丑
り'
と 置 く こ と で,
・to・ 識
Y=XO+E
1・qto・N-k+qP
と 表 す こ と が で き る(rank(-kと
仮 定 す る)。
こ こで パ
Tix一 存 〔N-k-p
ラメ ー タに 対 す る線 形 仮 説
P+短
一R
Ho:CO=O
を 考 え る(rank(◎-9と
す る)。 こ こ で,こ
・・ 一存 〔N-k+q
P〕
の モ デ ル と仮
・〔N-k+qtrSh
P・Sa+Sh)‐'-R〕
説 が ど の よ うな状 況 を 表 せ る の か 考 え て み る 。 例 え ば
N-Ni+…+梅1の
よ う に デ ー タ を9+1個
け,○ 一(μ1,'",絢+1)'と
x,を
しゴ
第 ゴ 成 分 が1で
番 目の群 に 属す る
他 は0と
な るベ ク
の 群 に 分
の よ うに 規 準 化 して 考 え る。 これ ら の 統 計 量 を 定 義 す る
ガ に 対 し,
場 合,Seが
トル と し,
C=
(ci)N,P→
01-1
け な い 。そ こ で.PがNを
ゴ 群 に 属 す るデ ー タ
に 対 し,
Y、=オノ+ε
、
超 え て はい
超 え て も定 義 で き る方 法 と し
て 提 案 され た も の がDempsterト
レー ス 規 準 で あ る。 こ れ
は 最 初Dempster(1958,1960)に
よ っ て,一
標 本 問題 と二
標 本 問 題 の 場 合 に 定 義 され た 。 これ を 多 変 量 線 形 モ デ ル
の 場 合 に 拡 張 した も の は
説は
nSh/nSe
ki-...-k9+i
とい う多 標 本 モ デ ル に 対 す る 同 質 性 検 定 を 表 す こ とが で
き る 。 っ ま り,多
。。,p/N→o∈(0,1)
と い う条 件 が 必 要 と な る。っ ま り.PがNを
の モ デ ル は,第
と表 す こ とが で き,仮
近 分 布 を考 え
る た め の 高 次 元 枠 組 み と して,
10-1
と す る 。 す る と,こ
正 則 で あ る 必 要 が あ る た め,漸
と して 定 義 され る。 こ の 統 計 量 も規 準 化 し,
変 量 線 形 モ デ ル とそ の 線 形 仮 説 は 様 々
TD-,殊N-k)峨
な 線 形 モ デ ル や 仮 説 を 含 ん だ モ デ ル で あ る とい え る 。
帆
一9}
と して漸 近 分 布 を考 え る。 こ の検 定 統 計 量 はNとPの
3.検
定統計量
大小 に 関係 な く定義 で き るの で,
(ca)N,P→QO,p/N→o∈(0,QO)
多 変 量 線 形 モ デ ル とそ の 線 形 仮 説 に 対 し,
とい う高 次 元枠 組 み で扱 うこ とが 可能 で あ る。 ま た,漸
8ん=(CO)'[c(Xπ)一'(γ1-'co
近 分 布 を導 出す るた め に,
Se=(Y‐XO)'(Y‐AO)
(Al)nE`/p=0(1)σ=1,…,4)
0=(Xπ)一'XY
とお く 。 こ の と き,尤
度 比 検 定 統 計 量,Lawley-Hotelli㎎
ト レー ス 規 準,Baエttett-Nanda-Pillaiト
を仮 定 す る。 ま た,対
立仮 説
レー ス規 準 は そ れ
∫∫1:CG)≠0
ぞれ
一109(S
の 下 で の 漸 近 分 布 を 考 え る場 合 は,非
e/S8+3ん)
廿8ん351
Ω=Σ
峨(Se+3ん)-1
と して 定 義 さ れ る(Muirhead,1982)。
一U2(CG))'(c(XX)-C')-ICG)Σ
心行 列 を
一U2
と し,
こ こ で,trは
行列の
(A2)trE`S2/p=0(1)σ=1,2)
ト レー ス を 表 す 。 こ れ らの 漸 近 分 布 の 導 出 に あ た り,
も仮 定 す る。こ れ ら の 仮 定 の 下 で,漸 近 分 布 の 導 出 を 行 う。
一80一
Vo1.50No.2(2013.12)
成 践 大 学 理 工 学 研 究 報 告
4.TLR,T田,TAPの
比 較
2gtrΣ2ゆ
6DnE/p
漸 近 分 布 を導 出 す る方 法 は 様 々 存 在 す るが,本 報 告 で
使 った 手 法 は,検 定統 計 量 の特 性 関数 の漸 近 展 開 を求 め,
で あ る とす る。 ま た,他
特 性 関 数 の 反 転 公 式 を用 い る こ とで,分 布 関 数 の 漸 近 展
定(A2)と
開 を得 る。 そ の 結 果Tc(G=LR,LH,BNP)の
帰無仮説
α+0(P-3/2)
。+P-'/2ろ1(・
規 分 布 の 上 側100α%点
こ で,σ
を 表 す 。 係 数
依 存 し な い の で,こ
標準正
ゐ1(z砺G)と
。 ま た,仮
と して 得 られ る。 こ こ で,φ
は標 準正 規 分 布 の分 布 関数
とす る。 一 方,条
下,rLR,r田,rB冊
件(Cl)の
の検 出力
の 極 限Pcは
参 照 の こ と。 こ
れ ら3っ
の検定統
計 量 の 極 限 分 布 は 等 し く,こ れ ら の 違 い はP.V2の
ー で しか な い こ と に 注 意 す る
一㌔〕
、(・。,G)
確 率 を 表 し,Zaは
関 し て は,Hi皿eno(2007a)を
はGに
PD一慌
。,G)+P-'ろ
と して 得 られ る 。 こ こ で,Pは
bz(Za,G)に
用 い た 際 の検 出
力 の 極 限Pnは
≦ ・。。(α))=1一
・。。(α)=・
対 立 仮 説 の 下 で の極 限分 布 を導 出す る こ と が
可 能 で あ り,こ れ ら の 結 果 を 使 い,Tnを
の下での漸近分布は
P(7』/σ
の検 定統 計 量 の場 合 と同様 に 仮
オーダ
定(A2)と
尾 一 Φ〔tr522
q(N-k.R)一
対立
㌔ 〕
仮 説 の 下 で の 漸 近 分 布 も 同 様 に 導 出 す る こ とが で き,そ
と な る。 こ の 二 っ の 検 出 力 の 極 限 を 条 件(Cl)の
の 漸 近 分 布 を 用 い る こ とに よ り,触,TLH,Tsxeの
較 す る と,以
漸近的
な検出力の差が
が 単 位 行 列 の 定 数 倍 で あ れ ば,Pc〈Pnと
(2)Σ
の 最 大 固 有 値 と最 小 固 有 値 の 差 が 小 さ け れ ば,
(3)Σ
と し,ciはTLRの
0,Tsxeの
と き は 一p/(N…k+9)と
TLHとTsxeの
の 最 大 固 有 値 と最 小 固 有 値 の 差 が 大 き く,Pが
な る。
とめ
標準正規分布の密度関数
と き は 一pノ(2(N-k+9)),TLHの
っ ま り,TLRの
な る。
な る。
小 さ け れ ば,Pc>Pnと
6.ま
と して 得 られ る 。 こ こ で,wは
下 の こ と が 分 か る(FujikosMetal.,2004)。
(1)Σ
Pc〈Pnと
詐 一
調
・{評・
語 ゾー
制
下で比
本報 告 で は,多 変 量線 形 モ デル に お け る線 形 仮 説 に 対
ときは
い う値 を と る も の とす る 。
検 出 力 は 常 に 他 の 二 っ の 間 の 値 と な り,
検 出 力 は 上 記 の 式 の2行
し,複 数 の検 定統 計 量 の 高 次 元漸 近 理 論 に 基 づ く漸 近 分
布 の結 果 を紹 介 した。 ま た,漸 近 分 布 の結 果 を用 い た 検
目の 符 号 に よ っ
出力 の 比較 を行 い,状 況 に応 じた最 適 な検 定統 計 量 の 選
て 決 ま る こ とが 分 か る 。
択 法 を提 案 した。 複 雑 な分 布 の漸 近 分 布 を導 出す る こ と
は,分 布 そ の もの の近 似 を得 るだ けで な く,そ の統 計 量
5.TDと
そ の 他 の 検 定 の 比較
自身 の性 質 を調 べ るた め に も有 効 な 手段 とな る。
ま た,今 回 の漸 近 理 論 で は,デ ー タが正 規 分 布 に従 う
Tnの
こ と を仮 定 した。 しか し,一 般 的 に デ ー タが正 規 分 布 に
帰 無 仮 説 の 下 で の 漸 近 分 布 はHimeno(2007b)で
述 べ られ て い る が,他
従 って い る とは 限 らず,高
の 検 定 統 計 量 との 検 出 力 の 比 較 を
行 う際 に は 極 限 分 布 の 結 果 の み で 十 分 な の で,こ
か ど うか を調 べ る こ とは 困難 で あ る。 した が って,デ ー
こで は
タが正 規 分 布 に従 うとい う仮 定無 しで の漸 近 理 論 もい ろ
極 限 分 布 の 結 果 に っ い て の み 触 れ る こ とに す る 。
条 件(C2)と
仮 説(Al)が
帰無仮説の下で
い ろ提 案 され て い る。 だ が,こ れ らの 手法 の 多 くは か な
成 り 立 っ とす る 。 こ の と き,
り強 い仮 定 が必 要 で あ るた め,現 在 か な り緩 い 条件(楕
d
円分 布 を含 む ク ラス)の 下 で の 高 次 元漸 近 理 論 の研 究 を
7D/σD→N(0,1)
行 って い る。
d
が 成 り立 っ 。 こ こ で,→
次 元 デ ー タが正 規 分 布 に従 う
は 分 布 収 束 を 示 し,
一81一
成 践 大 学 理 工 学 研 究 報 告
参考文献
[1]Dempster,A.P.(1958).Ahighdimensiortaltwosample
significancetest,Ann.Math.Statist.,29,995-1010.
[2]Dempster,A.P.(1960).Asignificancetestforthe
separationoftwoMghlymultivariatesmallsamples,
Biomebics,16,41-50.
[3]FhjikosM,Y.,HimenoT.,andWakaki,H.(2004).
AsymptoticresultsofahighdimensionalMANOPAtest
a皿dpowercomparisonwhen血edimensionislaエge
comparedtothesamplesize,JJapanStatist.Soc.,34,19z6.
[4]HimenqT(2007a).Adiscriminantconditionforthetest
ofgreatestpowerin血eMANOVAmodelwhen血e
dimensionislogecomparedtothesamplesize,
InternationalJournalofPureandAppliedMathematics,
40,89-102.
[5]HimenqT(2007b).Asymptoticexpansionsofthenull
dishibutionsfortheDempstertracecriterion,Hiroshima
Math.J,37,431-454.
[6]Muirhead,R.J.(1982).AspectsofMultivariateStatistical
Theory,JohnWiley&Sons,NewYork.
一82一
Vo1.50No.2(2013.12)