成 膜 大 学 理 工 学研 究 報 告 J.Fac.Sci.Tech,SeikeiUniv. Uo1.50No.2(2013)pp.79-82 多変量線形 モデル における高次元漸近理論 姫野 哲 人*1 High-dimensionalasymptotictheoryformultivariatelinearmodel TetsutoH-MENO*' ABSTRACT:Whenastatisticwithacomplicateddistributionisdealt,theasymptoticdistributionisoften used.Eveniftheexactdistributioniscomplicated,theasymptoticdistributiongenerallybecomessimple formsuchasnormaldistributionandchisquaredistribution.Therearealsopreviousstudieswhichderive theasymptoticcorrectionduetoimprovetheapproximation.Howeveritisempiricallyknownthatthe classicalasymptoticapproximationsbecomeworseasthedimensionbecomeslarge.Sowederivesome high-dimensionalasymptoticresultsforthemultivariatel血earmodel.Theseresultshavebetter approximations血spiteofthesizeofdimension.Theseresultsnotonlyderivebetterapproximationbutalso clarifyasymptoticpropertiesofsometeststatistics. Keywords:high-dimension,asymptotictheory,multivariatelinearmodel (ReceivedSeptember2Q2013) 1.は じめ に 因 で あ る。 そ こ で,本 報 告 で は 多 変 量線 形 モ デル に お け る パ ラ メ ー タ の 線 形 仮 説 に 対 す る検 定 統 計 量 と して よ く 統 計 学 の 分 野 で は,扱 合 や,そ の 分 布 が 未 知 で あ る 場 合 は 数 多 く あ り,こ うな 場 合,一 般 的 に(パ ラ メ ト リ ッ ク な 手 法 で)デ を 分 析 す る こ とは 困 難 で あ る 。 しか し,こ で あ っ て も,そ 知 られ て い る 尤 度 比 検 定 統 計 量,Lawley-Hotelli㎎ う統 計 量 の 分 布 が 複 雑 で あ る 場 ス 規 準,Baエtlett-Nanda-Pillaiト の よ ー ス規 準 に対 し ー タ ,高 の よ うな 場 合 の 近 似 分 布 を 得 る こ とが で き れ ば,様 導 出 す る。 ま た,こ 々 ト レー レ ー ス 規 準,Dempsterト レ 次 元 漸 近 理 論 を適 用 し,漸 近 分 布 を れ ら の 漸 近 分 布 を用 い,検 出 力(帰 無 仮 説 が 正 し く な い 場 合 に 帰 無 仮 説 を棄 却 す る確 率)の な 統 計 的 分 析 が 可 能 とな る 。代 表 的 な 近 似 手 法 と して は, 漸 近 比 較 を行 う こ と に よ り,様 中 心 極 限 定 理 や 最 尤 推 定 量 の 漸 近 正 規 性,尤 定 統 計 量 を選 ぶ 規 準 を 与 え る。 度比統計量 々 な状 況 下 で の最 適 な 検 や 適 合 度 検 定 の カ イ ニ 乗 近 似 な どが よ く 知 られ て い る 。 こ れ らの 近 似 を使 う こ とに よ っ て,こ れ ま で に 数 多 くの 検 定 手 法 が 提 案 さ れ て い る 。 しか し,近 タ ー の 発 達 に よ り,我 デ ー タ も 増 え て き て お り,こ ま ず,多 系 列 デ ー タ な どの 高 次 元 で,アF(Y≫,…,期)'と 来 の 古 典 的 な 漸 近 理 論 は うま く 適 用 で き な い こ と プ ル サ イ ズNと 項 は0に 典 的 な 漸 近 理 論 で は,サ パ ラ メ ー タ 数Pに 対 し,p/Nの 収 束 す る 項 と して 扱 わ れ る が,高 変 量 線 形 モ デ ル に っ い て 説 明 す る。P次 観 測 デ ー タ が ア1,…,yNの の よ うな 高 次 元 デ ー タ に 対 が 知 られ て い る 。 こ れ は,古 変 量線 形 モ デ ル 年 の コ ン ピ ュー 々 が 扱 うデ ー タ の 中 に は マ イ ク ロ ア レイ デ ー タ や 画 像 デ ー タ,時 し,従 2.多 こ の と き,こ し,円 よ うにN個 は 転 置 を 表 す 記 号 とす る)。 れ らの デ ー タが 以 下 の線 形 モ デル Y、=O'x、+ε よ うな に 従 う とす る。 こ こ で,θ 次 元 デ ー タで 行 列,x,はk次 、 σ=1,…,N) はk×Pの -himeno@st N(OP,E)に .seikei.ac.jp) 一79一 未 知 のパ ラ メー タ 元 の 既 知 の 説 明 変 数 ベ ク トル,&はP 次 元 の 誤 差 ベ ク トル で あ り,そ 報 科 学 科 助 教(t あ る と す る(こ こ ン は こ の 比 率 が 無 視 で き な い 程 度 の 大 き さ に な る こ とが 原 *:情 元 の 従 う とす る(賑 れ ぞ れ 独 立 に正 規 分 布 は 成 分 が 全 て0で あ るP次 Vo1.50No.2(2013.12) 成 践 大 学 理 工 学 研 究 報 告 元 ベ ク トル と し,Σ はP×Pの 正 定 値 行 列 と す る)。 こ の モ デ ル は,Y-(y1,…,YNY,X-(xi,…,xrv)',E-(E1,…,ε TLR-一 夙N÷9〕 丑 り' と 置 く こ と で, ・to・ 識 Y=XO+E 1・qto・N-k+qP と 表 す こ と が で き る(rank(-kと 仮 定 す る)。 こ こで パ Tix一 存 〔N-k-p ラメ ー タに 対 す る線 形 仮 説 P+短 一R Ho:CO=O を 考 え る(rank(◎-9と す る)。 こ こ で,こ ・・ 一存 〔N-k+q P〕 の モ デ ル と仮 ・〔N-k+qtrSh P・Sa+Sh)‐'-R〕 説 が ど の よ うな状 況 を 表 せ る の か 考 え て み る 。 例 え ば N-Ni+…+梅1の よ う に デ ー タ を9+1個 け,○ 一(μ1,'",絢+1)'と x,を しゴ 第 ゴ 成 分 が1で 番 目の群 に 属す る 他 は0と な るベ ク の 群 に 分 の よ うに 規 準 化 して 考 え る。 これ ら の 統 計 量 を 定 義 す る ガ に 対 し, 場 合,Seが トル と し, C= (ci)N,P→ 01-1 け な い 。そ こ で.PがNを ゴ 群 に 属 す るデ ー タ に 対 し, Y、=オノ+ε 、 超 え て はい 超 え て も定 義 で き る方 法 と し て 提 案 され た も の がDempsterト レー ス 規 準 で あ る。 こ れ は 最 初Dempster(1958,1960)に よ っ て,一 標 本 問題 と二 標 本 問 題 の 場 合 に 定 義 され た 。 これ を 多 変 量 線 形 モ デ ル の 場 合 に 拡 張 した も の は 説は nSh/nSe ki-...-k9+i とい う多 標 本 モ デ ル に 対 す る 同 質 性 検 定 を 表 す こ とが で き る 。 っ ま り,多 。。,p/N→o∈(0,1) と い う条 件 が 必 要 と な る。っ ま り.PがNを の モ デ ル は,第 と表 す こ とが で き,仮 近 分 布 を考 え る た め の 高 次 元 枠 組 み と して, 10-1 と す る 。 す る と,こ 正 則 で あ る 必 要 が あ る た め,漸 と して 定 義 され る。 こ の 統 計 量 も規 準 化 し, 変 量 線 形 モ デ ル とそ の 線 形 仮 説 は 様 々 TD-,殊N-k)峨 な 線 形 モ デ ル や 仮 説 を 含 ん だ モ デ ル で あ る とい え る 。 帆 一9} と して漸 近 分 布 を考 え る。 こ の検 定 統 計 量 はNとPの 3.検 定統計量 大小 に 関係 な く定義 で き るの で, (ca)N,P→QO,p/N→o∈(0,QO) 多 変 量 線 形 モ デ ル とそ の 線 形 仮 説 に 対 し, とい う高 次 元枠 組 み で扱 うこ とが 可能 で あ る。 ま た,漸 8ん=(CO)'[c(Xπ)一'(γ1-'co 近 分 布 を導 出す るた め に, Se=(Y‐XO)'(Y‐AO) (Al)nE`/p=0(1)σ=1,…,4) 0=(Xπ)一'XY とお く 。 こ の と き,尤 度 比 検 定 統 計 量,Lawley-Hotelli㎎ ト レー ス 規 準,Baエttett-Nanda-Pillaiト を仮 定 す る。 ま た,対 立仮 説 レー ス規 準 は そ れ ∫∫1:CG)≠0 ぞれ 一109(S の 下 で の 漸 近 分 布 を 考 え る場 合 は,非 e/S8+3ん) 廿8ん351 Ω=Σ 峨(Se+3ん)-1 と して 定 義 さ れ る(Muirhead,1982)。 一U2(CG))'(c(XX)-C')-ICG)Σ 心行 列 を 一U2 と し, こ こ で,trは 行列の (A2)trE`S2/p=0(1)σ=1,2) ト レー ス を 表 す 。 こ れ らの 漸 近 分 布 の 導 出 に あ た り, も仮 定 す る。こ れ ら の 仮 定 の 下 で,漸 近 分 布 の 導 出 を 行 う。 一80一 Vo1.50No.2(2013.12) 成 践 大 学 理 工 学 研 究 報 告 4.TLR,T田,TAPの 比 較 2gtrΣ2ゆ 6DnE/p 漸 近 分 布 を導 出 す る方 法 は 様 々 存 在 す るが,本 報 告 で 使 った 手 法 は,検 定統 計 量 の特 性 関数 の漸 近 展 開 を求 め, で あ る とす る。 ま た,他 特 性 関 数 の 反 転 公 式 を用 い る こ とで,分 布 関 数 の 漸 近 展 定(A2)と 開 を得 る。 そ の 結 果Tc(G=LR,LH,BNP)の 帰無仮説 α+0(P-3/2) 。+P-'/2ろ1(・ 規 分 布 の 上 側100α%点 こ で,σ を 表 す 。 係 数 依 存 し な い の で,こ 標準正 ゐ1(z砺G)と 。 ま た,仮 と して 得 られ る。 こ こ で,φ は標 準正 規 分 布 の分 布 関数 とす る。 一 方,条 下,rLR,r田,rB冊 件(Cl)の の検 出力 の 極 限Pcは 参 照 の こ と。 こ れ ら3っ の検定統 計 量 の 極 限 分 布 は 等 し く,こ れ ら の 違 い はP.V2の ー で しか な い こ と に 注 意 す る 一㌔〕 、(・。,G) 確 率 を 表 し,Zaは 関 し て は,Hi皿eno(2007a)を はGに PD一慌 。,G)+P-'ろ と して 得 られ る 。 こ こ で,Pは bz(Za,G)に 用 い た 際 の検 出 力 の 極 限Pnは ≦ ・。。(α))=1一 ・。。(α)=・ 対 立 仮 説 の 下 で の極 限分 布 を導 出す る こ と が 可 能 で あ り,こ れ ら の 結 果 を 使 い,Tnを の下での漸近分布は P(7』/σ の検 定統 計 量 の場 合 と同様 に 仮 オーダ 定(A2)と 尾 一 Φ〔tr522 q(N-k.R)一 対立 ㌔ 〕 仮 説 の 下 で の 漸 近 分 布 も 同 様 に 導 出 す る こ とが で き,そ と な る。 こ の 二 っ の 検 出 力 の 極 限 を 条 件(Cl)の の 漸 近 分 布 を 用 い る こ とに よ り,触,TLH,Tsxeの 較 す る と,以 漸近的 な検出力の差が が 単 位 行 列 の 定 数 倍 で あ れ ば,Pc〈Pnと (2)Σ の 最 大 固 有 値 と最 小 固 有 値 の 差 が 小 さ け れ ば, (3)Σ と し,ciはTLRの 0,Tsxeの と き は 一p/(N…k+9)と TLHとTsxeの の 最 大 固 有 値 と最 小 固 有 値 の 差 が 大 き く,Pが な る。 とめ 標準正規分布の密度関数 と き は 一pノ(2(N-k+9)),TLHの っ ま り,TLRの な る。 な る。 小 さ け れ ば,Pc>Pnと 6.ま と して 得 られ る 。 こ こ で,wは 下 の こ と が 分 か る(FujikosMetal.,2004)。 (1)Σ Pc〈Pnと 詐 一 調 ・{評・ 語 ゾー 制 下で比 本報 告 で は,多 変 量線 形 モ デル に お け る線 形 仮 説 に 対 ときは い う値 を と る も の とす る 。 検 出 力 は 常 に 他 の 二 っ の 間 の 値 と な り, 検 出 力 は 上 記 の 式 の2行 し,複 数 の検 定統 計 量 の 高 次 元漸 近 理 論 に 基 づ く漸 近 分 布 の結 果 を紹 介 した。 ま た,漸 近 分 布 の結 果 を用 い た 検 目の 符 号 に よ っ 出力 の 比較 を行 い,状 況 に応 じた最 適 な検 定統 計 量 の 選 て 決 ま る こ とが 分 か る 。 択 法 を提 案 した。 複 雑 な分 布 の漸 近 分 布 を導 出す る こ と は,分 布 そ の もの の近 似 を得 るだ けで な く,そ の統 計 量 5.TDと そ の 他 の 検 定 の 比較 自身 の性 質 を調 べ るた め に も有 効 な 手段 とな る。 ま た,今 回 の漸 近 理 論 で は,デ ー タが正 規 分 布 に従 う Tnの こ と を仮 定 した。 しか し,一 般 的 に デ ー タが正 規 分 布 に 帰 無 仮 説 の 下 で の 漸 近 分 布 はHimeno(2007b)で 述 べ られ て い る が,他 従 って い る とは 限 らず,高 の 検 定 統 計 量 との 検 出 力 の 比 較 を 行 う際 に は 極 限 分 布 の 結 果 の み で 十 分 な の で,こ か ど うか を調 べ る こ とは 困難 で あ る。 した が って,デ ー こで は タが正 規 分 布 に従 うとい う仮 定無 しで の漸 近 理 論 もい ろ 極 限 分 布 の 結 果 に っ い て の み 触 れ る こ とに す る 。 条 件(C2)と 仮 説(Al)が 帰無仮説の下で い ろ提 案 され て い る。 だ が,こ れ らの 手法 の 多 くは か な 成 り 立 っ とす る 。 こ の と き, り強 い仮 定 が必 要 で あ るた め,現 在 か な り緩 い 条件(楕 d 円分 布 を含 む ク ラス)の 下 で の 高 次 元漸 近 理 論 の研 究 を 7D/σD→N(0,1) 行 って い る。 d が 成 り立 っ 。 こ こ で,→ 次 元 デ ー タが正 規 分 布 に従 う は 分 布 収 束 を 示 し, 一81一 成 践 大 学 理 工 学 研 究 報 告 参考文献 [1]Dempster,A.P.(1958).Ahighdimensiortaltwosample significancetest,Ann.Math.Statist.,29,995-1010. [2]Dempster,A.P.(1960).Asignificancetestforthe separationoftwoMghlymultivariatesmallsamples, Biomebics,16,41-50. [3]FhjikosM,Y.,HimenoT.,andWakaki,H.(2004). AsymptoticresultsofahighdimensionalMANOPAtest a皿dpowercomparisonwhen血edimensionislaエge comparedtothesamplesize,JJapanStatist.Soc.,34,19z6. [4]HimenqT(2007a).Adiscriminantconditionforthetest ofgreatestpowerin血eMANOVAmodelwhen血e dimensionislogecomparedtothesamplesize, InternationalJournalofPureandAppliedMathematics, 40,89-102. [5]HimenqT(2007b).Asymptoticexpansionsofthenull dishibutionsfortheDempstertracecriterion,Hiroshima Math.J,37,431-454. [6]Muirhead,R.J.(1982).AspectsofMultivariateStatistical Theory,JohnWiley&Sons,NewYork. 一82一 Vo1.50No.2(2013.12)
© Copyright 2024 ExpyDoc