社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部 [email protected] 実験計画法 • 分散分析は実験を行った後の統計的手法. • 分散分析はどのような実験を行ったのかとい う実験デザインと切り離せない. • 実験の方法をよく吟味する必要がある. フィッシャーの3原則 • 反復(replication):誤差分散を評価するため に,同じ条件下で測定を繰り返す. • 無作為化(randomization):系統誤差 (systematic error)を偶然誤差(random error) に転化するために,処理(条件)の割り付けを 無作為化する • 局所管理(local control):系統誤差を除去す るために,ブロックを構成して,各ブロック内 では条件が均一になるよう管理する. 反復 • 農場で3つの品種を育てて収穫量を比較する 実験を行うとする. • 3種類を1株ずつ育てても,その差は偶然に すぎないのか,品種の違いなのかわからない. – 偶然変動(誤差分散)がわからなければ,差を評 価できない. • よって,3つの品種を,それぞれ何株か育て る必要がある. 反復だけでよいか? 3区画に土地を分け,それぞれの土地で1種類ずつ育てる. AAA AAA AAA BBB BBB BBB CCC CCC CCC 反復だけでよいか? • 測定を繰り返すだけでは,影響に一定の方向 のある系統誤差(systematic error)が混入す るかもしれない. – 3区画に土地を分け,それぞれの土地で1種類 ずつ育てる.収穫量が違っても,種の差なのか, 土地の差なのかが区別できない.これを,要因が 交絡している(confound)と言う. 無作為化 • 特定の土地区画は,収穫量に対して,一定の 方向のある誤差(系統誤差)をもたらす. • ひとつの対策として,農場全体で,3つの品 種をランダムに植えればよい. • どの品種においても,よい土壌条件に植えら れる株もあれば,そうでない条件に植えられ るものもある.無作為化により,系統誤差が 偶然誤差に転化される. 反復+無作為化 実験場全体に,3種類の株をランダムに植えて育てる. BCA CBA ACA ABC AAB CBB CCA BCB CBA 反復と無作為化の原則を満たす実験デザインを 完全無作為法(completely randomized design)と呼ぶ. 局所管理 • 土地の違いは,同一品種での収穫量の違い (誤差分散)に入り込む. • 特定の株をどこに植えるかはランダムに決め るので,土地条件は品種間で完全に公平で はない. – 良い土地条件にたまたま多く植えられた品種. • 土地の違いによる収穫量の変動を,誤差変 動から切り離せないか? → 局所管理 • 農場全体を,土地条件が同一であると考えら れるブロック(block)に分ける. – ブロック:もともとは,農場の区画を意味する.一 般には,興味の対象となっている要因以外の条 件に関して均一であるような実験単位. • 各ブロックで,3つの品種をランダムに植える. – 無作為化を行うのは,土地条件以外の要因(日 光の当たる角度など,直接に考慮されていない) の影響が系統誤差を生じさせないようにするため. 反復+無作為化+局所管理 BCA CAB ACB CBA BAC BCA Fisherの3原則すべてを満たす実験デザインを 乱塊法(randomized block design)と呼ぶ. 乱塊法 • 実験を行う「場」をいくつかのブロックに分け,そ の中では系統誤差の影響を一定にする.系統誤 差はブロック間の差となる. – ブロックが実験要因のひとつとなる.ブロック因子 • ブロック内で条件の割り当てをランダムにする. • ブロックの例:農場の区画,装置,実験日,実験 者,実験順序,参加者 – 被験者内デザインは参加者をブロックにした乱塊法. 実験への参加者それぞれを,農場実験での土地の小区 画(すなわち,ブロック)と考えてみる. BCA CAB ACB 参加者それぞれが,条件すべて(たとえば,A, B, C の3条件 すべて)をこなす. 条件の実施順序はランダムにする. 乱塊法の応用 • ラテン方格(latin square):複数のブロック因 子があるとき,それらを組み合わせる. – 興味ある要因およびブロック因子の水準数が同 じでなければならない.下の表の各行・各列に, 要因を表す記号が1回ずつ表れている. 区画1 区画2 区画3 実験者1 B C A 実験者2 C A B 実験者3 A B C 完全無作為化法・乱塊法・ ラテン方格法の比較 • A, B, C という3種類の処理を比較する. – それぞれ3回の反復 – 1日あたり3回,3日間にわたって実験. • 完全無作為化法 第1日 第2日 第3日 1回目 B C A 2回目 C B C 3回目 A B A 完全無作為化法・乱塊法・ ラテン方格法の比較 • 乱塊法(実施日がブロック) 第1日 第2日 第3日 1回目 B 2回目 C 3回目 A C A A C B B – A, B, C はどの日でも同じ回数だけ実施されてい る.日という系統誤差は問題でなくなる. – しかし,実験順序もブロックとすべきかもしれない. 完全無作為化法・乱塊法・ ラテン方格法の比較 • ラテン方格法(完備型計画) 第1日 第2日 第3日 1回目 B 2回目 C 3回目 A C A A B B C – A, B, C は,どの日でも同じ回数だけ実施されてい る. – さらに,何回目に実施されたかについても公平. 順序効果と対処 • 順序効果(order effect):実験水準の実施順 序,あるいは,要因としていない実験要素の 出現順序の効果. • 順序効果への対処: – カウンターバランス:可能な順序が少数の場合, それらをすべて実施して効果を相殺する.順序を ブロック因子としてもよい. – 無作為化:心理学実験で数多く呈示する刺激な ど,可能な順序が多い場合には,無作為化を行 う(例:呈示順序をランダムにする) 2要因実験(被験者間デザイン) • 興味ある要因が2つある実験例 訓練時間 各セルには2つ 以上の測定値 課題 難 易 平均 短 中 長 平均 y111 y211 y121 y221 y112 y212 y122 y222 y113 y213 y123 y223 y1 y3 y y1 y2 y2 • 参考:1要因被験者内デザイン 各セルには測定 値がひとつ 人 平均 要因A 短 中 長 平均 人1 y11 y12 y13 人2 y21 y22 y23 ・・・ ・・・ ・・・ ・・・ y1 y2 y3 y1 y2 y 2要因実験の構造モデル • 各セルにおいて測定が繰り返されている場合 には,交互作用(interaction)がモデルに入る. yijk a j bk (ab) jk eijk aˆ j y j y bˆk yk y yijk a j bk (ab) jk eijk jk a j bk (ab) jk (ab) jk y jk y j yk y eˆijk yijk y jk 各セルでの標本平均 交互作用とは • 交互作用は,要因の組み合わせの効果. – 2つの要因効果の足し算では説明できない効果 • 一方の要因の効果が,もう一方の要因の水 準によって異なるとき,これは交互作用となる. 交互作用と誤差 • 各セルでの繰り返しがあるため,誤差と交互 作用を分離できる. • 1要因被験者内デザインでの誤差(推定値) eij yij y.. ( y. j y.. ) ( yi. y.. ) yij y. j yi. y.. • 2要因デザインでの交互作用(推定値) (ab) jk y jk y j yk y グラフでの主効果 易 成 績 難 短 中 長 訓練時間 グラフでの主効果 易 成 績 難 短 中 長 訓練時間 グラフでの交互作用 易 成 績 難 短 中 長 訓練時間 グラフでの交互作用 易 成 績 難 短 中 長 訓練時間 分散分析に続く分析 • 要因の効果(主効果 main effect)が有意に なった場合:その要因が3水準以上あるなら ば,どの水準間に差があるのかを調べる多 重比較を行う. • 交互作用が有意となった場合:一方の要因の 効果が,もう一方の要因の水準ごとに異なる のだから,その水準ごとに要因効果を分析す る.これは単純効果(simple effect)の分析と 呼ばれる. さらに学習すること • この講義では扱わなかったが,さらに学習す べきこととして, – 被験者内要因のある2要因計画(金曜日の演習 で扱う) – 固定効果と変量効果 – 枝分かれ配置 – 直交表 理解確認のポイント • フィッシャーの3原則を説明できますか? • 系統誤差と偶然誤差の違いを説明できます か? • 要因の交絡とは何か,説明できますか? • 完全無作為法とはどのような実験計画か,説 明できますか? • 乱塊法とはどのような実験計画か,説明でき ますか? • ラテン方格法とはどのような実験計画か,説 明できますか? • 順序効果とは何か,説明できますか? これ に対してどのような対処を行うことができるか, 説明できますか? • 2要因実験での構造モデルを数式で書き,式 の要素を説明できますか? • 2要因実験での交互作用とは何か,説明でき ますか? • 2要因実験での主効果および交互作用は, グラフではどのように表れるかわかります か? • 交互作用を想定しない3要因実験には,ラテ ン方格のデザインを利用できる. – 水準数はすべての要因で等しいとする. – A1 水準の効果の推定に,B および C の各水準が 1回ずつ用いられている.他の水準も同様. A1 A2 A3 B1 C1 B2 C2 B3 C3 C3 C2 C1 C3 C2 C1
© Copyright 2024 ExpyDoc