12月4日 伊藤 早紀 重回帰分析 多変量解析 ここまでみてきた解析方法は,ひとつもしくはごく少数の 変数を扱うものであった。 しかし心理学では,一度に多くの変数を用いて調査分析を 行うことが多い。 多くの変数を全体的にまたは同時に分析する方法が,多変 量解析である。 尺度水準は? 何をするか? 1つの変数を 複数の変数から 予測・説明・判別 する 従属変数 (基準変数,目的 変数) 量的データ 質的データ 独立変数 (説明変数) 多変量解析の手法 量的データ 重回帰分析 質的データ 数量化I類 量的データ 判別分析 質的データ 数量化II類 量的データ 因子分析 主成分分析 クラスター分析 質的データ 数量化III類 コレスポンデンス (対応)分析 多変量解析の手法 複数の変数間の 関連性を検討する 圧縮・整理する ・因果関係(独立変数と従属変数)の存在を仮定しているか否か ・質的データ:名義尺度・順序尺度 量的データ:間隔尺度・比率尺度 尺度の水準 特徴 目的 例 名義尺度 •単なるレッテルや記号として数字を用いている •同一のものや同種のものに同じ記号を割り当てる •同一性を示す 等価の決定 (分類) (命名) (符号化) 学籍番号 電話番号 背番号 など 順序尺度 •測定値間の大小関係のみを表す •大小や高低などの順位関係は明らかだが,その「差 異」は表現しない •同一性・順序性を示す 大小関係を決 定する (順序づけ) 成績の順位 など •順位の概念の他に,「値の間隔」という概念が加わ る •大小関係だけでなく,その差や和にも意味がある •同一性・順序性・加法性を示す 間隔または差 の等価性を決 定する (等間隔なめ もりづけ) 温度 (摂氏,華氏) 知能指数 テストの得点 など •原点0(ゼロ)が一義的に決まっている •測定値間の倍数関係(比)を問題にすることが可能 •間隔尺度に原点を加えたもの •同一性・順序性・加法性・等比性を示す 比率の等価法 を決定する (絶対原点か らの等間隔な めもりづけ) 長さ 重さ 絶対温度 など 質 的 デ ー タ 尺度水準について 間隔尺度 比率尺度 (比例尺度) 量 的 デ ー タ たとえば 動機づけ尺度と原因帰属尺度の得点から試験の得点を予測 する。 分析の目的 → 予測すること 従属変数は試験の得点 → 量的データ 独立変数は動機づけ尺度と原因帰属尺度 → 量的データ では分析方法は? →重回帰分析 血糖値,血圧,体温から病気であるか否かを予測する。 分析の目的 → 予測すること 従属変数は病気であるか否か → 質的データ 独立変数は血糖値,血圧,体温 → 量的データ では分析方法は? →判別分析 注意点 独立変数間のデータの質をそろえる 予測する際の独立変数間のデータ,関連性を検討する際の 変数群のデータの質・レベルをそろえる たとえば,質的データと量的データが混在した独立変数で, 何かを予測することはできない。 その場合,一般的には精度の低い質的データに量的データを そろえる (例)動機づけ尺度得点によって 「高群」「中群」「低群」に分けるなど ダミー変数を用いる場合もある (例)男を「1」,女を「0」とするなど 注意点 独立変数間に相関関係が高い変数を使用しない 独立変数間の相関が高い場合には,本来取り得ないような結 果となる場合がある。 たとえば,2つの独立変数間の相関が高い場合には,わざわ ざその2つを別個のものとして扱う必要はないかもしれない。 これはどのような理論を仮定しているかにもよる。 「因果関係がある」というためには 少なくとも以下の3点を満たす必要がある 独立変数が従属変数よりも時間的に先行していること 理論的な観点からも因果の関係に必然性と整合性があること 他の変数の影響をのぞいても,2つの変数の間に共変関係があるこ と 回帰分析 とは 相関を調べるだけでは、因果関係があるとは判断できない。 (YをXで説明するのが回帰,YとXの間の関連を表すのが相関) 2つの変数間に因果関係が想定される時には,回帰分析を用いる。 1つの従属変数(基準変数;量的データ)を1つの独立変数(説明変 数;量的データ)から予測・説明する,と仮定した際に,回帰分析(単 回帰分析という)を使用する。 また回帰分析は,ある変数(X)からある変数(Y)を予測するという意味を もつ。 Y=aX+b(aとbの値を求めることにより,XからYを予測することができる) なおこの式で表されるように回帰分析は,XとYが直線的な関係であること が前提となるので注意 重回帰分析とは 1つの従属変数(基準変数;量的データ)を 複数の独立変数(説明変数;量的データ)から 予測・説明する,と仮定した際に用いる統計手法 各独立変数が従属変数に及ぼす影響の向きと大きさ 標準偏回帰係数(β)という 独立変数全体が従属変数を予測・説明する程度 決定係数(R2)という 練習 ある大学の授業で,授業の評価をするた めに授業の難易度,私語の程度,授業の 理解度,授業の全体的な評価について調 査を行った。 「難易度」「私語」「理解度」によって, 授業の全体的な評価がどの程度説明でき るのかを検討したい。 番号 難易 度 私語 理解 度 評価 1 4 7 5 4 2 7 8 4 1 3 5 7 5 4 4 2 6 6 9 5 3 7 6 6 6 5 8 5 6 7 8 2 6 8 8 1 5 7 9 9 8 4 5 4 10 2 3 4 5 11 2 5 3 6 12 4 5 2 4 13 5 2 2 8 14 5 3 1 4 15 2 2 3 8 16 9 4 4 4 17 3 7 5 7 18 2 3 6 9 19 3 4 3 5 20 2 2 2 8 Rコマンダーでの操作 「統計量」→「モデルへの適合」→「線形回 帰」 目的変数:評価 説明変数:難易度、私語、理解度 結果 「評価」に対して 負の影響力 →正の影響力 決定係数(R2) 全体(決定係数) の有意性 「難易度」「私語」「理解度」はともに授業全体の評価に有意な影響を及 ぼしていることがわかる。 問題点:Rコマンダーで重回帰分析すると標準化偏回帰係数が出ない 補足 疑似相関 相関係数と標準偏回帰係数を比較した際,それらが同符号で,ともに有意 な値をとっていれば,その相関関係は因果関係と認めることも可能となる 相関係数は有意であるにもかかわらず,標準偏回帰係数が0に近くなる場 合がある。 そのような関係にある場合,その相関は疑似相関である可能性がある。 抑制変数 従属変数との相関が低いにもかかわらず,標準偏回帰係数が有意になり, 単純相関では隠れていた因果関係が見えてくることがある。このような独 立変数を抑制変数という。 調整変数 被調査者を年齢や性別で分類してみると,変数間の相関関係がかなり異 なってくる場合がある。 群ごとに別の因果関係を想定して分析してみると,全被調査者で分析した 時と比べて,より説明力の高い結果が得られる場合がある。 このような場合,分類するための性別や年齢などの変数を調整変数という。 補足 多重共線性 相関係数と標準偏回帰係数が異符号で,しかもそれぞれが有意になる場合 がある。 独立変数間に直線的な関係があることを多重共線性というが,独立変数間 の相関が非常に高い場合にも近似的な多重共線性が発生する。 多重共線性が発生すると,回帰係数が完全には推定できなかったり,結果 が求まっても信頼性が低いものになったりする。 独立変数間の相関が高すぎる場合に,このような現象が生じることがある。 相互相関が高い変数が独立変数の中に共存していることは,重回帰分析という手法を 用いる上で不適切であると考えておく このような場合の対処方法としては 少なくとも1つの独立変数を削除する 独立変数をまとめる(独立変数に対して因子分析や主成分分析を行い,合成する) ただし,再度理論から仮定した因果モデルを考慮し直す必要もある。 参考・引用 心理データ解析Basic http://www.f.waseda.jp/oshio.at/edu/data_b/top.html
© Copyright 2024 ExpyDoc