第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な 方法は? 2つの定量的変数の間には、どんな関係があり 得るか? 2つの定量的変数間に直線的な関係があるかど うかを簡単な数値で表す方法は? 相関係数の定義は? 相関係数の計算方法は? 定量的変数間の関係 を調べる最も簡単な方法 例えば、10名 の生徒の数学の 成績を横軸に、国 語の成績を縦軸に とり、右の図のよう な散布図 (scatter diagram) を描く 方法がある。 国語 Y ● ● ● ● ● ● ● ● ● 数学 X 定量的変数の間には、 どんな関係があり得るか (1) U 字型の曲線的関係 複雑な曲線的関係 定量的変数の間には、 どんな関係があり得るか (2) 右下がりの直線的関係 右上がりの直線的関係 2変数間の直線的な関係の有無 を簡単に数値で表す方法 2変数間に直線的な関係がある かどうかを簡単に数値で表すの が、第6章で学ぶ相関係数 (Pearson’s product-moment coefficient of correlation、略して correlation) である。 相関係数の性質-1 (1) 2つの変数 x と y の相関係数は、しばしば、 つぎのように書かれる: rxy (2) 相関係数は、マイナス1の値からプラス1の値 までの範囲の値を取る: 1 rxy 1 相関係数の性質-2 相関係数が、負の場合負の相関、ゼロの 場合無相関、正の場合正の相関がある、 という。 ・ ・ 。 ・ ・ ・ ・ ・ ・ 負の相関 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 無相関 ・ ・ ・ ・ ・ ・ ・ ・ 正の相関 散布図の具体例(卒論データ) ここでは、散布図の例を、実際の適用例 で見てみよう。このデータは、千野のホー ムページの講義テキスト「データ解析/基 礎と応用 I」の2.1 節にある、ある卒論ゼミ の13名の学生の卒論の成績と3年間の 成績、とりわけ、卒論と各年次の成績間 の関係を散布図に表したものである。 相関係数の定義とその性質 ピアソンの相関係数は、テキスト p.29 の(6.1)式に示したように、共分散と2 つの変量それぞれの標準偏差を用い て表される 共分散 rxy sxy sx s y 標準偏差の積 共分散の定義と計算式 共分散は、テキスト p.29 の (6.2) 式に 示したように、次式で定義される: N 1 s xy ( xi x)( yi y ), N i 1 1 x1 y1 x2 y2 xN y N x y. N 相関係数の性質-1(既出) (1) 2つの変数 x と y の相関係数は、しばしば、 つぎのように書かれる: rxy (2) 相関係数は、マイナス1の値からプラス1の値 までの範囲の値を取る: 1 rxy 1 相関係数の計算の手順-その1 定量的2変数データが、つぎの5名の被 験者の (x, y)=(抑うつ性、気分の変化) の得点であるとする: (18, 15), (3, 5), (10, 13), (12, 8), (8, 7) 相関係数の計算の手順-その2 上記5名の(抑うつ性、気分の変化)データ (18, 15), (3, 5), (10, 13), (12, 8), (8, 7) で、 まず、抑うつ性の平均値は、 x (18 3 10 12 8) / 5 10.2 また、気分の変化の平均値は、 y (15 5 13 8 7) / 5 9.6 相関係数の計算の手順-その3 抑うつ性の得点の分散は、 s (18 3 10 12 8 ) / 5 10.2 , 2 x 2 2 2 128.2 104.04, 24.16 そこで、標準偏差は、 sx 24.16 4.92 2 2 2 相関係数の計算の手順-その4 気分の変化の得点の分散は、 s (15 5 13 8 7 ) / 5 9.6 , 2 y 2 2 2 106.4 92.16, 14.24 そこで、標準偏差は、 s y 14.24 3.77 2 2 2 相関係数の計算の手順-その5 最後に、両変数の共分散は、上記データ (18, 15), (3, 5), (10, 13), (12, 8), (8, 7) から、まず得点の積和の平均を計算すると、 1 x1 y1 x2 y2 xN yN N 1 (1815 3 5 1013 12 8 8 7) 5 1 (576) 113.4 5 相関係数の計算の手順-その6 つぎに、2変数の平均値の積を計算すると、 x y 10.2 9.6 97.92 そこで、2変数の共分散は、 1 s xy x1 y1 x2 y2 xN y N x y N 113.4 97.92 15.48 相関係数の計算の手順-その7 そこで、相関係数は、2変数の標準偏差が sx 4.92, s y 3.77 であったことに注意すれば、 rxy s xy sx s y 15.48 15.48 0.83 4.92 3.77 18.55 相関係数の有意性検定の方法(1) ここで得られた相関関係は、あくまでも上記5名 の標本についての抑うつ性と気分の変化の2変 数間のデータ (18, 15), (3, 5), (10, 13), (12, 8), (8, 7) に関するものでしかない。 一方、多くの場合我々の関心はこの特定の5名 の標本に関する当該2変量間の相関関係にある のではなく、この5名の標本が得られたもとの集 団、すなわち母集団における相関関係にある。 相関係数の有意性検定の方法(2) 通常、われわれの母集団における相関関係に対する 関心は、「母集団での相関係数、即ち母相関係数がゼ ロ(無相関)かどうか」にある。 これに関する帰無仮説(母相関係数がゼロ)は、テキス ト p.29 の最後の行にあるもので、つぎのように書く: H0 : 0 この帰無仮説が正しいかどうかを、標本で計算された 標本相関係数をもとに検定するのが、相関係数の有意 性検定と呼ばれるものである。 相関係数の有意性検定の方法(3) 相関係数を計算したら、テキスト p.30 の (6.3) 式、すなわち t r N 2 1 r 2 , に、相関係数 r およびサンプル数 N を代入し t を求める。 相関係数の有意性検定の方法(4) これを、うえの具体例の場合に当てはめると、 R=0.83, N=5 なので、 0.83 5 2 0.831.732 t , 2 1 0.6889 1 0.83 1.4376 2.58 0.3111 相関係数の有意性検定の方法(5) 検定には、うえの t が、母相関係数が ゼロなる帰無仮説のもとで、自由度 ν=N-2 なる t 分布に従うことを利用する (テキスト p.30)。 うえの例では、t-分布の自由度は、 ν= N – 2 = 5 – 2 = 3 相関係数の有意性検定の方法(6) つぎに、岩原テキストの p.434 の t 分布 表のν=3, P=0.05 に対応する棄却点の値 3.182 を読み取る。 一方、先程計算した t =2.58 を思い出そう。 この時、t=2.58 < 3.182 なので、このよう な場合、我々は、帰無仮説(母相関係数 がゼロ)を採択する。 相関係数の有意性検定の方法(7) 相関係数についての帰無仮説が採択される 時、われわれは「相関係数は有意でない」とい う。 一方、もし標本から計算された t 値が、棄却 点の値 3.182 以上ならば、我々は帰無仮説 (母相関係数がゼロ)を棄却する。 この時われわれは、「相関係数は5%水準で 有意である」という。
© Copyright 2024 ExpyDoc