生物統計学・第1回 統計解析を始める前に

生物統計学・第14回
傾向を調べる
回帰分析
2015年1月20日
生命環境科学域 応用生命科学類
尾形 善之
今日の流れ
★講義
♦ 相関係数のおさらい
♦ 回帰分析
★実習
♦ ピアソン相関係数の検定
♦ スピアマン相関係数
♦ 単回帰分析
ピアソンの相関係数
★正確には「ピアソンの積率相関係数」
平均値との差
♦𝑟 =
𝑥1 −𝑥 𝑦1 −𝑦 +⋯+ 𝑥𝑛 −𝑥 𝑦𝑛 −𝑦
𝑥1 −𝑥 2 +⋯+ 𝑥𝑛 −𝑥 2
𝑦1 −𝑦 2 +⋯+ 𝑦𝑛 −𝑦 2
★でもZ化したデータを使うと……
♦𝑟 =
𝑥1 𝑦1 +⋯+𝑥𝑛 𝑦𝑛
𝑛
• これでOK
標準偏差
すでに平均値との差を
標準偏差で割っている
平均値は0
標準偏差は1
エクセルで計算する
A
B
1
308
27
2
77
18
3
69
20
4
96
13
5
40
16
★=correl(A1:A5,B1:B5)
♦ これだけ
相関係数の目安
★大体の目安
♦ 0.8以上:かなり相関が高い
♦ 0.6以上:相関がある
★実は検定もできます
♦ 一般的には、𝑅表を使います
♦ エクセルで𝑝値を計算できます
相関係数の意味
★正の相関係数
♦ よく似ている
★負の相関係数
♦ 逆の傾向
★相関係数0
♦ まったく関係がない
相関係数の検定
★𝒕検定を利用します
♦ まずは𝑡値の計算
• 𝑡=
𝑟× 𝑛−2
1−𝑟 2
• エクセルでは、
– 相関係数がA1セル、要素数が79とすると、
=A1*SQRT(79-2)/SQRT(1-A1^2)
♦ 次に𝑝値の計算
• 𝑡値がA2セルとすると、
• =TDIST(A2,77,2)
– 自由度:77、両側検定
スピアマンの順位相関係数
★使い道
♦ データが数値でないとき
♦ データが順位のとき
★計算式
♦𝜌 = 1 − 6
𝑥𝑖 −𝑦𝑖 2
𝑛 𝑛2 −1
エクセルで計算する場合
★順位を計算
♦ =rank(A1,A1:A5)
★順位データでピアソン相関係数を計算
♦ =correl(C1:D5)
A
B
C
(Aの順位)
D
(Bの順位)
1
308
27
1
1
2
77
18
3
3
3
69
20
4
2
4
96
13
2
5
回帰分析
★相関係数との関係
♦ 相関係数:ふたつのデータセットの類似性
♦ 回帰分析:近似式とデータセットの類似性
♦ カイ二乗検定と似ています
• 独立性の検定:ふたつのデータセットが対象
• 適合度の検定:正解データとデータセットが対象
★手計算はほとんどできません
♦ エクセルの関数や分析ツールを利用します
回帰分析の目的
★実測値と理論値の比較
♦ あらかじめ理論値がある場合
• 実測値が理論値にどのくらい当てはまるか?
♦ 新たに理論モデルを作る場合
• 理論値は実測値をどのくらいうまく説明できるか?
♦ 実測値と理論値の相関係数!
回帰分析の原理
線とどれだけ近いか
線との差の二乗和
回帰式:𝑦 = 𝑎𝑥 + 𝑏
○と●がどれだけ近いか
丸同士の差の二乗和
相関係数 𝑟
回帰分析の手順
★理論値がある場合
♦ 実測値と理論値のデータセットを用意
♦ データ分析 → 回帰分析
♦ 入力範囲を指定してOK
♦ 出力結果
• 相関係数:「回帰統計」中の「重相関R」(0.84)
• 有意確率:「分散分析表」の「有意F」(<0.001)
• 回帰式:一番下の表
– 「X値1(1.54)」と「切片(-25.62)」
• 𝑦 = 1.54𝑥 − 25.62
回帰分析の手順
★理論値を作る場合
♦ 時系列の実測値のデータセットを用意
• 今回はふたつのデータセットで代用します
♦ 挿入 → 散布図
♦ データ系列を右クリック → 近似曲線を追加
♦ 近似曲線の書式設定
• 「線形近似」を選択
• 「グラフに数式を表示する」をチェック
• 「グラフにR-2乗値を表示する」をチェック
重回帰分析
★目的
♦ 目的のデータセット(理論値)を複数のデータセッ
ト(回帰式)で説明する
★原理
♦ 回帰分析と一緒です
♦ 同じ目的で、主成分分析も利用できます
★手順
♦ 参考書で説明します
重回帰分析
チェックポイント・I
1. 回帰分析の目的は?
2. 回帰分析の原理は?
3. 回帰分析の手順は?
4. 重回帰分析とは?
本日の実習と課題
★注目遺伝子とその隣の遺伝子について
♦ 注目遺伝子のIDを書いてください。
♦ 237実験でのピアソン相関係数およびスピアマン相
関係数を計算し、比較しなさい。
♦ 求めたピアソン相関係数の検定をしなさい。
★回帰分析用のデータを使って、単回帰分
析を行い、考察しなさい。
次回の予告
★次回は講義の最終日です。
♦ 2種類のエラーについて説明します。
♦ 次回のレポートは返しません。
• 質問に答えるのは、今日のレポートが最後になります。
★期末試験の概要を説明します。
♦ 試験では、これまでの各自のレポートを参照してか
まいません。
♦ もう一度聞いておきたい内容があれば、今日のレ
ポートに書いてください。