生体情報論演習 第1回 - Introduction

生体情報論演習
- 統計法の実践 第2回2011. 6. 17.
京都大学 情報学研究科 杉山麿人
先週の課題の解答例 DATA1
40
mean: 25.2
s.d.: 9.10
s.e.m.: 0.91
30
頻 20
度
10
0
0
10
20
30 40
データ区間
50
60
70
先週の課題の解答例 DATA2
mean: 10.89
s.d.: 2.36
s.e.m.: 0.24
15
10
5
0
7
8
9 10 11 12 13 14 15 16 17
データ区間
先週の課題の解答例 DATA3
40
mean: 0.20
s.d.: 0.16
s.e.m.: 0.016
30
頻 20
度
0
10
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
データ区間
分布について解析
• 分布の形が違う
– DATA1 – (実は)正規分布からのデータ
– DATA2 – (実は)一様分布からのデータ
– DATA3 – (実は)ベータ分布からのデータ
– データ範囲のとり方を変えると,形が変わる
• データから真の分布を見つけるのは難しい !
• n を大きくすると
– s.d.はどうなるかわからない
– s.e.m.は一般に小さくなる
• 実験データが増えるほど推測が正確になる
実験データの例
3
4
5
43
25
10
6
8
31
98
・・・
測定値
31
87
・・・
個体 No.
1
2
373
21
参考:統計
学入門(東
京大学出
版会)
実験データの度数分布表
階級
度数
0 ~ 10
12
11 ~ 20
21 ~ 30
10
19
31 ~ 40
41 ~ 50
51 ~ 60
42
72
82
61 ~ 70
71 ~ 80
81 ~ 90
91 ~ 100
54
38
25
19
合計
373
実験データの分布をヒストグラムで表す
100
90
80
70
度 60
数 50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100
点数
ヒストグラム上での平均値と標準偏差
100
90
80
70
度 60
数 50
40
30
20
10
0
平均値
標準偏差
0 10 20 30 40 50 60 70 80 90 100
点数
エラーバー付き棒グラフ
• [平均値と標準偏差]
または
[平均値と標準誤差]
の組をグラフで表す
• バーの高さと
エラーバーで現す
– バーの高さは平均値
– エラーバーは標準偏
差か標準誤差
標準偏差か
標準誤差
平均値
エラーバー付き棒グラフの例
mean ± s.e.m.
個体
対照群
処理群
1
59
83
70
2
46
70
60
3
55
69
4
76
80
5
75
59
6
83
51
反 50
応 40
量
30
7
44
70
8
77
62
10
9
65
67
0
10
56
84
20
課題
• Excelファイルにある各データセットについて
,エラーバー付きの棒グラフを描く
– エラーバーは標準誤差とする
• 解答をPowerPointにまとめる
– PowerPoint ファイルで提出
• 締め切り:6月23日(木)18:00
• 課題の提出先:
mahito+seitai(at)iip.ist.i.kyoto-u.ac.jp