確率と統計

確率と統計2007(No.2)
メディア学部
2007年10月4日(木)
担当教員:亀田弘之
Copyright© 2007 Tokyo University of Technology
前回の内容(復習)
1. 統計学の構成
– 記述統計学
• データの整理(効果的な表・図の作り方)
– (確率)
• 推計学(統計的推論)の基礎
– 推計学(数理統計学)
• 推定・検定など
2. データ整理の実演(紹介)
確率と統計2006
2
Copyright© 2007 Tokyo University of Technology
今日の内容
• データ解析の演習(各自で実施)
1. 度数分布表の作成
2. ヒストグラムの作成
3. グラフの分析
• (データの)代表値
• (データの)散らばり
確率と統計2006
3
Copyright© 2007 Tokyo University of Technology
データ解析の演習
• 処理対象データ:
• 作成するもの:
– 度数分布表
– ヒストグラム
• 処理手段:
– コンピュータ(EXCEL)
– 手計算
• 分析の観点
– 代表値と散らばり
確率と統計2006
4
Copyright© 2007 Tokyo University of Technology
処理対象データ
• http://kameken.clique.jp/Stat2007/
確率と統計2006
5
Copyright© 2007 Tokyo University of Technology
新生児60人の体重(1998)
表. 新生児の体重
(1998年)
3740
2550
2920
2530
3280
2840
2520
3350
3610
3430
3020
3320
2790
3050
3620
3260
3320
3800
2640
3360
3320
4100
2720
4050
3850
3380
3040
2710
4150
3200
4120
2780
3220
2780
2490
2950
2580
2020
3010
2010
2800
2760
4480
2990
3700
2960
2320
3060
3200
3380
3100
2840
2990
3100
3530
3270
2600
3640
3300
4570
単位はグラム
確率と統計2006
6
Copyright© 2007 Tokyo University of Technology
手順1: EXCELの起動
[スタート]-[すべてのプログラム][Microsoft Excel]
手順2:データの入力
確率と統計2006
7
Copyright© 2007 Tokyo University of Technology
3740
2550
2920
2530
3280
2840
2520
3350
3610
3430
3020
3320
2790
3050
3620
3260
3320
3800
2640
3360
3320
4100
2720
4050
3850
3380
3040
2710
4150
3200
4120
2780
3220
2780
2490
2950
2580
2020
3010
確率と統計2006
2010
2800
2760
4480
2990
3700
2960
2320
3060
3200
3380
3100
2840
2990
3100
3530
3270
2600
3640
3300
8
Copyright© 2007 Tokyo University of Technology
4570
手順1: EXCELの起動
[スタート]-[すべてのプログラム][Microsoft Excel]
手順2: データの入力
手順3: 度数分布表の作成
確率と統計2006
9
Copyright© 2007 Tokyo University of Technology
度数分布表の作成
確率と統計2006
10
Copyright© 2007 Tokyo University of Technology
度数分布表とは
データをいくつかのグループに分類し、
各グループに属するデータ数を添えた表。
確率と統計2006
11
Copyright© 2007 Tokyo University of Technology
度数分布表とは
• イメージとしては右図の
•
ようなもの。
キャプション・
表頭・表側・
区間(階級)・
区間幅(階級幅)
表.度数分布表の例
区
間
度 数
0-99
20
100-199
50
200-299
120
300-399
65
確率と統計2006
12
Copyright© 2007 Tokyo University of Technology
度数分布表の作成
1. 最大値と最小値を求める。
2. 最大値と最小値の差R(範囲)を求める。
3. 区間の個数(棒グラフの棒の本数)kを決める。
•
•
•
k=√n
k=1 + 3.32 log10(n)
簡単に、k=7~10ぐらいにする。
4. 区間幅hを求める。
1. h=R÷k
2. hの値を見て、きりのいい数字に設定する。
確率と統計2006
13
Copyright© 2007 Tokyo University of Technology
度数分布表の作成
1.
2.
3.
4.
5.
最大値=____, 最小値=___
範囲R=最大値-最小値
区間数k=____
区間幅h=____
最小値と最大値とを勘案して、区間の両端
を決める。
確率と統計2006
14
Copyright© 2007 Tokyo University of Technology
新生児の体重(
体重(g)
人数
~2000
0
2000~2400
3
2400~2800
14
2800~3200
16
3200~3600
14
3600~4000
7
4000~4400
4
4400~4800
2
確率と統計2006
15
Copyright© 2007 Tokyo University of Technology
1998年の新生児の体重[g]
16
14
10
8
系列1
6
4
2
0
20
00
23
00
26
00
29
00
32
00
35
00
38
00
41
00
44
00
47
00
50
00
人数[人]
12
体重[g]
確率と統計2006
16
Copyright© 2007 Tokyo University of Technology
練習問題1
• 講義と同じデータ(新生児の体重)を使って
– 度数分布表
– ヒストグラム
を作成してみよう。
<注> データはWebにアップされています。
確率と統計2006
17
Copyright© 2007 Tokyo University of Technology
練習問題2
• 講義とは違うデータを使って
– 度数分布表
– ヒストグラム
を作成してみよう。
<注> データはWebにアップされています。
確率と統計2006
18
Copyright© 2007 Tokyo University of Technology
自由研究問題
• 講義と同じデータ(新生児の体重)を使って
– 度数分布表
– ヒストグラム
を作成してみよう。
ただし、区間幅(ヒストグラムの棒の本数)をいろいろ変
えたものを作ってみよう。
(データ数と区間幅の適切な関係を考察してみよう。)
<注> データはWebにアップされています。
確率と統計2006
19
Copyright© 2007 Tokyo University of Technology
おわり
確率と統計2006
20
Copyright© 2007 Tokyo University of Technology