確率と統計2011(第2日目) メディア学部 2011年9月29日(木) 担当教員:亀田弘之 Copyright© 2010 Tokyo University of Technology 前回の内容(復習) 1. 統計学の構成 – 記述統計学 • データの整理(効果的な表・図の作り方) – (確率) • 推計学(統計的推論)の基礎 – 推計学(推測統計学・数理統計学) • 推定・検定など 2. データ整理の実演(紹介) 2 Copyright© 2011 Tokyo University of Technology 前回受けた質問 • Q1: 数学が不得意なのですが... • Q2: 成績評価はレポートだけですか? 3 Copyright© 2011 Tokyo University of Technology 初回アンケートについて • 単位がほしい • 数学が苦手だから統計を学んでできるように なりたい。 • 数式を使ってほしい。 4 Copyright© 2011 Tokyo University of Technology 今日の内容 • データ解析の演習(各自で実施) 1. 度数分布表の作成 2. ヒストグラムの作成 3. グラフの分析 • (データの)代表値 • (データの)散らばり 統計ソフトの使い方よりも、 統計的データ処理の考え方 を理解してください。 5 Copyright© 2011 Tokyo University of Technology データ解析の演習 • 処理対象データ: • 作成するもの: – 度数分布表 – ヒストグラム • 処理手段: – コンピュータ(EXCEL) – 手計算 • 分析の観点 – 代表値と散らばり 6 Copyright© 2011 Tokyo University of Technology 処理対象データ • http://kameken.clique.jp/Lectures/ Lectures2011/Stat2011/index.html 7 Copyright© 2011 Tokyo University of Technology 新生児60人の体重(1998) 表. 新生児の体重 (1998年) 3740 2550 2920 2530 3280 2840 2520 3350 3610 3430 3020 3320 2790 3050 3620 3260 3320 3800 2640 3360 3320 4100 2720 4050 3850 3380 3040 2710 4150 3200 4120 2780 3220 2780 2490 2950 2580 2020 3010 2010 2800 2760 4480 2990 3700 2960 2320 3060 3200 3380 3100 2840 2990 3100 3530 3270 2600 3640 3300 4570 単位はグラム 8 Copyright© 2011 Tokyo University of Technology 手順1: EXCELの起動 [スタート]-[すべてのプログラム][Microsoft Office]-[Microsoft Excel 2007] 手順2:データの入力 9 Copyright© 2011 Tokyo University of Technology 3740 2550 2920 2530 3280 2840 2520 3350 3610 3430 3020 3320 2790 3050 3620 3260 3320 3800 2640 3360 3320 4100 2720 4050 3850 3380 3040 2710 4150 3200 4120 2780 3220 2780 2490 2950 2580 2020 3010 2010 2800 2760 4480 2990 3700 2960 2320 3060 3200 3380 3100 2840 2990 3100 3530 3270 2600 3640 3300 10 Copyright© 2011 Tokyo University of Technology 4570 手順1: EXCELの起動 [スタート]-[すべてのプログラム][Microsoft Office]-[Microsoft Excel] 手順2: データの入力 手順3: 度数分布表の作成 11 Copyright© 2011 Tokyo University of Technology 度数分布表の作成 12 Copyright© 2011 Tokyo University of Technology 度数分布表とは データをいくつかのグループに分類し、 各グループに属するデータ数を添えた表。 13 Copyright© 2011 Tokyo University of Technology 度数分布表とは • イメージとしては右図の • ようなもの。 キャプション・ 表頭・表側・ 区間(階級)・ 区間幅(階級幅) 表.度数分布表の例 区 間 度 数 0-99 20 100-199 50 200-299 120 300-399 65 14 Copyright© 2011 Tokyo University of Technology 度数分布表の作成 1. 最大値と最小値を求める。 2. 最大値と最小値の差R(範囲)を求める。 3. 区間の個数(棒グラフの棒の本数)kを決める。 • • • k= n k=1 + 3.32 log10(n) [スタージェスの式] 簡単に、k=7~10ぐらいにする。 4. 区間幅hを求める。 1. h=R÷k 2. hの値を見て、きりのいい数字に設定する。 15 Copyright© 2011 Tokyo University of Technology 度数分布表の作成 1. 2. 3. 4. 5. 最大値 = ____, 最小値 = ___ 範囲 R = 最大値-最小値 区間数 k = ____ 区間幅 h = ____ 最小値と最大値とを勘案して、区間の両端 を決める。 16 Copyright© 2011 Tokyo University of Technology 新生児の体重(1998年) 体重(g) 人数 ~2000 0 2000~2400 3 2400~2800 14 2800~3200 16 3200~3600 14 3600~4000 7 4000~4400 4 4400~4800 2 17 Copyright© 2011 Tokyo University of Technology 1998年の新生児の体重[g] 16 14 10 8 系列1 6 4 2 0 20 00 23 00 26 00 29 00 32 00 35 00 38 00 41 00 44 00 47 00 50 00 人数[人] 12 体重[g] 18 Copyright© 2011 Tokyo University of Technology 練習問題1 • 講義と同じデータ(新生児の体重)を使って – 度数分布表 – ヒストグラム を作成してみよう。 <注> データはWebにアップされています。 19 Copyright© 2011 Tokyo University of Technology 練習問題2 • 講義とは違うデータを使って – 度数分布表 – ヒストグラム を作成してみよう。 <注> データはWebにアップされています。 20 Copyright© 2011 Tokyo University of Technology 自由研究問題 • 講義と同じデータ(新生児の体重)を使って – 度数分布表 – ヒストグラム を作成してみよう。 ただし、区間幅(ヒストグラムの棒の本数)をいろいろ変 えたものを作ってみよう。 (データ数と区間幅の適切な関係を考察してみよう。) <注> データはWebにアップされています。 21 Copyright© 2011 Tokyo University of Technology おわり 22 Copyright© 2011 Tokyo University of Technology
© Copyright 2024 ExpyDoc