Document

統計基礎(第2回)
記述統計学:統計とデータ
早稲田大学大学院商学研究科
2015年4月15日
大塚忠義
1
講義資料
http://tyotsuka.cocolog-nifty.com/blog/
から各自事前にダウンロードしてください
講義後に課題とともにコースナビにアップ
ロードします
レポートはコースナビで提出してください
2
Agenda
第2回 記述統計学;統計とデータ
• データとは
• 統計とは
• データの見方
• 散布度
• 確率とは
3
データ
さまざまな調査や実験から得られた情報
量的な情報:数値で表現できるもの
身長、所得、成績、死亡者数
質的な情報:直接数値では表せないもの
性格、政治信条、婚姻状況
データに数値を与えて量的情報に変換す
ることができる
結婚1:未婚0、とても優しい5:優しい4:ふ
つう3:あまり優しくない2:優しくない1
4
統計とは(1)
一定の条件に基づいて集められた「デー
タのまとまり」を扱うための手法
Aさん:身長165㎝、23歳、女性、A型、将
来に野心を持ち、心優しい性格
⇐特定の個人データ:統計の感知するとこ
ろではない
この教室のいる人の身長、年齢、性別、
血液型⇐統計の対象
この教室のいる人の性格⇐対象になりう
る、扱うために加工がいる eg. 数値化
5
統計とは(2)
現象を調査することによって数量で把握
すること、または、調査によって得られた
数量データのこと
平均身長165㎝、平均年齢23歳、A型35%
入社後部長以上を望む人25%
自分の優しさ度を5段階評価したところそ
の平均は3.5
6
統計処理
データを数値化する
数値データで構成される集団の特徴・傾向
を尺度で示す
⇒非常に多くのデータのプロフィールを数個
の数値(代表値)で表現する
弱点は重要な傾向を見落とす可能性
データの見える化が必要
7
尺度
尺度:調査対象に割り振った変数、その測
定、あるいはそれにより得られた数値デー
タ
尺度水準:尺度が表現する情報の性質に
基づき数学・統計学的に分類する基準
平均(モード、メジアン)、分散、標準偏差
は統計に活用できる高度の尺度に該当す
る
8
基本統計量
標本サイズ:データの数
合計:データ値の合計
平均(標本平均)
中央値(メジアン):データを順番に並べた時
の中央に位置する値
最頻値(モード):もっとも頻繁に表れた値
最大値
最小値
範囲:最小値と最大値の差
分散(標本分散)
標準偏差
9
データの見方(1)
役職員の月例給与
社員名
大竹
武宮
石田
坂田
加藤
藤沢
林
小林
依田
山下
A社
21
24
26
26
30
32
34
37
40
130
B社
25
28
32
35
38
40
42
48
52
60
平均
40
40
どちらの会社
が望ましいで
すか?
入社するなら
どちら?
これらのデー
タから推測さ
れる会社の状
況を挙げてく
ださい
10
データの見方(2)
平均
中央値
標準偏差
40
31
32.2
40
39
10.9
どちらの会社が望ましいですか?
入社するならどちら?
これらのデータから推測される会社の状況を
挙げてください
役職員が1万人いたらどのように分
析する
11
データの見方(3)
度数分布
グラフ
• ヒストグラム
• 折れ線グラフ
累積度数分布とグラフ
12
散布度
散布度:データの散らばり具合
レンジ:最大値-最小値
分散
標準偏差
変動係数
ゆがみ(歪度)ととがり(尖度)
標準偏差
変動係数=
平均
13
課題(第1回)
野球チーム 早稲田スタカスティックスのメ
ンバーの打率、100メートル走のタイム、視
力について、それぞれ次の値を求める。
合計、平均、中央値、最大値、最小値、範囲
同じくメンバーの打率、100メートル走のタ
イムについて、度数分布を作成し、それらを
ヒストグラムまたは折れ線グラフで表現する。
期限は5月13日(コースナビ利用可能後2
週間)
14
確率とは(1)
確率( probability)とは、ある現象が起こる度
合い、ある事象が現れる割合
対象となる現象、事象は、結果があらかじ
め定まっていないもの
「起こる度合い」「現れる割合」は偶然性を含
まない一意に定まった数値であり、発生の
度合いを示す指標
15
確率とは(2)
ある現象が起きる度合いを0から1までの数
値で表した尺度
結果が不確実・不確定な現象を確率を使っ
て解釈することができる
将来ある事象が(偶然に)発生する度合(可
能性)を偶然性を含まない数値で表現した
もの
16
確率論
確率論(probability theory)とは、偶然現象
に対して数学的なモデルを与え、解析する
数学の一分野である
確率論は神々への反逆
☞確率統計学者は儲かるか
絶対負けない博打➩賭場の経営
株式投資で確実に儲ける方法
➩想定外にはノーベル賞も太刀打ちできず
17
確率は神々への反逆
将来の事象は神々の領域
人々は運命を受け入れる
➩人の生き死に、
豊不作、天候
そして博打の勝ち負けを
確率論でコントロール下に
『リスク』 ピーター・バーンスタイン
「日本経済新聞社」
18
Question?
お疲れ様でした
19