平成20年度「教育統計」の学習内容－1

第１日目第１時限の学習目標
 平成２２年度「教育統計」の学習内容の
概要を知る。
 尺度の４水準の例とそれらの特色の概要
を学ぶ。
 １変量データを手にした時の、分布の特
徴の記述の方法を学ぶ。
 基本的な一変量統計量（その１）につい
て学ぶ
平成２２年度「教育統計」
の学習内容－１
 尺度の水準
 代表値とばらつきの各種指標
 度数分布表及び散布図
 連関と相関の各種指標
 順列、組み合わせ、確率
 確率分布とその期待値・分散
 母集団と標本
 点推定と区間推定
平成２２年度「教育統計」
の学習内容－２
 検定と２種類の過誤
 平均値の差の検定
 ピアソンの相関係数とその検定
 分割表の検定
 ３つ以上の平均値の差の検定（分散分
析）
 検査の信頼性と妥当性
 まとめと小テスト
教育や心理の分野での統計における
尺度水準の識別の必要性とそのルーツ－１
 教育や心理など主として社会行動科学の分野が扱う
現象には、多種多様なものがあり、それらの統計を
取るためには、データがどのような性質を持ってい
るのかを分析に先立ちチェックしておく必要がある。
 データは、一旦コード化されコンピュータに入力さ
れると、便利な統計ソフトを用いれば、簡単に結果
を出すことができるが、統計ソフトのそれぞれの分
析方法にはそれぞれ前提が幾つか存在する。
 とりわけ、データがどのレベルの情報を持っている
のかは、それらの前提のうちで、基本的なものの１
つである。
教育や心理の分野での統計における
尺度水準の識別の必要性とそのルーツ－２
 心理学のみならず、物理学等における「測定」に関す
る議論は、歴史的には２０世紀の前半から中頃までに
盛んになされた（例えば、千野、有斐閣、p.537）。
 例えば、キャンベルら (Campbell, N. R. & Jeffreys, H.,
1938) は、測定を「測定対象システムの（数以上の）
特性を表すように、特性を支配している法則により数
字を割り当てること」と定義した。
 一方、スティーブンス (Stevens, S. S., 1951) は、「測定
とは規則に従って対象もしくは事象に数字を割り当て
ること」と定義した。
教育や心理の分野での統計における
尺度水準の識別の必要性とそのルーツ－３
 いずれにせよ、測定では一般に対象や事象に対
して数字を割り当てるので、個々の測定が数字
の持つ基本的な特徴である順序 (order)、距離
(distance)、及び原点 (origin)、の情報を持ってい
るかどうかの検討が不可欠である。
 とりわけ、スティーブンス (1958) は、尺度を名
義尺度 (nominal scale)、順序尺度 (ordinal scale)、
間隔尺度 (interval scale)、比率尺度 (ratio scale)
に分類した。
尺度の４水準の例と
それらの特色の概要
 名義尺度
（例）男を１、女を２とコーディン
グ。
（特色）コード値には順序情報さえ
ない。
 順序尺度
（例）一番よく遊ぶ友達を１、その
次によく
遊ぶ友達を２、とコーディン
グ。
尺度の４水準の例と
それらの特色の概要－２
 間隔尺度
（例）非常に賛成に１、賛成に２、どちら
でもな
いに３、反対に４、全く反対に５、
とコーディ
ングする。
（特色）コード値間の差に意味がある。
 比率尺度
（例）身長。
尺度の４水準の例と
それらの特色の概要－３
 尺度の４水準のより
詳細な定義について
は、例えば千野の
ホームページの「講
義ノート」の中の
「心理統計学」の第
１章「少数データの
平均と標準偏差の求
め方」の１．１節
を、を参照のこと。
なお、
尺度の４水準の例と
それらの特色の概要－３
 千野のホームページの URL は、
http://www.agu.ac.jp/~chino
である。あるいは、Yahoo か Google で
「千野研究室」
と入力して検索してもよい。
１変量データを手にした時の
分布の特徴の記述－１
 我々が、何らかの目的で N 個のデータ
x1 , x2 ,, xN
を手にしたとする。
 データがどの尺度レベルを満たしていようとも、
サンプル数 N がある程度以上大きい場合、簡
単にデータの全体像をつかむためには、度数分
布を描いたりヒストグラム（棒グラフ）を描け
ばよい。
１変量データを手にした時の
分布の特徴の記述－２
 そのためには、もしデータが名義尺度レベ
ルであるとすれば、例えば、１．男、２．
女、の各々の度数を数えればよい。
 一方、順序尺度以上のレベルであれば、小
さい順から大きい順次並べ、階級を設定し、
各階級に落ちる度数を数えればよい。
 千野のホームページの講義ノートの中の
「データ解析/基礎と応用」の１．２．１節
の「定量変数の分布特性」のページの例は、
その２例を示す。
１変量データを手にした時の
分布の特徴の記述－３
 この例に見るように、教育や心理の分野の
データの分布には多様なものがある。
 これらの多様な分布の特徴としては、
（１）分布の中心的な値（代表値）の指標
（２）分布のばらつき（裾野の広さ）の指
標
（３）分布のとんがりの程度の指標
（４）分布の（対称性からの）歪みの指標、
などがある。
１変量データを手にした時の
分布の特徴の記述－４
 これらの指標は、数理統計学の分野では一般
に統計量 (statistic) と呼ばれる。
 これらの指標は、より一般的には、数理統計
学では（理論）分布の積率 (moment)、確率
母関数 (probability generating function)、積
率母関数 (moment generating function)、特性
関数 (characteristic function)、キュミュラン
ト (cumu- lants) を用いて検討される。
 この授業では、これらの詳細については省略
する。
基本的な１変量統計量ー１
(a) （標本）平均と分散
平均
分散
x1  x2    xN 1 N
x
  xi
N
N i 1


1
vx  ( x1  x) 2  ( x2  x) 2    ( xN  x) 2 ,
N
1 N
  ( xi  x ) 2
N i 1
基本的な１変量統計量ー１
(b) 平均値の計算例
 データは、サンプル数、すなわち N=5
で、
15, 67, 31, 89, 44
とする。
 この時、
15  67  31  89  44 246
x

 49.2
5
5
基本的な１変量統計量ー１
(c) 定義式による分散の計算例
 データは、サンプル数、すなわち N=5 で、
15, 67, 31, 89, 44 で、平均は 49.2 なので、
定義式による分散 vx は、つぎのように計算で
きる：

1
2
2
2
vx  (15  49.2)  (67  49.2)    (44  49.2)
5

基本的な１変量統計量ー１
(d)計算ミスの少ない分散の計算法
 データは、サンプル数、すなわち N=5 で、
15, 67, 31, 89, 44 で、平均は 49.2 なので、
手計算による分散 vx は、つぎのように計算でき
る：


1 2
2
2
2
2
2
vx  15  67  31  89  44  49.2
5
15532

 2420.64  3106.4  2420.64
5
 685.76
基本的な１変量統計量ー１
(e) 不偏分散
 不偏分散の定
義
N ではなく、N-1
で割ることに注意
1 N
2
ux 
( xi  x)

N  1 i 1
N

vx 実際の計算はこちら
N 1
基本的な１変量統計量－１
(f) 不偏分散の計算の具体例
 定義より、不偏分散は、うえの具体例で
は、
N=5, vx=685.76 なので、
5
5
u x
 v x   685.76
5 1
4
3428.75

 857.19
4
基本的な１変量統計量ー１
(g) 標準偏差の定義と計算例
 標準偏差の定義と計算例
分散の開平（平方根）
の計算が必要
sx  vx  685.76  26.19
演習（１）
 つぎの５個から成るデータセットの１つを用
いて、その平均、分散、不偏分散、及び標準
偏差を計算せよ：
（データセット１）：９４、１８、６
８、６５、３１
（データセット２）：８１、５、７３
、６、６３
（データセット３）：２３、４６、１
６、５２、７７
基本的な１変量統計量ー１
(h) 平均値の性質（参考）
 平均値は、代表値の１つで、データの
中心的な値を示す。
 平均値は、個々の値の原点を定数 a だ
けずらすと、a だけずれる。ただし、も
との値のままでも代表値としての性質
は持っている。
yi  xi  a, なる変換に対して
y ｘ  a.
基本的な１変量統計量ー１
(i) 分散の性質（参考）
 分散は、データのばらつきの１つの指標で
ある。
 分散は、原点を a だけ移動させても変わら
ない（原点移動に対する不変性）。
yi  xi  a　なる変換に対して
、
N
1 N
1
v y   ( yi  y ) 2   ( xi  x) 2 .
N i 1
N i 1

Download Report