記述統計:度数分布,ヒストグラム,箱ヒゲ図,位置の尺度

経済と経営のための統計学
2015 年度 美添泰人
第 (2) 回 : 記述統計:度数分布,ヒストグラム,箱ヒゲ図,位置の尺度
範囲 : 統計入門 II.1 ∼ II.5,III.1 ∼ III.4
(1) 質的データと量的データ:統計入門 II.1,ips 第 1 章
(2) 質的変数の分析:分類,各種のグラフ:統計入門 II.5,ips 1.1
(3) 量的(連続形)変数の整理,度数分布:統計入門 II.3,ips 1.1-2
(4) 幹葉表示 (幹葉図,stem-and-leaf display) :放送大学「資料の整理」 p. 27–30,ips p. 14,32,61,
統計入門 p.20
(5) ヒストグラムの読み方,分布の形,変数の性格(身長と体重,所得,資産など)による分布形
の相違:統計入門 II.4,ips 1.1
(6) 累積度数分布,そのグラフとヒストグラムとの関係,連続変数と離散変数のグラフの違い:統
計入門 II.4,ips 1.1; p.41,資料の整理 p.33–35
(7) パーセント点 (percentile) など:統計入門 II.4,ips 1.1; p.41,資料の整理 p.33–35
(8) 深度 (depth),四分位点 (quartile),中央値(中位数 median),五数要約 (five-number summary):資料の整理 p.29, 37,ips p.53
(9) 箱ヒゲ図 (box-and-whisker plot / box plot):資料の整理 p.31,ips p.53,56,71
(10) パーセント点 (percentile),分位点 (quartile):統計入門 p.50–52,資料の整理 p.35
(11) メディアン (M , med, me など),四分位点,パーセント点.グラフとの関係,(n + 1)/2 の
公式
四分位は n′ = [(n + 1)/2] として (n′ + 1)/2 の公式(ただし [ ] は切り捨ての記号で [3.5] は 3
である).同様に八分位も n′′ = [(n′ + 1)/2] として (n′′ + 1)/2
(12) 位置 (location) の尺度・散らばり (dispersion) の尺度とヒストグラム(度数分布)との対応:
資料の整理 p.29, 37,ips p.53
(13) 算術平均:式,解釈(重心),偏差の合計,偏差を最小にする値:統計入門 III.2
(14) 度数分布表からの算術平均の計算:統計入門 III.2(p.47–48)
(15) 練習:ips p.34, 35, 41
コンピュータによる演習
(1) 統計解析ソフトウェア R の入門.
(1-1) R の起動と終了.
(1-2) 最初の注意: getwd( ), setwd( ) とデータ・プログラムの保存場所
(1-3) (高機能)卓上計算機としての利用
(1-4) データの入力方法,変数の指定,データ構造と dataframe,その他.
(2) R script の利用
(2-1) 「ファイル」∼ 「新しいスクリプト」.適当に編集後,名前をつけて保存(拡張子は .R
とする).
(2-2) スクリプトの実行:カーソル行なら Ctrl-R
(2-3) スクリプトの実行:範囲を選択して Ctrl-R
1
(2-4) 慣れた editor があれば,あらかじめ編集したプログラムをコピーしても良い
(2-5) 物価指数の計算:Rのプログラム例 : price_indexes2.R
(2-6) 参考例:Rのプログラム例 : ta01_004.R で利用するデータ ta01_004.txt を setwd( )
で指定したフォルダにおく.本日の例は,グラフ機能を紹介する意味に留める.
•
•
•
•
•
データの読込み read.table( )
時系列データへの変換 ts( )
ヒストグラム作成 hist( )
散布図作成 plot( )
回帰分析 lm( ) と回帰直線 abline( )
第 (1) 回演習コメント
詳細は「データ解析課題の解説」を参照のこと.
(1) Excel に関する知識
(2) 経済統計に関する知識
内閣府「国民経済計算年報」から,雇用者報酬の四半期データ,民間最終消費支出,および国
民総所得(四半期,原系列,単位 10 億円)である.
(3) yw.csv と cons.csv とでは,時点を表す形式が少し違う.いずれも実際に利用されるデータの
記述である.
2