第2章 1つの変数の記述統計

第2章 1つの変数の記述統計
H411007
H411016
石田晃基
牛山悠資
変数の種類
質量変数
データを構成、分類する変数のこと。
 二値変数
2つの選択肢の中から選ぶ変数のこと。
 量的変数
数値の大小を示す変数のこと。

本章で出てくる関数-(1)
c
データの値を結合させる
 table
度数分布(表)を作成する
 hist
ヒストグラムを描く
 sum
合計する

本章で出てくる関数-(2)
length
データの個数を求める
 mean
平均を求める
 median
中央値を求める
 sqrt
平方根を求める

本章で出てくる関数-(3)
var
不偏分散を求める
 sd
標準偏差を求める
 abs
絶対値を求める
 max,min
最大値、最小値を求める

Rによる視覚的効果
Rによる平均
sumは合計を示す
 lengthはaの個数を示す
 meanはそのaの平均のこと
 medianは中央値を示す
(tableにより中央値の
確認ができる)

分散、標準偏差とは
𝟐
𝟐
𝟐
(データ𝟏 − 平均) +(データ𝟐 − 平均) + … +(データ𝒏 − 平均)
𝒏
各データの値から平均を
引いたもの(平均からの
偏差)
 平均からの偏差を2乗し、
データ数で割ったものが
分散になります
 sqrtにより分散の
平方根を求めることにより、
標準偏差が求まる
 標準偏差= 分散

不偏分散、標準分散とは




varとは
不偏分散と呼ばれる分散を求める
関数のこと
不偏分散は偏差の2乗の合計を
データの個数で割ったもの
sdとは
不偏分散の平方根を求める関数のこと
不偏分散から標準偏差を求めるため
sd関数で求めたものを2乗した上で
標準偏差= 不偏分散を行う
平均偏差





absとは
絶対値をとる求める関数のこと
平均からの偏差の絶対値の平均
が平均偏差となる
maxとは
最大値を求める関数のこと
minとは
最小値を求める関数のこと
最大値から最小値を引いたもの
を範囲(レンジ)となる
標準化
データの値ー平均
 z得点=
標準偏差
 上記の計算を行うと
平均が0、標準偏差が1となり
ます。
このように変換された得点を標
準得点
といい、変換することを標準化
といいます。
z得点を求めるため平均と
標準偏差を求めます。
 更にz得点の平均と標準偏差を
求めることで、確認することが
できます。
偏差値

偏差値とは
平均50、標準偏差10に
なるように標準化した
標準得点のこと。
偏差値=z得点*10+50
よって上記の式より偏差値を
求めることができます