量的表現 Quantitation

量的表現 Quantitation
分布 Distribution
• 1峰性分布
• 2峰性分布
2次元分布
有限範囲の2次元分布
1次元分布 1-dimensional dist.
1峰性分布 Unimodal dist.
• 平均・分散 Mean/Variance
– モーメント Moments
R2-1.R
• モーメントの計算
– How to calculate moments
• 値、値の増加率、増加率の増加率
– Value, Increasing rate, Increasing rate of increasing
rate
– 微分・積分 Diffenrential/Integration
– 確率分布・累積確率分布 Probability
distribution/Cumulative probability distribution
1峰性分布を作る
Make unimodal distribution
•
•
•
•
N<-100
x<-rnorm(N)
hist(x)
plot(sort(x))
• x<-rnorm(N,mean=1,sd=1)
• hist(x)
• plot(sort(x))
1次元2峰性分布
Two-dimensional di-modal dist.
•
•
•
•
•
•
•
N1<-100;N2<-50
m1<-0;m2<-10;sd1<-1;sd2<-2
x1<-rnorm(N1,mean=m1,sd=sd1)
x2<-rnorm(N2,mean=m2,sd=sd2)
x<-c(x1,x2)
hist(x)
plot(sort(x))
2次元1峰性分布
Two-dimensional unimodal dist.
•
•
•
•
N<-1000
x1<-rnorm(N)
x2<-rnorm(N)
plot(x1,x2)
2次元1峰性分布
Two-dimensional unimodal dist.
• 軸ごとに平均をかえてみる Change mean of
x1 and x2
• 軸ごとに分散をかえてみる Change var/sd of
x1 and x2
• N<-1000
• x1<-rnorm(N,mean=0,sd=1)
• x2<-rnorm(N,mean=10,sd=4)
• xlim<-ylim<-c(min(x1,x2),max(x1,x2))
• plot(x1,x2,xlim=xlim,ylim=ylim)
多次元1峰性分布
Poly-dimensional unimodal dist.
•
•
•
•
•
•
•
•
•
•
N<-500
m1<-0;m2<-10;m3<-30;
sd1<-1;sd2<-4;sd3<-10
x1<-rnorm(N,mean=m1,sd=sd1)
x2<-rnorm(N,mean=m2,sd=sd2)
x3<-rnorm(N,mean=m3,sd=sd3)
plot(as.data.frame(cbind(x1,x2,x3)))
library(rgl)
plot3d(x1,x2,x3)
軸の値に注意 Note values on axes displayed
多次元多峰性分布
Poly-dimensional polymodal dist.
•
•
•
•
•
•
N<-1000
m1<-0;m2<-10;m3<-30;
sd1<-1;sd2<-4;sd3<-10
x1<-rnorm(N,mean=m1,sd=sd1)
x2<-rnorm(N,mean=m2,sd=sd2)
x3<-rnorm(N,mean=m3,sd=sd3)
•
•
•
•
•
•
N<-2000
m1<-20;m2<-20;m3<-20;
sd1<-1;sd2<-1;sd3<-1
y1<-rnorm(N,mean=m1,sd=sd1)
y2<-rnorm(N,mean=m2,sd=sd2)
y3<-rnorm(N,mean=m3,sd=sd3)
•
•
•
•
•
•
N<-500
m1<-10;m2<-50;m3<-20;
sd1<-5;sd2<-4;sd3<-1
z1<-rnorm(N,mean=m1,sd=sd1)
z2<-rnorm(N,mean=m2,sd=sd2)
z3<-rnorm(N,mean=m3,sd=sd3)
•
•
•
•
•
w1<-c(x1,y1,z1)
w2<-c(x2,y2,z2)
w3<-c(x3,y3,z3)
library(rgl)
plot3d(w1,w2,w3)
データプロットを眺める最適視点を
探す
Find “best” spot to look at the data
plot
亜集団の混合
Mixture of subpopulations
R7-5.R
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
#偏った集団構成(100人規模の亜集団4つと10人規模の亜集団を20個)で
#100項目のデータを作成
Nm<-100 #項目数
# 亜集団別の人数発生(100人くらいの4亜集団と20人くらいの10亜集団)
Ns<-c(rpois(4,100),rpois(20,10))
Npop<-length(Ns) #亜集団数
M<-NULL #全データを納める行列
#亜集団別に平均を振ってシミュレーション
R7-5.R
for(j in 1:Npop){
tmpM<-matrix(rep(0,Nm*Ns[j]),ncol=Nm)
for(i in 1:Nm){ # 項目ごとのループ
af<-rnorm(1) # 項目の亜群期待値
tmpM[,i]<-rnorm(Ns[j],af) # 亜集団別のデータ
}
# データを標準化
wholemean<-mean(M)
#全データ行列に格納
M<-M-wholemean # 全平均が0
M<-rbind(M,tmpM)
になるように
}
mu<-apply(M,2,mean) # 列平均
M<-t(t(M)-mu) # 列平均が0にな
るように
# 固有値分解前後をimage()プロット
image(1:sum(Ns),1:Nm,M,xlab="サンプル(大
集団→小集団)",ylab="項目")
# 固有値分解
svdout<-svd(M)
M2<-svdout$u%*%diag(svdout$d) # 分解
後データ行列
par(mfcol=c(1,2))
# 固有値分解前後をimage()プロット
image(1:sum(Ns),1:Nm,M,xlab="サンプル
(大集団→小集団)",ylab="項目")
image(1:sum(Ns),1:Nm,M2,xlab="サンプル
(大集団→小集団)",
ylab="PCA後eigen項目")
亜集団の混合
Mixture of subpopulations
R7-5.R
適切な軸
Appropriate axes
データを読む
“Read” data
• 記述する・説明する Description, Explanation
• 少ない変数で説明する Describe with a few
variables
• 残りは「ランダム」と考える The rest is “at
random”
SSw=SSb+SSi
分散分析 ANOVA
SSw=SSb+SSi
• SSbが大きければ、「群の違いが大きい」
– When SSb is larger, “difference among groups is
larger”
• サンプル数が異なるとき
– When No. samples is different
• サンプル数について一般化
– Generalization for No. samples
– 自由度 degrees of freedom
固有値分解・主成分分析
Eigenvalue decomposition・
Principal Component Analysis
(PCA)
R7-5.R
• 正規直交基底
Orthonormal base
• どうして「直交」 Why
orthogonal?
• 分散が基底成分の分散に
分解できるから Because
variance is decomposed
into component variances
of directions