PDF file (50929 Byte)

1. はじめに
1
2014 年 11 月 18 日
各種平均が満たすべき条件
新潟工科大学 情報電子工学科 竹野茂治
1
はじめに
確率・統計では、2 次元データ (xk , yk ) で相関係数や回帰直線などを計算する
のに、次のような平均値を使用することがある。
n
n
n
n
1X
1X
1X
1X
2
2
2
xk , y¯ =
yk , x =
xk , y =
yk2 ,
x¯ =
n k=1
n k=1
n k=1
n k=1
n
1X
xk yk
xy =
n k=1
(1)
分散 s2x , s2y 、共分散 sxy 、相関係数 r、回帰直線などは、元のデータの個々の
値やデータの個数 n を知らなくても、上記 (1) の値だけでいずれも求めるこ
とができる。
s2x =
s2y =
n
1X
x) 2
(xk − x¯)2 = x2 − (¯
n k=1
n
1X
(yk − y¯)2 = y 2 − (¯
y )2
n k=1
n
1X
(xk − x¯)(yk − y¯) = xy − x¯ y¯
n k=1
sxy
xy − x¯ y¯
q
r =
=q
sx sy
x2 − (¯
x)2 y 2 − (¯
y )2
sxy =
(2)
(3)
(4)
(5)
なお、(2) から (5) の式は、いずれも最初の式が定義であり、次の式がそれを
展開して (1) の値で計算できる形に変形したものである。
これにより、例えば、
「x
¯ = 3, y¯ = 4, x2 = 21, y 2 = 19, xy = 16 のとき、相関
係数 r を求めよ」のような問題を作ることができる。
ただ、その場合例えば「x
¯ = 3, x2 = 5」のような値でもいいかというと、そ
れはだめで、実際のデータではこのような組は起こりえない。
2. シュワルツの不等式
2
そこで本稿では、(1) の 5 種類の平均に対して成り立つ関係を調べ、どのよ
うな値であればそれらが実際のデータの平均になりうるか、という条件を求
めることを目標とする。そういう条件が得られれば、それを満たすような平
均は心配せずに問題として出せることになる。
なお本稿は、学生にはあまり意味はなく、試験問題、演習問題を作成する側
に関係する内容だが、私自身の備忘録もかねてまとめておくことにする。
2
シュワルツの不等式
今回の評価では、次のシュワルツの不等式を利用する。
定理 1.
実数 xk , yk (k = 1, 2, . . . n) に対して、次の不等式が成り立つ。
n
X
xk yk
k=1
!2
≤
n
X
k=1
x2k
!
n
X
k=1
yk2
!
(6)
等号が成立するのは、x1 : y1 = x2 : y2 = · · · = xn : yn の場合である。
−
−
−
−
n 次元ベクトル →
x = (x1 , x2 , . . . , xn ), →
y = (y1 , y2 , . . . , yn ) の内積 →
x ・→
y 、お
→
−
よび長さ | x | は
n
X
→
−
−
x ・→
y =
xk yk = x 1 y1 + x 2 y2 + · · · + x n yn ,
k=1
−
|→
x| =
v
u n
q
uX
t
x2k = x21 + x22 + · · · + x2n
k=1
と定義されるので、これを用いれば不等式 (6) は簡単に
−
−
−
−
(→
x ・→
y ) 2 ≤ |→
x | 2 |→
y |2
−
−
−
−
(または |→
x ・→
y | ≤ |→
x ||→
y |)
−
−
と書くことができるし、等号が成立する条件も、→
x // →
y と書き表すことが
できる。
3. 平均が満たすべき条件
3
3
平均が満たすべき条件
本節では、各平均値に以下のように名前をつけ、それらが満たすべき条件を
見ていくことにする:
x¯ = X1 , y¯ = Y1 , x2 = X2 , y 2 = Y2 , xy = Z
(7)
まず、(2), (3) の定義よりこれらは非負の値なので、
x2 ≥ (¯
x) 2 ,
y 2 ≥ (¯
y )2 ,
すなわち
X2 ≥ X12 ,
Y2 ≥ Y12
(8)
の関係が成り立つ。これらは、以下のようにシュワルツの不等式から導くこ
ともできる:
(¯
x)
2
1
x1 + x 2 + · · · + x n 2
= 2 (x1 + x2 + · · · + xn )2
=
n
n
1 →
−
−
(−
x ・→
n ) 2 (→
n = (1, 1, . . . , 1))
=
n2
≤
1 →
1 − 2
1
−
|−
x | 2 |→
n | 2 = 2 |→
x | n = (x21 + x22 + · · · + x2n ) = x2
2
n
n
n
同じように、シュワルツの不等式より、
1 − →
1
(x1 y1 + x2 y2 + · · · + xn yn )2 = 2 (→
x ・−
y )2
2
n
n
1
1 →
−
|−
x | 2 |→
y |2 = 2 (x21 + · · · + x2n )(y12 + · · · + yn2 ) = x2 y 2
≤
2
n
n
(xy)2 =
となるので、
Z 2 ≤ X 2 Y2
の関係が成り立つことがわかる。
(9)
4. 条件を満たすデータの存在
4
さらに、(4) の sxy の定義式にシュワルツの不等式を用いると、
1
{(x1 − x¯)(y1 − y¯) + · · · + (xn − x¯)(yn − y¯)}2
n2
1 →
1 →
2
−
→
−
→
−
→
−
−
−
−
=
{(
x
−
x
¯
n
)
・
(
y
−
y
¯
n
)}
≤
|−
x − x¯→
n | 2 |→
y − y¯→
n |2
2
n2
n
!
!
n
n
X
1 X
2
2
(10)
(yk − y¯) = s2x s2y
(xk − x¯)
=
n2 k=1
k=1
(sxy )2 =
となるので、これに (2), (3), (4) の右辺の式を代入して平均の式に置き換え
ると
(xy − x¯ y¯)2 ≤ {x2 − (¯
x)2 }{y 2 − (¯
y )2 }
となり、よって
(Z − X1 Y1 )2 ≤ (X2 − X12 )(Y2 − Y12 )
(11)
の関係が成り立つことになる。
なお、この (10) の関係は、相関係数 r が −1 ≤ r ≤ 1 を満たすことを意味し
ている。
4
条件を満たすデータの存在
前節で、実際のデータに対しては X1 , X2 , Y1 , Y2 , Z が不等式 (8), (9), (11) を
満たすことを見たが、逆に X1 , X2 , Y1 , Y2 , Z がこれらの不等式を満たす実数
であるとき、それらが (7) のような平均値になるようなデータ (xk , yk ) が存
在するかどうかを考えてみることにする。
まず、X2 = 0 の場合は、(8) より X1 = 0、(9) より Z = 0 となるので、(11)
の両辺も 0 であり、よって、この場合は n = 2 として、x1 = x2 = 0 とすれ
ば X1 , X2 は OK で、y1 , y2 は
y1 + y2 = 2Y1 ,
y12 + y22 = 2Y2
を満たさなければならないが、
y1 y2 =
4Y 2 − 2Y2
(y1 + y2 )2 − (y12 + y22 )
= 1
= 2Y12 − Y2
2
2
4. 条件を満たすデータの存在
5
となるから、y1 , y2 は 2 次方程式
λ2 − 2Y1 λ + 2Y12 − Y2 = 0
の 2 解として求まる。実際、この 2 次方程式の判別式 D は、(8) より
D
= Y12 − (2Y12 − Y2 ) = Y2 − Y12 ≥ 0
4
となるので実数解を持つ。
Y2 = 0 の場合も同様なので、以後、X2 > 0, Y2 > 0 の場合を考える。
今、新たに
ˆ 1 = √X1 ,
X
X2
Y1
Yˆ1 = √ ,
Y2
Z
Zˆ = √
X2 Y2
と書くこととすると、条件 (8), (9), (11) は、
ˆ 1 | ≤ 1, |Yˆ1 | ≤ 1, |Z|
ˆ ≤1
|X
ˆ 1 Yˆ1 )2 ≤ {1 − (X
ˆ 1 )2 }{1 − (Yˆ1 )2 }
(Zˆ − X
(12)
(13)
となる。
(7) を満たすデータに対しても新たに記号を導入し、
→
−
x
→
−
,
xˆ = √
nX2
→
−
y
→
−
yˆ = √
,
nY2
→
−
n
→
−
n
ˆ =√
n
とすると、
→
−
−
x ・→
n
x1 + x 2 + · · · + x n
x¯
→
− →
−
√
√
xˆ ・ n
ˆ =
=
=√
n X2
n X2
X2
→
−
→
−
y ・n
y1 + y 2 + · · · + y n
y¯
→
− →
−
√
√
yˆ ・ n
ˆ =
=
=√
n Y2
n Y2
Y2
より x
¯ = X1 , y¯ = Y1 は
→
− →
−
ˆ1,
xˆ ・ n
ˆ =X
→
− →
−
yˆ ・ n
ˆ = Yˆ1
(14)
4. 条件を満たすデータの存在
6
と書き換えられる。また、
−
|→
x |2
x2
→
−
| xˆ |2 =
=
,
nX2
X2
−
|→
y |2
y2
→
−
| yˆ |2 =
=
nY2
Y2
より、x2 = X2 , y 2 = Y2 は、
→
−
| xˆ | = 1,
→
−
| yˆ | = 1
(15)
に置き換わる。そして、
→
−
−
x ・→
y
xy
→
− →
−
xˆ ・ yˆ = √
=√
n X2 Y 2
X2 Y 2
より、xy = Z は、
→
− →
−
xˆ ・ yˆ = Zˆ
(16)
に置き換わる。
ˆ 1 , Yˆ1 , Zˆ に対して、(14), (15), (16) を満たすベ
つまり、(12), (13) を満たす X
→
− →
−
クトル x
ˆ , yˆ が存在することを示せばよいことになる。
→
− →
−
実際これは、n = 3 の 3 次元で解を求めることができる。(15) より x
ˆ , yˆ は
→
−
単位ベクトルで、 n
ˆ も単位ベクトルであることに注意する。
→
−
→
−
→
−
→
−
→
−
→
−
今、 x
ˆ と n
ˆ のなす角を α、 yˆ と n
ˆ のなす角を β 、 xˆ と yˆ のなす角を γ
とすると、(14), (16) は
ˆ1,
cos α = X
cos β = Yˆ1 ,
cos γ = Z10
(17)
を意味する。
(12) より、(17) を満たす α, β, γ は一意に存在する。(17) を (13) に代入す
ると、
| cos γ − cos α cos β| ≤
√
q
1 − cos2 α 1 − cos2 β = sin α sin β
4. 条件を満たすデータの存在
7
となり、これは加法定理により
cos(α + β) ≤ cos γ ≤ cos(α − β)
(18)
と書き換えられる。
すなわち、(17) により一意に決定する [0, π] の範囲の角 α, β, γ が (18) を満
→
− →
−
たすとき、それらがなす角となるような単位ベクトル x
ˆ , yˆ が存在すること
を確認することが目標となる。
→
−
→
−
xˆ と n
ˆ はなす角が α であるが、そのようなベクトル全体の終点は単位球上
→
−
で一つの円 C1 を描く (図 1)。同様に n
ˆ とのなす角が β であるようなベク
トルの終点も単位球上の円 C2 となる。よって、それらの円 C1 , C2 上にそれ
→
−
n
ˆ
PSfrag replacements
C2
α
C1
→
−
yˆ
β
γ
→
−
xˆ
図 1: 円 C1 , C2
→
− →
−
ぞれ終点があるベクトル x
ˆ , yˆ のなす角が、(18) を満たす γ となりうるか
を考えればよいことになる。
今、α ≥ β と仮定する (α < β の場合は、単に Xi と Yi を入れ換えて考えれ
ばよい)。不等式 (18) は、α + β ≤ π の場合は
α+β ≥γ ≥α−β
(19)
を意味し、α + β > π の場合は
2π − (α + β) ≥ γ ≥ α − β
(20)
5. 最後に
8
を意味することに注意する。
→
−
→
−
まず、α + β ≤ π の場合、図 1 からもわかるが、 x
ˆ と yˆ とのなす角が最小
→
− →
− →
−
となるのは x
ˆ , yˆ , n
ˆ が同一平面にあるときで、その角は (α − β)、なす角
が最大となるのもやはりこれらのベクトルが同一平面にあるときで、その角
は (α + β) となる。それ以外の場合は、その 2 つのベクトルのなす角はこの
最小角と最大角の間を連続的に変化するので、結局 (19) を満たすすべての γ
→
− →
−
に対し、それがなす角となるような x
ˆ , yˆ の配置が存在することがわかる。
α + β > π の場合も、図 2 より、この場合のなす角の最小値は (α − β)、最大
→
− →
−
値は 2π − (α + β) であることがわかり、 x
ˆ , yˆ のなす角はその間を連続的に
変化するので、(20) を満たすすべての γ に対し、それがなす角となるような
→
− →
−
xˆ , yˆ の配置が必ず存在する。
→
−
n
ˆ
PSfrag replacements
C2
β
α
α−β
γ
2π − (α + β)
C1
図 2: α + β > π の場合
ˆ 1 , Yˆ1 , Zˆ に対して、(14), (15), (16) を満たすベ
これで、(12), (13) を満たす X
→
− →
−
クトル x
ˆ , yˆ が存在することを示すことができたことになり、よって、(8),
(9), (11) を満たす X1 , X2 , Y1 , Y2 , Z に対し、それらが (7) のような平均値と
なるようなデータ (xk , yk ) が実際に存在することが示されたことになる。
5
最後に
本稿では、2 次元データの統計的平均の値が、実際のデータとして起こりう
るための条件を考察した。最後は、計算というよりも幾何学的な存在証明に
5. 最後に
9
なったので、むしろわかりにくいかもしれないが、存在することの保証は正
しく得られていると思う。
これで、不等式 (8), (9), (11) を満たしているかだけ確認すれば良いことがわ
かったので、今後は安心して「適当な」値を出せることになる。