選挙と接戦度

2014/10/31
変数の分類
データファイルの構成要素:ケース(⾏)と変数(列)
変数の尺度
名義尺度
順序尺度
計量政治分析
間隔尺度
第4回 変数の尺度と記述統計(2):選挙と接戦度
⽐尺度
尺度と情報量の関係
練習問題:次の変数の尺度を答えなさい
 変数の分布を数値的に要約する(代表値)
⽐尺度
 犯罪の検挙数
 表は50点満点の⼩テストを7⼈の学⽣が受けた結果である
 地域: 北海道 東北 関東 甲信越 北陸 中部 近畿
中国 四国 九州
名義尺度
名前
A
B
C
D
E
F
G
得点
5
3
1
9
7
42
3
 この表の代表値を考えてみよう
間隔尺度
 気温
記述統計量
順序尺度
 意⾒: 反対 やや反対 やや賛成 賛成
データの中⼼を⽰す代表値
データの中⼼を⽰す代表値
 平均:下の表の平均はいくらだろうか?
名前
A
B
C
D
E
F
G
得点
5
3
1
9
7
42
3
 中央値:表の中央値はいくらか?
 最頻値:表の最頻値はいくらか?
いくつ存在する
のか?
データの中に直
接現れるか?
平均
1個
中央値
最頻値
1個
0の時もあれば1
個以上もある
常に表れるとは限 データの数が奇数 最頻値がゼロでな
らない
なら必ず表れる
ければ必ず表れる
1
2014/10/31
データの散らばりを⽰す代表値
データの散らばりを⽰す代表値
 範囲:下の表の範囲を計算しなさい
 偏差:下の表の偏差を計算してみよう
名前
A
B
C
D
E
F
G
A
B
C
D
E
F
G
得点
名前
5
3
1
9
7
42
3
得点
5
3
1
9
7
42
3
 では次の表の範囲を計算しなさい
名前
H
I
J
K
L
M
N
得点
9
9
9
10
11
11
11
 範囲の弱点はなんだろうか?
 偏差平⽅和という⼯夫(計算しよう)
 (標本)分散:表の標本分散を計算してみよう
 標本分散ではなぜnではなく、n-1で割るのだろうか?
 分散では単位が ⼆乗 となっているため、解釈に困る。
 そこで
平⽅根
をとることにより、解釈しやすくなる。
データの散らばりを⽰す代表値
2009年総選挙を考える
 平均値と標準偏差の性質を考える
 2009年総選挙の意味
データセット1
1
2
3
4
データセット2
11
12
13
14
データセット3
10
20
30
40
 標準偏差の特徴:チェビシェフの不等式
 政権交代が実現し、⺠主党中⼼の政府が成⽴した。
 2005年選挙だと⾃⺠は219⼩選挙区で勝利したが、2009年選挙
の際は64⼩選挙区でしか勝利できなかった。
 衆議院選挙制度の概要
 ⼩選挙区:選挙区数は 300 投票は 候補者 に⾏う
 ⽐例区:ブロック数 11 で定員 180 ⼈
 平均と標準偏差の情報が与えられるとデータ全体の分布を知
ることができる
投票は 政党 に⾏う
 重複⽴候補と惜敗率
2009年総選挙を考える
2009年総選挙を考える
 接戦の定義
 データセットには⾃⺠党候補が⺠主党候補に競り勝った45区
の得票数が含まれている。まず45区の候補者数の平均値を求
めてみよう。
 接戦度=(1位の得票ー2位の得票)÷有効投票数
 1位と2位の得票差が⼩さければ、接戦度はゼロに近づく
 B47; =AVERAGE(B2:B46)
 次に中央値と最頻値を求めてみよう。
 B48; =MEDIAN(B2:B46)
 1位の候補が有効投票数のほとんどを獲得するような圧勝の
場合、接戦度の数値は 1 に近づく
 B49; =MODE.SNGL(B2:B46)
2
2014/10/31
2009年総選挙を考える
2009年総選挙を考える
 デュベルジェの法則によると、⼩選挙区では有⼒な2⼈の候
補者の争いに収斂する。
 接戦度についてもう少し考えてみる
 候補者が⾃⺠系と⺠主系の2⼈だと考えよう。
 接戦度の定義
 接戦度=(1位の得票ー2位の得票)÷有効投票数
 接戦度の平均値とその解釈
 接戦度の平均値をJ47に出⼒せよ。
 2005年の接戦度の平均は0.17であった。どのように解釈すれば
よいか?
2009年総選挙を考える
 ⾃⺠系候補の相対得票率をVLで表す。
 ⺠主系候補の相対得票率をVdで表す。
 VL+Vd=1, VL-Vd=0.09であるならば、VLとVdはそれぞれい
くらになるか?
 VL+Vd=1, VL-Vd=0.17であるならば、VLとVdはそれぞれい
くらになるだろうか?
宿題
 接戦度の分散(標本分散)と標準偏差を計算してみよう。
 J49; =STDEV.S(J2:J46)
 (1)接戦度の範囲を調べ、最⼩のケースと最⼤のケースで
当選者の得票率(=得票数÷有効投票数)と次点候補の得票率を
計算し、棒グラフで⽰せ。
 2003年選挙の接戦度の標準偏差は0.126, 2005年度は0.103で
あった。
 (2)次点候補と3位候補の得票差を有効投票数で除した指
標を計算し、その平均と標準偏差を求めよ。
 2009年度では接戦度の散らばりが⼩さくなっている。このこ
とはすなわち、どの⾃⺠党候補も同じように厳しい戦いを強
いられたことを意味する。
 (3)デュベルジェの法則とは何か調べよ。接戦度と(2)の指
標を⾒⽐べた上で、⾔えることは何だろうか。
 J48; =VAR.S(J2:J46)
3