2014/10/31 変数の分類 データファイルの構成要素:ケース(⾏)と変数(列) 変数の尺度 名義尺度 順序尺度 計量政治分析 間隔尺度 第4回 変数の尺度と記述統計(2):選挙と接戦度 ⽐尺度 尺度と情報量の関係 練習問題:次の変数の尺度を答えなさい 変数の分布を数値的に要約する(代表値) ⽐尺度 犯罪の検挙数 表は50点満点の⼩テストを7⼈の学⽣が受けた結果である 地域: 北海道 東北 関東 甲信越 北陸 中部 近畿 中国 四国 九州 名義尺度 名前 A B C D E F G 得点 5 3 1 9 7 42 3 この表の代表値を考えてみよう 間隔尺度 気温 記述統計量 順序尺度 意⾒: 反対 やや反対 やや賛成 賛成 データの中⼼を⽰す代表値 データの中⼼を⽰す代表値 平均:下の表の平均はいくらだろうか? 名前 A B C D E F G 得点 5 3 1 9 7 42 3 中央値:表の中央値はいくらか? 最頻値:表の最頻値はいくらか? いくつ存在する のか? データの中に直 接現れるか? 平均 1個 中央値 最頻値 1個 0の時もあれば1 個以上もある 常に表れるとは限 データの数が奇数 最頻値がゼロでな らない なら必ず表れる ければ必ず表れる 1 2014/10/31 データの散らばりを⽰す代表値 データの散らばりを⽰す代表値 範囲:下の表の範囲を計算しなさい 偏差:下の表の偏差を計算してみよう 名前 A B C D E F G A B C D E F G 得点 名前 5 3 1 9 7 42 3 得点 5 3 1 9 7 42 3 では次の表の範囲を計算しなさい 名前 H I J K L M N 得点 9 9 9 10 11 11 11 範囲の弱点はなんだろうか? 偏差平⽅和という⼯夫(計算しよう) (標本)分散:表の標本分散を計算してみよう 標本分散ではなぜnではなく、n-1で割るのだろうか? 分散では単位が ⼆乗 となっているため、解釈に困る。 そこで 平⽅根 をとることにより、解釈しやすくなる。 データの散らばりを⽰す代表値 2009年総選挙を考える 平均値と標準偏差の性質を考える 2009年総選挙の意味 データセット1 1 2 3 4 データセット2 11 12 13 14 データセット3 10 20 30 40 標準偏差の特徴:チェビシェフの不等式 政権交代が実現し、⺠主党中⼼の政府が成⽴した。 2005年選挙だと⾃⺠は219⼩選挙区で勝利したが、2009年選挙 の際は64⼩選挙区でしか勝利できなかった。 衆議院選挙制度の概要 ⼩選挙区:選挙区数は 300 投票は 候補者 に⾏う ⽐例区:ブロック数 11 で定員 180 ⼈ 平均と標準偏差の情報が与えられるとデータ全体の分布を知 ることができる 投票は 政党 に⾏う 重複⽴候補と惜敗率 2009年総選挙を考える 2009年総選挙を考える 接戦の定義 データセットには⾃⺠党候補が⺠主党候補に競り勝った45区 の得票数が含まれている。まず45区の候補者数の平均値を求 めてみよう。 接戦度=(1位の得票ー2位の得票)÷有効投票数 1位と2位の得票差が⼩さければ、接戦度はゼロに近づく B47; =AVERAGE(B2:B46) 次に中央値と最頻値を求めてみよう。 B48; =MEDIAN(B2:B46) 1位の候補が有効投票数のほとんどを獲得するような圧勝の 場合、接戦度の数値は 1 に近づく B49; =MODE.SNGL(B2:B46) 2 2014/10/31 2009年総選挙を考える 2009年総選挙を考える デュベルジェの法則によると、⼩選挙区では有⼒な2⼈の候 補者の争いに収斂する。 接戦度についてもう少し考えてみる 候補者が⾃⺠系と⺠主系の2⼈だと考えよう。 接戦度の定義 接戦度=(1位の得票ー2位の得票)÷有効投票数 接戦度の平均値とその解釈 接戦度の平均値をJ47に出⼒せよ。 2005年の接戦度の平均は0.17であった。どのように解釈すれば よいか? 2009年総選挙を考える ⾃⺠系候補の相対得票率をVLで表す。 ⺠主系候補の相対得票率をVdで表す。 VL+Vd=1, VL-Vd=0.09であるならば、VLとVdはそれぞれい くらになるか? VL+Vd=1, VL-Vd=0.17であるならば、VLとVdはそれぞれい くらになるだろうか? 宿題 接戦度の分散(標本分散)と標準偏差を計算してみよう。 J49; =STDEV.S(J2:J46) (1)接戦度の範囲を調べ、最⼩のケースと最⼤のケースで 当選者の得票率(=得票数÷有効投票数)と次点候補の得票率を 計算し、棒グラフで⽰せ。 2003年選挙の接戦度の標準偏差は0.126, 2005年度は0.103で あった。 (2)次点候補と3位候補の得票差を有効投票数で除した指 標を計算し、その平均と標準偏差を求めよ。 2009年度では接戦度の散らばりが⼩さくなっている。このこ とはすなわち、どの⾃⺠党候補も同じように厳しい戦いを強 いられたことを意味する。 (3)デュベルジェの法則とは何か調べよ。接戦度と(2)の指 標を⾒⽐べた上で、⾔えることは何だろうか。 J48; =VAR.S(J2:J46) 3
© Copyright 2024 ExpyDoc