9章:データの品質 9章のポイント 誤差とは何か 質のよいデータとは? 標本抽出 無作為抽出(ランダムサンプリング) 標本のサイズ→大数の法則 実験(調査)のときの注意 誤差とは何か? 観測値(データ)は真の値と誤差からなる 観測値=真の値+誤差 誤差には「偏り」と「偶然誤差(ばらつき、残差とも言 う)」 の2種類がある。 観測値=真の値+偏り+残差 =真の値 +(平均値ー真の値) +(観測値ー平均値) 誤差とは何か?(2) 偏り: 調査の際の不適切な質問のしかたや測定 機器の狂いなどでシステマティックに真の値 からずれた観測値を生み出す。 偶然誤差 観測の際に偶然に生じる誤差によるばらつ き→標本が大きければだんだん小さくなる 質のよいデータとは? データに偏りがない(正確なデータ) 偶然誤差が少ない(精密なデータ) 標本とは 対象とする集団の性質を調べる際に、集 団全体をすべて実験(調査)することは不 可能なので、ランダムに標本(サンプル) を抽出する。 標本抽出で重要なこと 無作為抽出 母集団の特定の下位集団のみに偏らない ように名簿から無作為に抽出する 標本集団の代表性 標本のサイズ 標本が大きくなればなるほど偶然誤差に よる影響が少なくなる→大数の法則 ただし、実施上の制約から無駄に大きい サンプルにすることは好ましくない。 調査・実験の際の注意 インフォームド・コンセント 質問の仕方、実験の教示で被験者を特定 の回答へ誘導しない →偏りをなくす 10章:クロス集計票と仮説検定 推定 標本から得られた結果に基づいて母集 団の性質はこうであるというように推論 する。 現在の大学生の数学の学力は平均的に どれくらいであろうか? 有権者の中で現在の総理大臣を支持して いる人の割合はどれくらいであろうか? 統計的推論 データ分析を行う目的 データのもつ情報から一定の統計的推論 (判断)を導くことである。 統計的推論には二つのタイプがある。 推定 仮説検定←今日の話の中心はこちら 仮説検定 母集団の性質について仮定したある事柄 (命題)が正しいかどうかを標本について 調べた結果から判定すること。 ⇒偶然誤差を除外しても命題が正しいか どうかを判定する。 現在の高校生の学力は、5年前の高校生の 学力に比較して低いといえるだろうか? 男性と女性で平均初任給が異なるだろう か? 仮説検定 標本抽出 計測 標本 データ 母 集 団 「命題が集団全体にとって正しいだろうか?」 統計処理 仮説検定 情報 命題 考察 「たぶんこういう性質があるといえるだろう」 仮説検定による判断ー事例① あるデパートでは、販売キャンペーンの ために1年間に何万通ものDMを出して いる。 従来の方法では、DMに対する顧客の 反応率は10%(受注の割合)であった。 このデパートの経営者は、ダイレクト・ メールの方法を新しい方法に変えて効 果(反応率)を高めることはできないか と考えている。 事例①つづき そこで、試験的に1000人(標本)に新しい方法 でD Mを発送してみることにした(例えば、イン ターネットを利用する方法など)。 その結果によって新しい方法が効果的である と判断されたならば新しい方法に切りかえるこ とにする。 事例①つづき では、新しい方法を用いて1000人に送っ た結果がどれくらいあったら、新しい方法 は効果的であったと言えるだろうか? ちょっと考えてみよう。 ヒント:従来の方法の反応率は10% 事例①つづき 仮に反応率が10%以下、つまり受注数が1000 人のうち100人以下であるならば、新しい方法 が従来の方法よりも効果的であると思わない だろう。 それでは、受注が102人ならば?反応率は 10.2%であるから10%よりは高いがこの程度 ではまだ新しい方法が効果的であると断言は できない。 では、150人ならば?250人ならばどうだろう か? 事例① つづき 通常、受注が多くなればなるほど新しい方 法が効果的であると認める方向に判断が 傾いていくだろう。 10%という従来の方法では、反応率が 25% (1000人のうち250人の受注)という 数字を出すことは難しい(可能性は少な い)と思うからである。つまり新しい方法の 効果があると判断するだろう。 統計的な仮説検定へ 先ほどの事例では、新しい方法に対する反応率 が従来の方法の10%よりも上に大きく離れるほ ど新しい方法が従来の方法より効果的であると 考えた。 では、具体的にどこを境界にして、すなわち受 注がいくら以上であったら新しい方法が効果的 であるとし、従来の方法から新しい方法へ切り かえるのだろうか? 統計学では、経営者の“直感”ではなく、客観的 な基準、ルールに基づき仮説検定を行う。 仮説設定のルール 仮説は二つ設定する! 棄却したい仮説を帰無仮説とする。先の例では、 「新しい方法と従来の方法には違いがない」。 帰無仮説では、データの差は全て偶然誤差であっ て実質的な差はないと考える。 帰無仮説の反対の仮説(証明したいと思う仮説)を 対立仮説とする。先の例では、「新しい方法は、従 来の方法に比べて効果が高い」。 棄却したい仮説を正しいと仮定した上で、検定を行 う。自分にとって不利な条件にすることがポイント。 これは、背理法の考え方に由来する。 仮説検定の論理:背理法 <背理法の考え方> 命題「りんごは赤い」 赤いりんごをたくさんもって来ても、命題を証明 することはできない。 しかし、「りんごは赤くない」例を一つでも示せれ ば、例えば青い(赤以外の)りんごをもってくれ ば、命題を否定できる。 この場合、帰無仮説は「りんごは赤くない」、対 立仮説は「りんごは赤い」 背理法の考え方 帰無仮説がただしいとき、このようなデー タの特性をもつ標本が現れる確率はどの くらいか? 母集団から100回標本抽出をしたとして、 この標本のような結果がでる確率は非常 に少ない もともとの仮説が間違っていたと結論 帰無仮説を棄却 クロス集計表とモザイク図 アメリカの自動車製造業のマーケティング 戦略立案 教科書166P 年齢、性別、未婚・既婚別と所有する自動車 のタイプについての情報を分析する。 Databookフォルダの中の“Carpool.jmp”とい うサンプルデータをロード “Analyze”から“Fit Y by X”を選択 変数の指定 “Analyze”から“Fit Y by X”で、Yに「自動車のタイプ (Type)」とXに「未既婚の別(Marital Status)」を指定し てみよう。 ※X、Yがともに名 義尺度又は、順序 尺度の場合は、自 動的にモザイク図 とクロス集計表が 表示される。 表示結果 モザイク図 Y軸を自動車のタイプでをX軸を未既婚の 比率で分割し、色分けしている。 クロス集計表(分割表) 二つの変数群の同時分布を表で表したもの。 カテゴリー別のデータの数値的な情報が得ら れる。 より詳しく見るために、%表示をしたい場合は、 “Crosstabs”右側の三角形の印から “Col%”(縦方向)、“Row%”(横方向)、 “Total%”(全体)を選択する。 表示結果の読み取り 既婚と未婚では 選ぶタイプが違う。 既婚の多くは、 ファミリータイプの 車を所有している! クロス集計表で 読むと数値的に 理解できる 仮説検定(1) モザイク図及びクロス集計表によって得られた データを数値的、視覚的に要約して考察した。 その考察を、標本が偏りなく取られたとして、集 団全体(母集団)の状況の推測として利用しても よいだろうか? ある調査で得られた標本のモザイク図及びクロス集計表では、未既婚別で 自動車のタイプが異なることが分かったが、それを全体に当てはめてもよ いのだろうか?単なる標本誤差による偶然の結果の可能性は? 仮説検定(2) 標本抽出 計測 標本 データ 母 集 団 「命題が集団全体にとって正しいだろうか?」 統計処理 仮説検定 情報 命題 考察 「たぶんこういう性質があるといえるだろう」 仮説検定の論理(1) ■命題の正しさを証明するために、2つの仮説を用意する 帰無仮説(null hypothesis):H0棄却したい仮説 命題がまったく正しくないという状態を考える。 例; 「未既婚と車のタイプは関連がまったくない」 対立仮説(alternative hypothesis):H1帰無仮説と反対の仮説 命題の程度は分からないが、帰無仮説が誤りならば、 必ず対立仮説は正しいと考える。 例;「未既婚と車のタイプは関連がある」 ⇒統計学は背理法の考え方を採用している。 仮説検定のステップ ステップ1:命題を立てる ステップ2:帰無仮説、対立仮説を立てる (ステップ3:仮説検定の手法の選択) ステップ4:有意水準を設定 ステップ5:検定を実行(統計統計量、P値を計算) ステップ6:帰無仮説の棄却/棄却しない⇒結論 P値<有意水準:帰無仮説を棄却⇒命題は正しい P値>有意水準:帰無仮説を棄却できない(採択)⇒ 標本数、分析方法などの見なおし⇒命題は正しくな い、再調査の結論 有意水準(α) 有意水準α とは、仮説検定において帰無仮説を棄却す る基準となる確率であり、 危険率とも言う。 有意水準は任意に設定する。通常、5%、1%など を使う(α=0.05、0.01)。 結論をより厳密にしたい場合は1%の値を用いる 例えば、有意水準5%であれば、標本抽出による同じ調 査を同じ母集団から異なる標本で100回繰り返したとき に、誤って帰無仮説を棄却する回数が平均5回はおこる という水準←第一種の誤りの危険率と同じ P値(有意確率) P値は、帰無仮説Hoが真として標本が、その ような母集団から得られる上側(外側)確率 検定統計量(P値に対応する)を計算して、有意水 準αに対応する値と比較←伝統的な方法 あるいは、P値とαを直接比較←最近の主流 有意水準αとp値から帰無仮説を棄却するかど うかを決める P値≦α :(OR 統計検定量> αに対応する値) ⇒帰無仮説を棄却 P値> α: (OR 統計検定量< αに対応する値) ⇒帰無仮説を棄却しない 検定統計量 検定統計量とは 仮説検定の種類により、検定統計量は異なる 母集団に関する統計的仮説を評価するための数値 で、母集団から抽出された標本データから計算され る。P値は、検定統計量と対応関係にある。 クロス集計表の検定(カイ二乗検定)の場合は カイ二乗値(χ 2)が検定統計量 カイ二乗値は、自由度{(横のセル数-1)×(縦のセ ル数-1)}によって決められる 分布(χ 2分布)に従う ことが分かっている。 カイ二乗分布 例:自由度3のカイ二乗分布 p値≦α帰無仮説を棄却なので、αが1%の時 (青)は帰無仮説を棄却する。しかし、5%の 時(緑)は棄却できない。※面積が確率。 α=0.05 P値 α=0.01 検定統計量 カイ二乗値 クロス集計の検定① クロス集計の検定(カイ二乗検定) 質的データにおける二群間の関係性を調べるため の仮説検定の手法 結婚ステイタス 自 動 車 の タ イ プ 既婚 未婚 小計 ファミリー車 119 36 155 スポーツ車 45 55 100 仕事車 32 16 48 小計 196 107 303(総計) クロス集計の検定② 帰無仮説、対立仮説の設定 検定手法の選択 帰無仮説:未既婚の別と自動車のタイプは無関係 (独立)である。 対立仮説:未既婚の別により自動車のタイプに差が ある。 質的データの関係性を見るのでクロス集計の検定 (独立性の検定)を行う 有意水準の設定 5%とする。a=0.05 クロス集計の検定③ 検定統計量の計算と検定の実行 χ 2= Σ(観測値-期待値)2 期待値 • 未既婚別と車のタイプの例では、 χ 2 =26.963 カイ二乗値は、自由度{(横のセル数-1)×(縦のセル数-1)}のカイ 二乗分布に 分布に従うことが分かっている。 ∴この例では、自由度2のカイ二乗分布に従う。 ★最近は、統計ソフトが自動的にP値を計算してくれるので数表を使う 必要はなくなりつつある。 JMP-INも計算してくれるので、手計算する必要はない クロス集計の検定④ 帰無仮説の棄却/採択の判断 カイ二乗分布表で自由度2、有意水準5%(a=0.05)に対応 する値をみると、5.9914である。 5.9914<26.963なので帰無仮説は棄却できる。 JMP-INの結果をみると、P値が<0.0001と記載されており、カイ二乗 分布の数表を見て検定統計量を比較する必要がないことが分かる。 つまり、P値は<0.0001なので、有意水準が5%(a=0.05)であっても、1% (0.001)でもp値<αになり帰無仮説を棄却できることが分かる。 クロス集計の検定⑤ Carpoll.jmpのデータの表示結果をチェック PearsonのProb>ChiSq を見る。統計量から計算されたP値 Χ二乗値 未既婚と車種は統計的に 関係がある P値が.0001以下で あることが分かる。 つまり、1万に1回も 無関係であるような 標本は得られない。 有意水準が5%でも1%で も帰無仮説は棄却される 余裕のある人は①計算式 カイ二乗値の手計算をしてみよう χ 2= Σ(観測値-期待値)2 期待値 期待値 カイ二乗値 一般に、変数群間に関連がある場合(帰無仮説が棄却できる)は、カイ二乗値は大きな値になる。 余裕のある人は③表の見方 B1 A1 A2 : Ai : Ak 合計 B2 ... Bj O1j O2j : Oij : Okj n・j Oi1 Oi2 ... n・1 n・2 ... 観測値⇒ 期待値⇒ × ÷ ... Bm 合計 ... Oim ... n・m n1・ n2・ : ni・ : nk・ n 余裕のある人は②計算例 式はややこしそうだったが、実は簡単 例えば、男性と女性と免許の有無に差があ るかどうかを見てみよう。 カイ二乗値={4-(5*6/13)}2/ (5*6/13) +{2-(8*6/13)}2 / (8*6/13)+{1-(5*7/13)}2 / (5*7/13) +{6-(8*7/13)}2 / (8*7/13)=37.452 あり なし 合計 4 2 6 男子 ※自由度1のカイ二乗分布に従う。 この場合、有意水準5%で棄却される。 女子 1 6 7 5 8 13 合計 検定結果からの結論の導き方 帰無仮説が棄却できる(p値≦α) 帰無仮説が棄却できない(p値>α) 積極的に命題(対立仮説)の正当性を主張できる 対立仮説が誤っているとは必ずしも言えない 標本の大きさやデータの品質(誤差のばらつきや偏 り)に依存 標本を大きくしたり、調査、実験方法の改良の必要 がある。 つまり、今あるデータだけでは何も言えない 検定結果と命題が真であるかは別 知見にあった(一般常識に照らして)結論を導く 検定における2種類の誤り① 第1種の誤り 帰無仮説が正しいのに、棄却してしまう可能性 有意水準αは第一種の誤りが起こる可能性と同じ。 第2種の誤り 帰無仮説が正しくないのに、棄却しない(採択)する 可能性。βで表されるときもある。 母集団の平均や分散、標本数が分かっていないと 第2種の誤りをおこす確率を計算することはなかな かできない。⇒深い統計知識が必要。 そのため、容易に決定できる第一種の誤りを基準 に検定できる仮説を設定している。 検定における2種類の誤り② 帰無仮説を棄 帰無仮説を棄 却する 却しない 帰無仮説が 真である 第1種の誤り (α) 正しい判断 帰無仮説が 偽りである 正しい判断 第2種の誤り (β)
© Copyright 2024 ExpyDoc