政策データ分析 EXCEL 講習会 2014年5月1日,2日 OSIPP NWC ① 11:00~12:00 ② 13:00~14:00 1 今日の流れ 1. Excelの基本(5分) 2. 統計・グラフ(35分) 記述統計 ヒストグラム 散布図 相関係数 3. 回帰分析(時間があれば) 2 1. Excelの基本(1) ①ワークシート: Excelを起動すると最初に出る方眼紙のようなシート. ②セル この表のマス目.セルは行の数字と列のアルファベットによって位置が 表される.(ex. 「B2のセル」) 3 1. Excelの基本(2) データの入力・削除・編集 ① データの入力 : セル上で入力し,「Enter」キーを押す. ※ 数字,計算式は必ず半角英数で入力のこと. ② データの削除 : セルを選択し,「Delete」キーを押す. ③ データの編集 : 編集したいところにダブルクリックをして文字カーソルをお く.または、「F2」キーを押したまま入力・編集領域で編集をす る. ※ セルを選択して入力すると,そのまま上書きすることになるので 注意. 4 1. Excelの基本(3) オートフィルオプションを使う方法 最初の数字を入力して,フィル ハンドルをドラッグする 右下のオートフィルオプション ボタンをクリック して,メニューを開き,[連続データ]を選択する 1. Excelの基本(4) 最初に1,2を入力して, フィルハンドルをドラッグする 文字列の入力も可能 6 1. Excelの基本(5) セルのコピー・移動など • 【コピー】【切り取り】 【貼り付け】 ① コピー・切り取り・貼り付けしたいセルを選択し,右クリックして、 メニューか ら「切り取り(T)」 「コピー(C)」「貼り付け(P)」ボタンを選択. ②次のショートカットキーを覚えておくと、大変便利. – コピー「Ctrl+C」 → 貼り付け「Ctrl+V」 – 切り取り「Ctrl+X」 → 貼り付け「Ctrl+V」 • 【セルの移動】 – 上下左右の「矢印キー」を利用して移動すると便利. • 【端点への移動 】 – 「End」キーを押してから矢印キーを押すと,その方向にある連続する入力済 みセルの端点まで移動する. – 「Home」キーを押すとその行の左端に, 「Ctrl」キーを押しながら「Home」キーを押すと「A1」のセルに移動する. 7 2. Excelで統計分析(1) 簡単な四則演算 ※ 入力は半角の英数 -数式や関数を使うときは最初に「=」 (イコール)を入力する. - 四則演算の記号は「+」「-」「*」「/」. 例えば, 右の例をみよう. 1) 普通に数字を入力する: 「=10+20+30+40+50」 あるいは, 2)数字が入っているセル番地を用いる: 「=A2+A3+A4+A5+A6」 「Enter」キーを押すと計算結果が出る. 8 2-1.テータの記述統計 (1) ① 1.「数式」→「関数の挿入」 2.求めたい統計値を選択 (検索も可能) ③ ①MIN:最小値 ②MAX:最大値 ③AVERAGE:平均値 ④MEDIAN:中央値 ⑤MODE:最頻値 ⑥STDEV:標準偏差 (Excel 2010 では STDEV.S) ② ④ 注意:Excel 2010 では、STDEV.Pという 関数名もあるが、STDEV.Pは、平方和 を n で割ったもの(分散)の平方根 ⑦VAR:分散 (不偏分散) (Excel 2010 では VAR.S) ⑤ 注意:Office のバージョンが違うと、関数名が異なることがあります。その時 は、必ず「この関数のヘルプ」で確認をしましょう。計算式が示されています。 9 2-1.テータの記述統計 (2) ドラッグ ② ① 10 2-1.テータの記述統計 (3) ① ② より簡単な方法 1.「データ」⇒「データ分析」⇒ 「基本統計量」を選択 2.範囲を選択 (B4~B33) 「データ分析」ツールが画面上に表示されない場合 1. Microsoft Office ボタン をクリック(Excel2010の場合は、[ファイル]をクリック)し、[Excel のオプション] をクリック 2. [アドイン] をクリックし、[管理] ボックスの一覧の [Excel アドイン] を選択、[設定] をク リック 3.[有効なアドイン] ボックスの一覧で、[分析ツール] チェック ボックスをオンにし、[OK] を クリック ※ [有効なアドイン] ボックスの一覧に [分析ツール] が表示されない場合は、[参照] をク リックしてアドイン ファイルを見つける 11 2-1.テータの記述統計 (4) ① ② 12 2-2. Histogramを書く (1) 1.データの作成および編集 2.分岐点として階級値に入力する. ①「階級値1」は成績の分布を10点単位 でみる。(0~10、11~20、21~30、・・・) ②「階級値2」は成績の分布を20点単位 でみる。(0~20、21~40 、41~60・・・) Data Source: http://software.ssri.co.jp/statweb2/tip s/tips_4.html 13 2-2. Histogramを書く (2) ① ② 「得点」のセルを指定 A4~A114 ③ ④ 「階級値1」のセルを 指定 C4~C13 ⑤ ⑥ 14 2-2. Histogramを書く (3) 階級別の度数 ダブルクリック をして変更 15 2-2. Histogramを書く (4) 階級別のヒストグラム比較 累積度数分布 の表示 16 2-3. 散布図を書く (1) ② 1.相関関係をみたい変数の 範囲を選択 ③ 2.「挿入」→「グラフ」の散布 図を選択 3.「グラフのレイアウト」のレ イアウト9を選択 ① Data Source: http://homepage1.nifty.co m/gfk/sohkan-Graph.htm 17 2-3. 散布図を書く (2) 「グラフのレイアウト」 のレイアウト9を選択 18 2-3. 散布図を書く (3) 軸ラベル変更 19 2-4. 相関関係 ① ② ① =correl(データ1の範囲、 データ2の範囲) ② 20 2-4. 相関関係 D22(平均値のセル)が 固定されず、xiの値と ともに変化してしまう ドラッグ $D$22と入力する or D22を入力した 後、「F4」キーを押 す D22が固定され、正し く計算できる ドラッグ 21 3. 回帰分析(1) 1.「データ」⇒「データ分析」⇒「回帰分析」を選択 2.入力Y・X範囲を選択 3.データを選択するとき、変数名も選択 4.ラベルにチェック ① ② ③ 22 3. 回帰分析(2) 散布図 y = -0.3271x + 2.6023 R² = 0.7594 回帰分析 R² 係数(傾き) 23 3. 回帰分析(3) 注目すべき点 1. 「重決定R2」 : 決定係数であり,当てはまりの良さを示 す。数字を見ると75%前後となっていて,か なり当てはまりがよさそうであるが、当ては まりの良さが因果関係の強さを表すわけで はない 2.「係数」 : それぞれの変数が1単位増加した時の身 長の増加分を表す。 3.「残差」 均一分散性に問題ない: 0を中心に均 一に散らばっている 均一分散性に問題がある (推定がうま く行っていない,あるいは他に有力な説 明変数がある): uがxと共に増加(減 少)している,uが規則性を持っているよ うに観察される 24 エクセルの表やグラフを ワードに貼り付ける 1.ワードに貼り付けたい表を選択し、右クリック→「コピー」 2.ワード上で貼り付けたい場所にカーソルを置き、右クリッ ク.→貼り付けのオプションから「図」を選んでクリック ② ① 分散分析表 自由度 回帰 残差 合計 1 16 17 変動 15.61608 4.948925 20.565 係数 標準誤差 切片 2.6022757 0.13581 名目賃金変化率 (x) -0.32712953 0.046039 分散 観測された分散比有意 F 15.61608 50.487169 2.49E-06 0.309308 t 19.16116 -7.10543 P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 1.851E-12 2.314371 2.89018 2.314371 2.89018 2.492E-06 -0.42473 -0.22953 -0.42473 -0.22953 25
© Copyright 2025 ExpyDoc