SPSS 入門 麻生良文 内容 • データの読み込み – テキストファイル – Exelファイル • 記述統計 • グラフ • 回帰分析 データの読み込み • wage1.raw というファイルを読み込む • wage1.des, wage1.raw をテキスト・エディター(メモ帳 など)で開く – wage1.des データセットの説明 – wage1.raw データセット本体(本体に変数名は含まれて いない) • wage1.raw:wage, educ, … など 24の変数,526個のオブザベー ションからなるデータであることがわかる • データセット本体の先頭行に変数名を含めておくと便利(他の統 計ソフトを利用する場合には特に) wage1.des の内容 wage1.raw の内容 wage1.desの変数名をwage1.rawの先頭行に挿入:この段階では変数名 の途中に改行が入っている 改行を取り除いて変数名を1行に直す。適当な名前をつけて保存する。 変数名とデータの桁をそろえておくと読み込みのときに失敗が少ない。 (SPSSでは,桁を揃えて固定書式でないとうまく読み込めなかった) テキストデータの読み込み メニューから「ファイル」「テキストデータの読み込み」を選択 次のような画面が表れるのでガイドにしたがって進む csvファイルの場合には「自由書式」を選択。 ここでは「固定書式を選択」 ファイルの先頭行には変数名が 含まれていた ファイルの先頭行は変数名であるため データの読み込み成功 スプレッドシートのような画面が表れる(データビュー) 変数ビューの画面 educ(教育年数)はスケール変 数に直しておく Excelファイルの読み込み wage1.xlsを開く Excelファイルの読み込みwage1.xlsを開く 先頭行に変数名を記入(wage1.desからコピーしてくるなどして) 名前をつけて保存する Excelデータの読み込み • SPSSの起動 • 最初にファイルを開くためのダイアログボックスが表れる。 「別の種類のファイルを開く」を選択して,ファイルを開か ないで起動する • ファイルテキストデータの読み込み – – – – 「ファイルの種類」でExcelの拡張子を選択する 読みたいファイルを選択 後はテキストファイルの読み込みと同様 (右のような画面が表れる) Excelのワークシート上でデータの範囲をコピーして, SPSSのデータビューの画面上で貼り付けても,データ の読み込みは可能 ただし,変数名まではうまくインポートできなかった 変数の記述統計 メニューから 「記述統計」「記述統計」とたどる 記述統計量を求めたい変数を選択 左側のボックスで変数を選択して, マウスでクリックすると選択できる 記述統計の出力結果 グラフを描く ヒストグラム メニューから「グラフ」 「図表ビルダー」 変数の平均値を比較 メニューからグラフレガシーダ イアログ棒とたどっていく 箱ひげ図(BoxPlot) メニューから グラフレガシーダイア ローグ箱ひげ図単純, 変数ごとの集計定義 を選択して変数を選択 4分位点 中央値(50%点) 複数のデータの大まか な分布を知りたいとき に便利 散布図 グラフレガシーダイア ローグ散布図/ドット 単純な散布図 とたどり,x軸とy軸の変 数を指定 wage, educ, exper,tenureの撒布 図行列 メニューから グラフレガシー ダイアログ散布 図/ドット行列散 布図 とたどって,変数を 指定する 左は,wage, educ ,exper, tenureの行列散布 図(散布図行列) 相関係数 メニューから 分析相関2変量 を選択して変数を指定 回帰分析 次のようなモデルを考える yi 1 x1,i 2 x2,i k xk ,i ui i:オブザーベーションを表す添え字 i=1,2,…,n yi : 被説明変数(従属変数) x1i, x2i,..., xki : 説明変数(独立変数) ui: 誤差項 •観測されたデータから,1,2,..,kを推定 • 理論モデルの統計的検証 • 事実の解明(複数の要因でyを説明) •推定方法 最小二乗法(OLS),最尤法(ML)など 回帰分析 メニューから 分析回帰線型 を選択 従属変数(被説明変数)と 独立変数(説明変数)を 左のボックスから選択 回帰分析の出力結果 推定された係数の値 変数の作成・加工 • 実際の分析では,統計データをさらに加工して分析すること が通常 – 理論モデルの概念に合うような変数が必要 • • • • • 所得(Y)と貯蓄(S)のデータから貯蓄率(S/Y)を作成 所得から税負担や社会保険料負担を引いて可処分所得を求める 名目所得を物価指数で割り,実質所得で分析する 恒常所得と変動所得に分解 世帯構成員一人当たりの所得,子供・高齢者の調整 – 消費関数の形状 • • • • C=a+bY C =a + b1*Y + b2* Y2 (所得の2次関数) log(C)=a + b log(Y) (対数線形) あらかじめ,どの関数形が正しいかはわからない場合が多い wage log(wage)を作成 メニューから 「変換」「変数の計算」を 選択 右の画面の「目標変数」に 新変数名を記入: lnwage 数式に計算式を記入: LN(wage) 「関数」から数学関数を選択 してもよい 注意: SPSSでは自然対数 はLN(), 常用対数はLG10() 論理式を用いた代入もで きる 例) x= (y>100) y>100ならx=1, otherwise x=0 対数変換された賃金 (lnwage)のヒストグラム wageに比べると左右対 称に近い形になってきた グラフの利用 • 回帰分析の前に,まずデータのチェック • 変数の大まかな傾向をみる – 記述統計 – ヒストグラム,散布図 – データの誤入力 • 回帰分析と散布図の違い – 回帰分析(重回帰分析):複数の要因 – xとyの散布図:他の変数の影響はコントロールされていな い 時系列データの分析 Philips.rawを読み込む 16 フィリップス曲線 12 16 4 12 0 8 INF 8 -4 4 50 55 60 65 70 75 INF インフレ率と失業率の 推移 80 85 UNEM 90 95 00 0 -4 2 このグラフはE-Viewsで作成したもの 3 4 5 6 UNEM 7 8 9 10 付属のデータを活用してSPSSに慣れる • サンプル・データ – SPSSの実行プログラムの入っているディレクトリー (フォルダー) – Ver19では,通常は, C:\program files\ibm\spss\statistics\19\samples 以下のフォルダーに入っている • Helpの活用
© Copyright 2025 ExpyDoc