「国際ミクロ統計データベース」の 利用⽅法について 岡本 基 情報・システム研究機構 リサーチ・アドミニストレーター 山下 智志 統計数理研究所 データ科学研究系 教授 情報・システム研究機構 岡本 基 2015/9/14 1 「国際ミクロデータベース」とは? • アジア諸国の政府統計(主に、世帯の家計に関する統計調査)の個票 データを、各国政府からの提供を受けて、ミクロ統計データ活用研究 会が世帯単位でリサンプリングした匿名標本データを収録 • そのデータをオンサイト利用により提供し、日本国内にいながらにし て、アジア各国間の比較実証研究を実施することができるデータ基盤 を構築する • 松⽥芳郎先⽣、神谷傳三先⽣、伊藤彰彦理事⻑を中⼼とした研究班に より実施された2件の科研費研究を基盤とし、アジア諸国の統計部局 とのリレーションとRawデータ提供の協⼒体制を構築 • • バングラディシュ、インドネシア、ラオス、マレーシア、ネパール、スリランカ、ベト ナムとデータ提供に関する協定を締結 • その後、カンボジア、モンゴル、タイとも締結 2013年より、情報・システム研究機構 データ中⼼科学リサーチコモン ズ事業「人間・社会データ」プロジェクトが同計画に参画 • • (公財)統計情報研究開発センターと情報・システム研究機構の間で連係協⼒協 定を締結し、データベースの利用に向けた協⼒体制を構築 2014年7⽉より、試⾏提供開始 情報・システム研究機構 岡本 基 2015/9/14 2 データベースの利用⽅法について 情報・システム研究機構 岡本 基 2015/9/14 3 提供体制・利用⽅法-概要 • 提供体制: (公財)統計情報研究開発センター(シンフォニカ)と情 報システム研究機構による協業 • シンフォニカが、データの匿名化、アジア各国の統計部局との交渉、提供事 務を担当 • 情報・システム研究機構が、データ利用のためのオンサイト利用環境を提供 • 利用⽅法: 申出制+オンサイト利用 1. シンフォニカへ利用申出書を提出し、研究内容について審査を受ける 2. 利用許可を受けた後、統数研・オンサイト室と利用⽇程について調整し、統 数研に来所し、オンサイト利用 3. 利用終了後、最終⽣成物のチェックを受け、データを受領 4. 後⽇、研究成果報告書を提出 情報・システム研究機構 岡本 基 2015/9/14 4 提供体制・利用⽅法-概要 • • • 利用可能なデータ: 4匿名データを提供中 • SUSENAS 2006(インドネシア) • HEIS 2009(スリランカ) • THSES 2007(タイ) • VHLSS 2006(ベトナム) • 12月に開催予定の国際WSで、CSES 2009(カンボジア)、HSES 2011(タイ)、 NLSSⅡ2003/04(ネパール)を試⾏利用 利用料: 無料 • 利用に際しては、「ミクロ統計データ活用研究会」の会員(会費無料)となること • 併せて、統計数理研究所の外来研究員、もしくは、共同利用に登録する(統計数 理研究所の設備を利用するため) 利用期間: 最大1年 • 利用状況に応じて、最大1年の延⻑が可能(要申出&審査) 情報・システム研究機構 岡本 基 2015/9/14 5 2015/9/14 6 提供体制・利用⽅法-申請まで 情報・システム研究機構 岡本 基 提供体制・利用⽅法-提供まで 情報・システム研究機構 岡本 基 2015/9/14 7 提供体制・利用⽅法-データ利用と報告 8 オンサイト利用施設について 情報・システム研究機構 岡本 基 2015/9/14 9 場所・利用時間 • 統計数理研究所(東京都⽴川市緑町) 5階 オンサイト解析室 • JR東京駅から中央線利用で約1時間 • 利用時間(標準):平⽇の10時〜17時 • ゲストハウスを利用した短期集中分析も可能 情報・システム研究機構 岡本 基 2015/9/14 10 オンサイト解析室の概要 • 強固なセキュリティにより、データを保護 • 管理側でデータの持ち出しをコントロール 分 析 室 • PCへの外部メディア接続の全面制限 • データ保存用端末による集中管理 • 外部ネットワークからの遮断による ネットワーク経由のデータ流出防⽌ • 監視カメラによる常時監視 執務室 休憩室 • パーティションにより区切られた作業環境 廊 下 • 意図するor意図しない窃視の防⽌ • 統計法第33条による公的統計の目的外利用におけるセキュリティ要 件を満たした環境 • 独⽴⾏政法⼈統計センターによる検査を受け、認可 情報・システム研究機構 岡本 基 2015/9/14 11 オンサイト解析室の概要 • 解析用端末「ISMオンサイトオリジナルワークステーション」: 2台 • OS: Microsoft Windows7 Professional SP1 64bit • CPU: Intel Xeon E5-2630 v3 (2.4GHz 8Core) • GPU: NVIDIA GeForce GTX980 (GDDR5 4GB) • メモリー: DDR4-SDRAM 32GB (8GB×4) (ECC/PC-17000) • ドライブ: SSD SATA 6GB/s 512GB×2 (RAID1) • モニタ: ナナオ FlexScan EV2455 24インチワイドモニタ×2 • 光学ドライブ無し、USBポート使用不可 • データは、室内ネットワークを通じてデータ保存用端末にアクセスし、利用す る。 • 最終⽣成物データを持ち出す際には、解析室、シンフォニカによる内容チェッ クを受ける必要あり。即⽇持ち出しは出来ない。 情報・システム研究機構 岡本 基 2015/9/14 12 オンサイト解析室の概要 • 使用可能なソフトウェア • IBM SPSS Statistics Base 23 (⽇本語版) • R 3.1.2 (⽇本語版) • Microsoft Office 2013 Professional (64bit) (⽇本語版) • Adobe Acrobat XI Pro (⽇本語版) • 追加可能なソフトウェア • SAS Ver.3.4 (32bit/64bit) • StataCorp Stata/MP 12,13 (要有効なライセンス) • JustSystem ⼀太郎2014/ATOK2014 • その他のソフトウェア利用については応相談 情報・システム研究機構 岡本 基 2015/9/14 13 お問い合わせ・ご相談等はこちらへ • (公財)統計情報研究開発センター • http://www.sinfonica.or.jp/information /research/index_databese.html • [email protected] • 情報・システム研究機構 新領域融合研究 センター 統計数理研究所・オンサイト 解析室 • http://www.rois.ac.jp/tric/micro/ • [email protected] 情報・システム研究機構 岡本 基 2015/9/14 14
© Copyright 2024 ExpyDoc