データサイエンスを専門的に学ぶ 大学教育の展望

データサイエンスを専門的に学ぶ
大学教育の展望
滋賀大学の目指すもの
竹村彰通 佐和隆光 吉川英治
(滋賀大学)
2015年9月2日
日本行動計量学会
滋賀大学では平成29年4月開講に向けて、日本初の
データサイエンス学部設立の準備を進めています。こ
こではその構想について説明します。
項目
•
•
•
•
•
•
•
社会的背景
データサイエンティスト育成の現状
海外の動向
滋賀大のシーズ
カリキュラムの考え方
育成する人材像とアドミッションポリシー
教員組織の編成
注: 以下は現在検討中の内容であり確定ではありません
社会的背景 ― ビッグデータ時代の価値創造
情報通信技術の飛躍的発展
ユビキタスネットワーク、無線技術、
センサー技術、
ストレージ技術、スマートフォン、タ
ブレット端末、…
価値創造の具体例
テーラーメード型の投薬や治療
個人化された販売戦略
検索、電子商取引、ソーシャルメディア等
のウェブサービス分野におけるリコメンド
サービス革新
第1次・第2次産業の品質管理・生産工程
の効率化
故障や災害の事前予測、列車等の運行
安全の確保、自然災害リスクへの対応
金融リスク管理
社会インフラのスマート化:交通システム、
電力供給システムなどの効率化
様々な領域でビッグデータの集積が進んで
いる
世界のデジタルデータ量は2020 年に約35 ゼタバイトに拡大する
⇒2010年の35倍(1ゼタバイト=1兆ギガバ
イト)
• Volume(量)、Velocity(速度)、Variety
(多様性)において、大きい!
• 非構造化データ(テキスト、静止画、動画、
音声など)も含み、質は不均一で、デー
タ空間は疎(スパース)、そして価値密度
は低い
• 大きな価値創造の可能性を秘めている
少なくとも10 兆円規模の付加価値創出効果
12 〜15 兆円規模の社会的コスト削減効果
(情報通信審議会ICT 基本戦略ボード・ビッグデー
タの活用に関するアドホックグループによる)
価値創造のための科学としての《データサイエンス》
客観的な存在としてのビッグデータを対象として、そこから新た
な知見を引き出し、価値を創造するための科学
データサイエンス
大規模データを分析・解
析するための
専門的知識とスキル
(統計学)
大規模データを加工・研
磨・処理するための
専門的知識とスキル
(情報工学・コンピュータ科学)
新たな知見
ビジネスや政策などの領域で課題を読み取りデータエン
ジニアリングとデータアナリシスにより得られた知見を
現場の意思決定に生かして価値を創造する
(領域分野での成功体験=PBLの繰り返し)
データサイエンティスト
4
ビッグデータおよびデータサイエンスへの期待と動き
アメリカ 2012年「ビッグデータイニシアティブ」発
表、総額2億ドルの投資
ヨーロッパ 2012年からR&D投資に関する枠組
みFP7を開始、予算総額約30億ユーロ
2014年開始のHorizon 2020ではビッグデータ関連
事業に9億ユーロ投入
中国 2012年「ハイテク・サービス業の研究開発
と産業化に関する通知」
日本でも様々な動き
 Google チーフエコノミストのH. Varian: 「最も魅力的な職業は
Statistician」
McKinsey Global Institute 2011年
レポート: Deep Analytical Talent
今後14‐19万人必要と予測
Harvard Business Review, 2012年
10月号: 「データサイエンティス
ト:21世紀のもっとも魅力的な職
業」
「日本再興戦略」「世界最先端IT 国家宣言」: 情報通信技術の進展によるビッグデータの
時代、ビッグデータの利活用による価値創造に言及
「科学技術イノベーション総合戦略2015」(平成27年6月19日閣議決定):
「我が国では欧米等と比較し、データ分析のスキルを有する人材や統計科学を専攻する
人材が極めて少なく、我が国の多くの民間企業が情報通信分野の人材不足を感じており、
危機的な状況にある」と指摘
日本学術会議提言:『ビッグデータ時代に対応する人材の育成』、『ビッグデータ時代にお
ける統計科学教育・研究の推進』
文部科学省:「データに基づく課題解決型人材育成に資する統計教育質保証」統計教育
大学間連携ネットワーク(JINSE)
データサイエンティスト育成の現状と課題
McKinsey Global Institute, Big data: The next frontier for innovation, competition, and productivity
日本では、統計分析や機械学習などのデータ分析能力を有すると推測できる大卒人材はせい
ぜい3,400人のみ
日本では、2004年からの5年間では、さらに減少傾向にある ⇒ ‐5.3%
アメリカ:24,730人
中国17,410人
インド:13,270人
イギリス:8,300人
日本経済新聞平成25年7月17日付の記事:データサイエンティストが25万人も不
足! ⇒あるシンポジウムでの報告者の推計値をもとに報道、データサイエン
ティスト以外の職種も含む推計
人材養成に関しては、日本はまったく進んでいない!
国際競争力の急速な喪失が懸念される今こそ、
データサイエンティストの急増が求められる
海外の大学の動向(1)
 海外の大学には、もともと統計学の独立した学部・学科あるいは教員組織としてのセクションが存在する(アメリカ、イギリス、
欧州はもちろん、中国、韓国などのアジア諸国も同様)
 独立した統計学のセクションがあると、情報工学、コンピュータ科学、ときには数学も加えて、データサイエンス・プログラムが
柔軟に生成されやすい
 アメリカの大学院では、各領域科学の専攻を中心に副専攻プログラムとしてのデータサイエンス教育が展開されたり、データ
サイエンスを主専攻とする場合には、企業の即戦力としての専門職育成が行われたりしている
 アメリカの学部教育では、統計学専攻のプログラムがデータサイエンスを意識した内容に変更されていて、統計学専攻は近
年の理系学位(STEM)の一番人気で、卒業後の給与も一番高いと言われている。
アメリカ・学部教育
アメリカ統計学会ニュースレターから(amstat news, February & April, 2015)
統計学・学士号
取得者比率
2011‐13/2003‐05
Purdue University
875%
Big Data course
programming language (C, Python, Java, etc.) プログラミング⾔語
University of
California, Berkeley
224%
the upper division electives are almost all centered on data analysis (statistical
learning theory) 上級選択科⽬としての統計的学習理論
University of Illinois,
Urbana‐Champaign
452%
new analytics courses emphasizing data management and statistical analysis of databases, Big Data methods ビッグデータ⼿法に重点化したコース
a new statistical programming course 統計的プログラミング
Carnegie Mellon University
191%
experiential learning through the use of real data sets 実際のデータ利⽤
programming and software engineering in R, and databases and data management
visualization, data mining プログラミング、R、可視化、マイニング
イギリス・学部教育
UK. University of Warwick, Data Science (BSc Hons), Single Honours Degrees in Data Science
統計学部が先導してプログラムを提供
コンピュータ科学と数学の学部が協力している
データサイエンスを意識したカリキュラム
アジア:中国・韓国の学部教育
中国では、150以上の大学に統計学科が整備されており、年間2万人
以上の広義のデータサイエンティストが育成されている。
韓国でも、統計学科・応用統計学科など統計関連の学科が50以上設
置され、データサイエンティスト関連の人材育成が進んでいる。
海外の大学の動向(2)
(http://www.mastersindatascience.org/ におけるアメリカの大学院の情報から)




データサイエンスの専門的な修士課程プログラムをもつ上位23の大学院の詳細が報告されている
プログラムの提供元は多様であるが、データサイエンスに関する全学組織の場合もある
データサイエンスの独立した修士号を授与しているのは7つの大学院のみ
残りの大学院は、ビジネス分析、マーケティング、情報工学などの従来型の学位を授与している
23 Great Schools with Master’s Programs in Data Science
1.Columbia University
•Degree: Master of Science in Data Science
•School: Data Science Institute
•Full‐Time Program: 30 credits
2.Indiana University, Bloomington
•Degree: Data Science M.S.
•School: School of Informatics & Computing
•Full‐time Program: 30 credits
3.New York University
•Degree: MS in Data Science
•School: Center for Data Science
•Full‐Time Program: 3 or 4 semesters
4.Southern Methodist University •Degree: Master of Science in Data Science
•School: Dedman College of Humanities and Sciences,
Lyle School of Engineering and Meadows School of the Arts
•Full‐Time Program: 18–24 months
Master of Science in Business Analytics
Master of Science in Marketing Analytics
Master of Information Systems Management
Master of Science in Information Technology
Master of Science in Predictive Analytics
Master of Science In Analytics
Master of Business and Science
5.Stanford University
•Degree: Master of Science In Statistics: Data Science
•School: Department of Statistics
•Full‐Time Program: 45 credits
6.University of California, Berkeley •Degree: Online Master of Information and Data Science (MIDS)
•School: School of Information
•Full‐Time Program: 12‐20 months
7.University of Virginia
•Degree: Master of Science in Data Science
•School: Data Science Institute
•Full‐Time Program: 11 months
滋賀大学におけるデータサイエンス教育研究拠点の形成
より洗練されたビジネススクール型
&教養社会科学型の経済学部
&
学び直し大学院
経済、産業政策、
経営・マーケティング、
ファイナンス・会計・保険、
医療・保健・福祉、
歴史・文化
その他の全学的シーズ
環境研究
リスク研究
歴史・文化の多面的研究
環境総合研究センター
社会連携研究センター
附属史料館
リスク研究センター
その他
Data‐basedに洗練された教育学部
&第3期末の改組後の姿
&
教職大学院
滋賀医科大学、滋賀県立大学、長浜バイオ大学
滋賀県、教育委員会、彦根市、総務省
近畿・東海・北陸圏の企業、関経連など
連
携
強
化
地域の知の拠点機能の強化
データサイエンス教育研究センター
教育全般
学校経営、
カリキュラム設計、
授業方法改善など
データサイエンス学部・大学院
データアナリシスの
研究者を集積
数学
理科
統計学・情報工学・コンピュータ科学
を専門とする研究者
統計・数理・計量
数量的実証
経済、ファイナンス、経営、
会計、社会システム
経済学部
統計・OR
情報工学
情報管理
情報工学系
旧情報教育課程
情報科学課程
統計系
教育心理学
教育社会学
教員養成課程
教育学部
経済と教育の2学部・分離キャンパス、過去のソフトな工学部構想を継承しつつ、
各学部での総合性・多様性を追求
滋賀大学のシーズ
Disciplineとしてのデータサイエンスを「学部」として設置することの難しさ
=統計学部・学科を設置しない「分野点在方式」で発展してきた/情報工学・コンピュータ科学
との連結も必要 → 総合大学では既存部局間での事情は複雑で調整コストが小さくない
◎滋賀大学には複雑な事情がない/学長がリーダーシップを発揮できる
• 経済経営分野におけるコンピュータ利用・情報の重要性を認識して管理科学科を第3の学科として設置し(昭和47年)、
情報化社会の進展を考慮して情報管理学科へ改組(平成2年)、このため、統計学、オペレーションズリサーチ、情報工
学・コンピュータ科学の研究者を配置
• ファイナンス学科(平成3年)の設置とその後の学科再編(平成5年)により、欧米ビジネススクール型の学科構成、この
ため、経済・公共政策、ビジネス、マーケティング、ファイナンス、会計の分野において、統計・計量分析、数量実証系の
研究者を豊富に揃える
• 教育学部:情報科学課程を設置し(平成2年)、情報教育課程へ改組(平成12年)、このため、情報工学・教育工学系の研究者を配
置し、教育カリキュラム、ICTによる教育実践など、情報と教育の関係性に関する多様な研究教育を展開するとともに、教育心理
学・教育社会学を中心に統計学を用いた研究教育を展開
• 環境総合研究センター:湖沼流域ガバナンス→統合的湖沼流域管理(ILBM)に関する知識ベースシステムの構築
滋賀大学データサイエンス学部構想
データサイエンスに焦点を合わせた日本初の本格的な学部の新設
データサイエンティスト養成のための特色ある文理融合教育プログラムの展開
データサイエンス学部
学生定員:80~100名 教員定員:18~20名
データサイエンス学科
データアナリシス・コース
データエンジニアリング・コース
新たな教育を担う教員グループ
統計学・数学への関心が強く
データ解析の最先端を
より深く学びたい
情報工学・コンピュータへの関心が強く
アルゴリズムやアプリケーションの最先端を
より深く学びたい
Faculty of Data Science:
Unit of Data Analysis
Unit of Data Engineering
Unit of Data Communication
学問領域(Discipline):データサイエンス(Data Science)
学位:学士(データサイエンス)/Bachelor of Data Science
カリキュラムマップ
1年次
2年次
3年次
4年次
データアナリシス系列
記述的データ解析⼒
基礎データ分析 統計学Ⅰ
データサイエンス展開科⽬
推測的データ解析⼒
探索的データ解析⼒
統計学Ⅱ シミュレーション⼊⾨
データ解析概論Ⅰ 回帰分析
標本調査法 社会調査論
データ解析概論Ⅱ 多変量解析
時系列分析 最適化⼿法
ベイズ統計学 実験計画法
データエンジニアリング系列
初歩的データ処理⼒
オペレーティングシステム
データ構造とアルゴリズム
基礎的データ処理⼒
情報ネットワーク
データベースシステム
発展的データ処理⼒
マルチメディア論
ウェブデザイン
構造化データ処理計算論
分散システムとミドルウェア
プログラミング⾔語
データサイエンス
コミュニケーション
計算機統計学
統計的モデリング
統計的機械学習
データ可視化法
データマイニング
シミュレーション技法
計算機システム
ビッグデータアナリティクス
⼈⼯知能
ユビキタス情報処理
⾔語データ処理
⾳情報処理
CGと画像情報処理
領域科学分野専⾨科⽬(関連学部等の提供科⽬を含む)
マーケティング論、数理ファイナンス論、財務諸表分析論
医療経済学、社会保障論、産業政策論、環境政策論など
データ・ジャーナリズム論
知的財産権・個⼈情報保護
ビッグデータ解析と倫理
科学⽅法論
データ駆動型PBL演習ユニット(複数領域を選択)
マーケティング・データ、ファイナンス・データ、会計データ、
医療・健康・福祉データ、産業デザイン・データ、環境データ、
教育データ、歴史⽂化データなど
データサイエンス
⼊⾨演習
データサイエンス
フィールドワーク演習
データサイエンス
ケーススタディ演習
データサイエンス
実践価値創造演習
データサイエンス
上級価値創造卒業演習
データサイエンス
実践インターンシップ演習
現場で手と頭を動かすことを重視
現実の成功体験から理論的学習を導く反転カリキュラム
カリキュラムの全体像
4年
人工知能、環境データ処理工学、モバイルコンピューティング、ユビキタス情報処理、
言語データ処理、音情報処理、CGと画像情報処理、ビッグデータとITS
コンピュータ科学、可視化技術特論
領域科学分野でのデータサイエンスの実践
データ・ジャーナリズム理論&実践
セキュリティ・知的財産権・個人情報保護
科学方法論、ビッグデータ解析と倫理
1年
計算機統計学、統計的モデリング
時系列解析、統計的機械学習、数理モデル、
データ可視化法演習
シミュレーション技法、スマホーAPP演習
ビッグデータアナリティクス、
計算機システム、
最適化手法、ベイズ統計学
回帰分析、多変量解析、実験計画法、
データ解析概論1、データ解析概論2
マルチメディア論
ウェブデザイン演習、構造化データ処理
計算論、分散システムとミドルウェア
標本調査法、社会調査論
統計学1&演習、統計学2&演習
シミュレーション入門演習
基礎データ分析演習、データリテラシー演習、
解析学&演習
基礎数学&演習、線形代数&演習、
プログラミング言語&演習A~D
データベースシステム
情報ネットワーク
データ構造とアルゴリズム
オペレーティングシステム
情報社会
企業・自治体との連携
教員によるプロジェクト
による
上級演習
卒業研究
実践演習
インターンシップ
中級演習
ケーススタディ
初級演習
フィールドワーク
データサイエンス
入門演習
課題︓⾏財政,少⼦⾼齢化,⼦育て⽀援,地⽅衰退,農業,etc.
分析︓オープンデータ,センシング(IoT),Web・SNS,etc.
成果︓⾏政・社会の最適化,事業と雇⽤創出,共同体,防災,観光,etc.
社会領域
滋賀県 彦根市
商⼯会議所 観光協会
データサイエンティスト
附属史料館
社会連携研究センター
環境総合研究センター
教育学部
滋賀県 教育委員会
滋賀医科⼤学
⻑浜バイオ⼤学
滋賀県⽴⼤学
価値
創造
ケース
スタディ
statistics
データ駆動型
3領域演習
business
engineering
フィールドワーク(現地現物)
問題発⾒,データ収集
⼈間領域
課題︓教育,健康・福祉,地域志向⼈材, etc.
分析︓センシング,医療,Web・SNS,環境,etc.
成果︓教育科学,社会福祉,地⽅創⽣,etc.
リスク研究センター
経済学部
理 論
スキル
動機付
⺠間企業
経済団体
企業領域
課題︓データ解析⼒,KKD,グローバル,etc.
分析︓ビッグ&スモールデータ,Web,センシング,etc.
成果︓企業の最適化,戦略と価値創造,etc.
育成する人材像、卒業後の進路・キャリアパス
領域分野
領域分野






データサイエンスの基本的な専門的知識とスキルを備えている
課題発見力および知見を現場で生かす実装力を育んでいる
領域分野でのデータ駆動型価値創造の担い手となりうる
イノベーティブな心の習慣を育んでいる
多様なコミュニケーション能力を備えている
データ駆動型価値創造社会の哲学・倫理・政治についてバランスの
とれた見識を有する
 企業のデータ分析部門のデータサイエンティスト
 企業の財務経理、経営企画、マーケティング、生産管理
等の諸部門におけるデータ分析者
 経営コンサル・シンクタンク等のデータサイエンティスト
 国・地方自治体等の公務員
 大学院
データサイエンスの
専門的知識とスキル
独り立ち
Bachelor of Data Science
Associate Data Scientist 企業や官公庁の現場の先輩たちの助⼒
を得ながら、データサイエンティスト
としての基本的な仕事を、概ね⼀⼈で
遂⾏できる
プロフェッショナル
Data Scientist (Master of Science in Data Science)
職場での経験や教育訓練を経て、専⾨
的知識やスキル、価値創造の現場⼒に
磨きがかかり、データサイエンティス
トとして、かなり⾼度な業務を遂⾏で
きる
統括レベル
Senior Data Scientist データサイエンスの特定の専⾨的知識
とスキルについて顕著なレベルにあり、
他の専⾨家と協⼒・協働して、⾼度な
プロジェクトを遂⾏できるし、全体を
統括することができる
本学に対する地域や実業界からの期待
学び直し塾の包括協定締結自治体
経営協議会の民間企業出身委員
滋賀医科大学長
滋賀県立大学長
長浜バイオ大学長
滋賀県教育委員会
アドミッションポリシー、入学者選抜方法
受験者の関心および素養の想定
 人間社会の現象をデータで数理的・分析的に考えることに興味がある
 そうした専門的知識とスキルを社会のために利用したいという意欲に満ちている
 コミュニケーション力を有し、多様な人々と協働して、価値創造を推進できる
 数学や理科に興味があり、ものごとを筋道立てて考えることができる
 コンピュータやネットワーク、ソフトやアプリケーションの利用に関心がある
学習内容は理系的ではあるが、
文系タイプの学生を排除しない。
ふつうの国公立受験生として、
数学や理科も含めて総合的に
学習していることが望まれる。
高大連携・接続の工夫・改善を考慮
(1)アドミッション・ポリシーの観点からみた学外コンペや資格試験の利用
⇒実績に応じた優遇措置の可能性を検討
 各種データ解析コンペの成績優秀者
(例)科学技術振興機構(JST)主催の「All Analytics Championship ~データサイエンス・アドベン
チャー杯~」
 日本統計学会・統計検定3級優秀者
 経済産業省主催・情報処理技術者試験合格者、財団法人全国商業高等学校協会主催・情報処理
検定試験第1級合格者
(2)大学における講義・プロジェクト演習への参加+レポート作成
(3)「総合科目」「総合問題」の検討
(4)新テストにおける「合教科・科目型」「総合型」に対応して、統計と情報を組合せたような出題を検討
潜在的受験者の一部は現在の情報管理学科の受験者と類似していると予想
教員組織の編成
(統計学)を専門領域とする研究者
(情報工学・コンピュータ科学)を専門領域と
する研究者
Faculty of Data Science:
Unit of Data Analysis
Unit of Data Engineering
Unit of Data Communication




データサイエンス教育研究に関する助言
カリキュラム設計・運営に関する助言
データ駆動型PBL演習に関する助言
PBL演習・卒業研究の成果に関する外部評価
総務省
情報システム研究機構、統計数理研究所
日本統計学会などの関連学会
データサイエンティスト協会
関西・東海圏における民間企業とのネットワーク
地方自治体、教育委員会
滋賀医科大学、滋賀県立大学、長浜バイオ大学
データサイエンスに強い海外大学
まとめとお願い
• 滋賀大学のデータサイエンス学部構想は
日本の統計科学の突破口と信じる
• 社会的必要性が高いため、期待も大きい
と感じる
• 期待に応える規模で新学部を設立できる
よう、積極的な支援をお願いしたい