ガイダンス

データ分析実践
第1回 「ガイダンス」
木村 欣司
(情報学研究科)
概要・目的(1)

統計処理やプログラミング言語の基礎知識を持たない学生を
対象として、大規模データ解析を行う為のプログラミング技術
の習得を目指す実践科目である。「データ分析入門」という統
計計算の入門的講義科目に対して、この科目は、より高度な
実習を行うことにより、より大規模なデータを解析することを
目指す。「データ分析入門」の実習では、Excelと統計計算に
特化したソフトウェアであるRのR言語を学習するのに対して、
この授業では、その2つのソフトウェアの使い方について簡単
に触れた後、プログラミング言語Cを用いて、主成分分析など
において重要な、対称な大規模疎行列の最大固有値から数
個の固有値とそれに付随する固有ベクトルを計算するプログ
ラムを自らの手で作成する。本講義の目的の一つに、統計計
算の基本的な内容に対する理解を深めることがあげられる。
概要・目的(2)

統計処理がどのように利用されるか概説し、計算機
を用いて統計処理を行う方法を解説し実習を行う。
加えて、プログラミング言語Cの知識を持たない学生
が、この言語に習熟することで自らのプログラミング
スキルを高める目的もある。また、計算機の構成と
プロセッサアーキテクチャの基礎知識をもとに、動作
速度の点で優れたプログラムを作成するための基
本的な手法を解説する。プログラミング言語への理
解を深めるだけでなく、統計計算というアプリケー
ションの作成を通して、さまざまなアプリケーションを
作成する状況においても活用できるプログラムの高
速化技法について習熟することを目的とする。
担当教員

木村欣司([email protected])



情報学研究科数理工学専攻特定准教授
情報学研究科附属高度情報教育基盤ユニット
http://www.iedu.i.kyoto-u.ac.jp/
關戸啓人([email protected])


情報学研究科数理工学専攻特定助教
情報学研究科附属高度情報教育基盤ユニット
日程
木村欣司
 10/3,10/17,10/24,10/31,11/7,11/14,12
/12,12/19,12/26,1/4,1/16,1/23,2/6
 關戸啓人
 11/28,12/5

成績評価の方法・基準

全14回の途中に、統計の基礎知識について、その
知識を習得しているかを確認するため、レポート課
題を出題する。さらに、大規模データ解析を行うレベ
ルのC言語のプログラミングスキルを習得している
かについて、実習レポート課題を通して判断し、成績
評価とする。特に、レポート課題への解答として作成
したプログラムが、計算機の構成とプロセッサアーキ
テクチャの基礎知識をもとに、効率的な動作を行うも
のかという基準で評価する。講義・実習への出席状
況も評価の基準に加える。
課題の提出の方法



2月13日までに, 総合校舎12号館110号教室にレポー
トを持参すること
レポートは、紙ベースで作成すること
総合校舎12号館の入り口は, 19時まで開放されてい
る, 余裕をもって建物に入ることを心がけること