2015年6月19日
1. R入門復習
2. DDS 「2.2.2 演習問題:EDA」
数値
文字列
TRUE/FALSE
ベクトル
行列
リスト
データフレーム
NULL
NaN (Not a Number)
Inf (Infinity)
ls()
rm(x)
class(x)
str(x)
:
:
:
:
定義した変数一覧
定義済み変数の削除
変数のデータ型
変数のデータ構造
[1, 3, 5]というベクトルを変数vに代入する
v <- c(1,3,5)
ベクトルvのindex=2にアクセスする
v[2]
ベクトルの要素を変数として扱える
v[3] <- 10
ベクトルの要素を追加する
v[4] <- 7
ベクトルの要素数を返す
length(v)
連続した数字をベクトルにしまう
v <- 1:10, v <- seq(1, 10, by=2), seq(1, 10, length=5)
一定の要素の繰り返しをベクトルにしまう
v <- rep(1:5, times=3), v<- rep(1:5, length=10)
ベクトルの要素にカテゴリを与える
x <- c(“S”, ”M”, ”L”, ”M”, ”L”)
x.fc <- factor(x)
カテゴリを指定する
x.fc <- factor(x, levels=c("S","M","L","XL"))
カテゴリに順序関係を付加する
x.or <- ordered(x, levels=c("S","M","L","XL"))
因子ベクトルへ変換
z <- 1:20
z.fc <- cut(z,c(-Inf,0,5,10,15,Inf))
「行列+属性」という概念でデータセットのように列に属性名をもつ
2属性:SIZE, SALESである2列5行のデータフレーム
x <- data.frame(SIZE=c("M","L","S","L","M"),SALES=c(1,2,1,3,1))
部分データフレームにアクセス
◦ 行(インスタンス) : x[1,], x[1:10,], x[c(1,3),]
◦ 条件を指定
: subset(x, SALES>2)
属性の値にアクセス
x$SIZE もしくは x[,1]
データセットをファイルから読み込む nyt1.csvをワーキングディレクトリに置く
x <- read.table("nyt1.csv", header=TRUE, sep=",", na.strings="")
Y <- read.table(“nyt1.csv”, header=FALSE, sep=“,”, na.strings=“”)
z <- read.table("nyt1.csv", header=FALSE, sep=“¥n", na.strings="")
x, y, z を比較してみましょう
合計
sum(x$Age)
最大値・最小値
max(x$Age), min(x$Age)
平均値
mean(x$Age)
中央値
median(x$Age)
標準偏差 (「平均との差」の平均)
sd(x$Age)
数値の桁表示について
1.3e+02 = 130
演習: データセット nyt1.csv の属性”Age”の合計値、最大値、最小値、平均値、
中央値、標準偏差の6つの値を持ったベクトルを変数stに代入してください
プロジェクト “DDS.Rproj” に “ex222.R” を作成
nyt1.csvを読み込みインスタンス例と要約を表示する
一行ずつ実行しながらソースコードを読み解く
◦ ex222.Rにソースコードを書き、1行ずつ実行していく
◦ 後で自分でわかるようにメモをとること
ソースコード中に「#コメント」で書くとよい
18歳以下の女性と男性の比較をしてみましょう
時間があればP68~69の線形回帰の例へ
Dreamer「はじめてのデータマイニング」より
5/1 [実践編] データマンジング、可視化、分析
5/8 第2章輪講
5/15 R導入
5/22 第3章輪講
5/29 R入門
6/5 第4章輪講
6/12 オープンラボ
6/19 R演習第2章
6/26 第5章輪講
・・・ 随時更新
1週間で1章ずつ全員で読み進める
◦ 第1章~第5章について5つのグループで担当
する章の内容をまとめて発表する
◦ 残りの4グループの人はペンで理解できなかった
点や議論したい点などマーク・メモしておく
発表後にその章について議論
◦ マーク・メモしておいた内容についてみんなで話す
2年生:1グループ
3年生:4グループ (3名、3名、4名、4名)
2-1:
岡田 矢代 向田
第1章
3-1:
土屋 吉川 中山
第2章
3-2:
関根 山岸 寺澤
第3章
3-3:
伊東 今野 堀川 仲山
第4章
3-4:
大内 西野 山口 天野
第5章
提出レポートのファイル名は以下の規則に従ってつけてくださ
い。
学籍番号氏名_プロジェクト#番号.docx
例)13T9001佐藤温_プロジェクト#03.docx
研究室:西館4階 A1
メールを送る際には2人両方を宛先にいれること
メールアドレス:
黄 潤和 教授
[email protected]
TA 佐藤 温
[email protected]
© Copyright 2026 ExpyDoc