R入門

R入門
Chapter 7 ファイルからデータを読み込む
結城
隆
7.1 read.table()関数
データフレームの全体を直接読み込むためには、外部ファイルは普通
特別な形を持つ。


ファイルの第一行はデータフレーム中の各変量に対する[名前]を含むべきである。
ファイルのその他の各行は最初の項目として書く変量に対する[行ラベル]と値をもつ
べきである。
name
height
weight
A
177
63
B
168
71
C
172
61
D
158
53
E
173
78
F
176
65
これをデータフレームに読み込むには
>class <- read.table(“hause.data”,header=TRUE )
とすればよい
7.2 scan()関数
データベクトルが同じ長さで、並列的に読み込まれるべきであると仮定する。
class1.dat
A
177
63
B
168
71
C
172
61
D
158
53
E
173
78
F
176
65
ここでscan()を用い、3つのベクトルをリストとして次のように読み込める
>cla <- scan(“class1.dat”,list(””,0,0))
2つ目の引数は、読み込むべき3つのベクトルのモードを確定するための、
ダミーのリストである。データ項目を3つの分離されたベクトルに分離する
ためには、次のような付置を使う
>name <-cla[[1]];height <- cla[[2]];weight <- cla[[3]]
またつぎのようにしても同じことが可能である。
>cla <- scan(“class1.dat”,list(””,0,0))
7.3
組み込みデータセットにアクセスする
50を超えるデータセットがRとともに提供されており、その
他のものがパッケージから利用できる。
基本システムの中のデータセットを見るには
>data()
としそれらの1つをロードするには、例えば次のようにする
>data(infert)
様々なものがあるが用途はオンラインヘルプで確認せよ。
7.3.1 ほかのRパッケージからデータ
を読み込む
他のパッケージデータを利用するには、package引数を利用する。
例
>data(package=“nls”)
>data(Puromycin,package=“nls”)
のようにして利用する。
7.4 データを編集する
データフレームか行列に対して呼び出されたときは、editでの編集
は表計算式になる。これは一旦データセットを読み込んだあとで
ちょっと変更するのに便利である。
>xclass <- edit(class)
はclassを編集でき、編集されたものはxclassに付置される。
表計算形式のインターフェイスによって新しいデータを入力するに
は
>xnew <- edit(data.frame())
のようにする。
宿題
name
attend
absence
a
23
7
b
20
10
c
21
9
d
23
7
e
25
5
f
19
11
1.上のようなデータファイルをつくりファイルからデータを読み込め
2.読み込んだファイルをeditで編集しaとbの数値を入れ替え動作を
確認せよ。