順位づけシミュレーション

島根大学教育学部紀要(自然科学)第17巻 31∼36貢
昭和58年12月
主成分分析による入試成績の
順位づけシミュレーション
野 坂 弥 蔵*
yazo NozAKA
Rank−Ordermg S1mu1at1on by the Pr1nc1pa1Corn−ponent
Ana1ys1s on Resu1ts of an Entrance Exam1nat1on
Abst醐ct Un1▽ers1ty exam1nees are rank ord.ered−on scho1ast1c ab111ty eya1uated.by
the sum of the1r scores of subjects m an entrance exammat1on These ranks exh1b1t a
degree of d.1sarray w1th respect to the1r ranks on the1r un1Yers1ty scores
In th1s paper, 1t comes to11ght that the ranks based on the f1rst, second.and th1rd
Prmc1pa1Component ca1cu1ated fro皿the scores of exammees c01nc1de fa1r1y we11w1th
the1r rankmgs on the un1yers1ty scores And1t1s a1so known that the f1rst Pr1nc1pa1
Component1s a synthet1c Ya1ue of the scho1ast1c ab111ty of an exam1nee and−that the
second.and.th1rd,Pr1nc1paI Component mc1udes1nformat1ons about h1s natura1apt1tude
for11bera1arts or sc1ence
1.ま え が き
じめ各大学で研究が進められている。今回は,共通1次
の各教科の得点,2次試験の得点および高校成績を主成
入学試験,就職試験などでは,受験者の資質,適性を
分分析し,第1,第2,第3主成分の内容を調べ,主成
代表すると思われる種々の特性値を測定し,終局的には
分スコアの組み合わせによって順次づけを行い,どのよ
それらを1つの総合特性値に要約し,その大小によって
うな組み合わせを使えば大学での順位が予測できるかを
順位をつける場合が多い。大学入試においても,共通1
検討した結果を報告する。
次試験の各教科の得点,2次試験の得点および高校成績
を特性値とし,その各々に,適当と思われる重みを乗じ
2.標準得点と主成分スコアの算出法
て合計した値を総合特性値として順位づけを行っている
ことが多い。このような手段によって選抜され入学した
κ人の受験生中{番目の人の科目尾の得点を棚と
学生の中には,種々の理由で学習意欲を失い,留年した
する。(尾=1,2,...,12・’は,それぞれ共通1次の国,杜,
り退学したりする者がある。その原因の一つとして,適
数,理,英,および高校の国,社,数,理,英,ならび
性不一致による学習内容への興味喪失が考えられる。文
に2次試験の2教科に対応している。例えば”乞。は高校
科系の素質を持つ学生が理工系の学部へ入学した場合な
の国語の成績を表わす)また教科尾の平均点を扉,標
どである。素質や適性を見分けることは一回の入試デー
準偏差をσκとするとづ番目の人の教科尾の標準得点
タからは困難で,高校での進路指導が望まれるが,入試
成績や高校からの内申書の中にも適性についての情報が
ある程度含まれている筈であり,これを抽出して適正な
選抜を行う方法の検討が望まれ,大学入試センターをは
ツ眺は次式から算出される。
ツ。ド舳i似… (1)
σκ
{番目の人の第1主成分のスコアをz乞。,第2主成分の
スコアを物とし,以下同様に第12主成分のスコアを
E
32
zira
;
. CtL l
l
¥171* f}C J
>
:
; )
li
)Jl Z ;e S/
: tL; .
, z3
zil =alyil +a2yi2+ " " ' +al2yil2
z 3
zi2=bl yil +b2yi2 + ' ' ' ' ' + bl2yil2 ..(2)
;
*
CD
C
)
' 4
ak, bk, ....., Zk (k=1, 2,.....12) } ,
'{ ''+FEt Ei
f 1 tJ
)
l
lj R ) l
: Ll ; .
IJR CD k lj j
] (xiki=1
F )
:i7 h)1/}C LIV C
7-,_
i.
IC V*
)
V C
f , rkj l
)
k) (xij-3 j)
l
' *"
T
)
;
7C'
h)v
I
:
L
:I
, )
IL
> zl} x
iICFo' ' =* *' Z j
tC i I l
tL
.
FIC f ; f
: c=,
E ) :
: ) :
; '7 1* >; C
j
l
) 4
.
) z2iC f ; )
'f ',
tL
IC
C *. C )C
'
' >; .
a5 ;
1
C
z I C ) I r
L
}C5 f ; f : :
aka j
;
f :V
;
C=,
j l
fJ
rkj = " " " "(3)
C* "'
65"/, )'f*I
Tl
2 i
L
= :l
! . : :i j l 0.648 c= ); > , ・1 >
)FFllC
tL
zil2=1lyil +12yi2+ ' ' ' ' ' + Il2 yi 12
-
i .
:{
)
, ) I
) I lE a5;
.
Lf
l'
: (・2
***'1
:
: ) ! F l:
.
IJ R
i
) l rf
' :I
;/7J fFI ICl
3.
E
r
---.t : *"
(a)
{L i x
:/7J
)/7J
fCI
i tJ
.
=
t :V .
z 2;
O) ! R
534
1i 1(J- { 1.
) ;
.
( ) 7 ;i :
R )
lcl)V C ) +
i7 h)v
fc
I
.
I i
1
j
llcl
) i:
tL;
・ 2
j
:f r :
)=
c=a5 ;
;
>;
.2, ・3l
J
o' '
i '
l
:
Ic z lec}
38
)
)
) ' 3l
zl z2
' =" c=,
V*.
!
1L
x '
tL > '71* >;
4 . 56
2 . OO
1 . 22
o . 380
O . 167
O . 101
.
49 ilC
i 3i 1C ' I >
Z3
I
h )v ( E
'7 1* ) i
I
zl z2
・4
c= ) i ff f :
:
>
f
L, z3
:T}
; ( .
]
)
j
z4
c
)
f..*V C
!
. : c
534 ;)
F
!:
4
=
z3
O . 316
O . 466
o . 290
O . 349
O . 318
- 0.170
o . 534
O . 450
- 0.187
O . 244
O . 506
o . 509
0.246
0.237
0.342
0.250
0.333
- 0.205
- 0.348
o . 757
O . 178
o . 692
- 0.135
o . 775
O . 249
o . 699
O . 255
O . 320
- 0.156
O . 310
O . 251
O . 372
O . 239
=o
O . 363
O . 355
O . 340
O . 324
O . 328
-
z3
; . C
- 0.334
- 0.324
o . 345
O . 558
0.348
0.335
0.484
0.354
0.472
- 0.227
- 0.384
O . 545
O . 453
- 0.172
o . 663
O . 355
O . 411
o . 726
-
}
lC ; . (C )
O . 205
! F
*F,
= l l
r=
=J
l
i
5 IC'I ICl 39.4"/., '2}C} l5.4"/..
o . 447
O . 250
:+
1:
f
O . 498
O . 218
2
l
* CD '-'-'.--'+ :
- 0.303
- 0.294
:
: )
: )a:) ;
z2
A
2
<,
)
o . 503
O . 316
= :
![C
zl
O . 233
:
z 3l
o . 378
O . 355
U
0.674 a:);
h )v
O . 177
:
'"=**
) : :e J :V* > 1
u<f : ) Cl)・3} lE;
1:
z3 C} l2.6"/. )'p ; 1
p l
: : , ・31C f ;
L; .
(b)
l ; :
"
: >.tC) )
!: f :; .
;
'tL 'tL16.7"/., 10.1"I. ai)
2
}
.
5J C
: ); rtL}
z 3cD I F :4 r : )
>
) : J , :_e
)
**
2, i 3E : * ( TZ1, '2,
:
< ,
;!F"; , c
)
[J ) l
:1 J i; < t :V
7l l;
O . 196
- 0.149
O . 275
野 坂 弥 蔵
33
Z3
O. 6
h
Oy
05
O 2 ; :t+',l
o. 4
o. 3
o. 2
O1
O. 5 -0.4 -O. 3 -O. 2 -O. 1
一05
O o. I O. 2
o. 3 o, 4
o. 5
06
Z2
-O. 1
O r""{i:_[1!
O r"'
LL
2 Il{] o of
-o. 2
-o, 3
+01 o f E l
O
-o. 4
-o. 5
図1 z2とz3の因子負荷量(文系534名)
ための情報損失は約33%である)
第3表 固有値と寄与率(理系49名)
z1に対する固有ベクトルと因子負荷量は(a)の場合と
z 1
同様な傾向を示すので,z1は,高校成績に重みを置い
た学力の総合評価値であると考えられる。
z2とz3の因子負荷量の関係を第2図に示す。これを
z2
z 3
z4
固有値
4,73
1,84
1,51
1,05
寄与率
0.394
0.154
0.126
0.087
見て分かることは次の4つである。
① z2について(a)の場合と異なる点は,国語と社会
(c)教育系受験者428名についての計算結果
の因子負荷量が高校成績のそれと同様に負になることで
ある。高校成績の因子負荷量はz3についても負になる
第4表にz1からz3までの固有値と寄与率を示す。こ
ので,入試成績と高校成績とが全く異質の量であると云
れから分かるようにz1には41.9%,z2には12.3%,
える点は(a)の場合と同じである。
z3にはO.8%の情報が含まれ,z3までの累積寄与率は
② 数学,理科,英語の入試成績が良くて,国語,杜
O.625である。
会の高校成績が芳しくない理工系素質の人のz2は正で
z1に対する固有ベクトルと因子負荷量は(a),(b)の場
大きい。
合と同様な傾向を示すので,z1の意味も(a),(b)と同様
⑧ z3についての因子負荷量は,入試関係は正で,
である。ただ,教育系受験者の中には文系,理工系,芸
高校関係は負である。この点は(a)の場合のz2と同じ傾
術糸,体育糸の人が混在していることと,2次試験が学
向である。
科ではなくて小論文などであることが原因と思われる
④ 入試で,国語と社会が良くできた人のz3は正で
が,z1に約42%の情報が集中し,代りに・2,z3の情
大きい。従ってz3のスコアが大きい人は文系の素質を
報がやや減っている点が(a),(b)の場合と異なっている。
持つと考えられる。
z2とz3の因子負荷量の関係を第3図に示す。
主成分分析による入試成績の順位づけシミュレーション
34
Z3
o
o
O. 8
L
:*I
o. 7
o. 6
o. 5
O. 4
o. 3
O. 2
o
O. 1
H
-o
o.
:LL
- o. 5
,o 2
Or" ' l'-Q[ ] 0.4 -0.3 -O 2 O 1
o
一〇
O. 1
o. 2
o. 3
5 Z2
o
-O. 1
T :, I[11 r IJ!J・_
-o. 2
-O. 3
o
1:'f' H * r :' j
t
-o. 5
図2 z2とz3の因子負荷量(理系49名)
これを見て分かることは次の4つである。
① z2については(a)の場合と同様に高校成績の因子
(d)まとめ
負荷量は負になっている。従って入試成績と高校成績と
上記(a),(b),(c)をまとめると次のようになる。
は全く異質のものであると云える。
① 第1主成分z1は入試成績(1次と2次),および
② どちらかと云えば国語,杜会の得意な文系の人の
高校成績を総合した学力の特性値であるが,高校成績に
z2スコアは正で大きい傾向はあるが,余り明瞭ではな
重点が置かれている。またz1には入試および高校の内
申から得られる情報の33∼42%が含まれている。
い。
.③ z3の因子負荷量から見ると,共通1次の成績と
② 学科目による入学試験成績と,内申書より算出さ
高校成績と,2次試験成績という3つの異質な群に分か
れる高校成績および学科目以外による入学試験成績(論
れる。
文など)の3者は異質のものである。
④ 2次試験成績が良かった人の・3スコアは負で値
⑧ 第2および第3主成分z2とz3は受験者の素質が
は大きい。
文科的か理工科的かを見分けるのに役立つ量と考えられ
るが,その特徴は一定せず集団によって異なる。
第4表 固有値と寄与率 (教育系428名)
z1
z2
z3
固有値
5,02
1,48
1,00
寄与率
0.419
0.123
0.083
4.主成分による順位づけシミュレーション
主成分は素材となるデータに含まれる特性を鮮明にす
るため,それを先ず標準化することによって測定単位な
野 坂 弥 蔵
35
Z3
o. 4
o
I ]o
o. 3
o. 2
・f '
:o
O. 1
1*o
]o
o 4 o 3 -0.2
o
- o. 5
C O
O
-- - .'1 l rr ] _
':J
- O. 1
O1
o. 2
o. 4
o. 3
05
06
O. 7
Z2
- O. 1
tii'i r ,1 7 :
- o. 2
- o. 3
O
- o. 4
A
l
1
]
- o. 5
- o. 6
o
- o, 7
rf
図3 z2とz3の因子負荷量(教育系428名)
どの影響を除外したデータに変換した後,各データに乗
ずる係数を,それらの係数の2乗の和が1になり,且
12Σ見&
1=・ 3(〃十1)
ρ=。(η・一1)一ト1 (5)
つ,各主成分の間には椙関がなく,分散が最大になると
云う条件から算出したものであり,前記の例で分かるよ
ここで〃は受験生の総1数であり馬と8乞は入試順
うに第1主成分z1に可成りの情報が集中しているから,
位,主成分順位または高校順位の中のいずれか2つであ
z1の大小によって、順位をつけても良いが,受験者の素
る。
質が文系であるか理工系であるかを示す情報を含んでい
第5表には文系,理系,教育系について計算したρ
るz2やz3を加味した方が一層適切な順位が得られるで
を示す。但し主成分順位を求める時に閉中のo。=1,
あろうと考え,づ番目の受験生が得たz1,z2,z3の
62=63=Oとしてある。
スコアZε1,吻,物に,係数6エ,62,63を乗じて加え合
第5表を見ると,入試順位と高校順位の相関は大きく
わせて得られる値閉の大小で順位をつけることにす
る。
ωj=o1助1+02助2+63的3・…・・…(4)
(a)各種の順位間の相関係数
ないが,主成分順位は入試順位または高校順位との相関
が大きく,特に高校順位との相関が大きい。
第5表順位相関係数
共通1次試験および2次試験の各教科得点の単純な合
計による順位(入試順位と略称),主成分の重みつき合
文 系
理 系
教育系
(534名)
(49名)
(428名)
主成分順位と高校順位
O.851
O.904
O.914
校成績伽(尾:6,...,10)の合計による順位(高校順位
主成分順位と入試順位
O.701
O.729
O.758
と略称)との間のスピアマンの相関係数ρを次式より
入試順位と高校順位
O.314
O.439
O.509
計である閉による順位(主成分順位と略称)および高
計算した。
主成分分析による入試成績の順位づけシミュレーション
36
詰6表 大学f1頂位と,入学試験時点での順位の関係
J
H
I
G
9
8
7
6
10
1
6
4
3
3
5
7
8
8
5
8
/lL+
5
:
4
J[
7
*
3
"
/iL1+'
2
)
Jl
9
' b
D
2
1
)
F
A
E
l
C
:
B
l:'F- 4'
10
6
2
4
1
10
9
8
7
5
4
2
10
61=1,o。:6。;Oとした場合と,61二1,6。=一〇.3,
6ドー0.2とした婦合に対応している。
この表から,大学順位と比較的よく一致するのは主成
分順位であって,入試順位は余り合わないことが分か
る。尚,10名の出身高校は異なるのが多いが,格差に対
する配慮はしてない。
5.む す び
入試および高校成績を主成分分析して第1∼第3主成
分の持つ情報を明らかにし,それを考慮に入れた総合特
性値の大小から主成分順位を求めたところ,主成分順位
は高校順位との相関が高いことが分かった。また教育系
428名の受験者中,大学に入学した10名につき大学順位
と入学試験時点での順位とを比べて見ると,主成分順位
が良く一致するという結果を得た。しかし,データが少
数である上に大学順位の正しさにも問題があるから,主
成分順位が入試順位より妥当であると速断はできない
が,今後更に多くのデータを用いて検討して行く価値は
あると思われる。
入試データの統計処理について種々御指導いただきま
した電気通信大学熊本芳朗教授,高知大学野町幸男教
授,鹿児島大学永田昭三教授,山梨医科大学平野光昭教
授を初めとする入試,入研関係の多くの教官,事務官の
8
で主成分順位1,主成分順位2としてあるのは,閉の
係数を
9
高校順位との関係を示したのが第6表である。この表
7
大学での学習成績や人物評価を総合して定めた順位(大
学順位と略称)と入学試験時の入試順位,主成分順位,
5
教育系428名の受験者申,大学に入学した10名につき
4
相関
6
・’b)入試順位,主成分順位,高校順位と大学順位との
方々に厚く感謝いたします。
6
3
1
7J'*J[ fiL+' 2
3
yJ'*i[ 4 L** l
2
1
E
10
参 考 文 献
河口至商:多変量解析入門 森北出版
奥野忠一他:多変量解析法 日科技連
竹内 啓:入学試験成績の分析における相関係数の意
味について