JACETSOOOとTOEICの相関性:TOEICミニコーパスを使っての数量的検討

JACETSOOOとTOEICの相関性:TOEICミニコーパスを使っての数量的検討
水本篤(立命館大学大学院)
1.はじめに
本研究では,JACET8000が,TOEICの実際の問題を含める108,945語のTOEICミニコー
パスにおける語棄リストをどれだけカバーしているのか,作成したTOEICミニコーパスと
JACET8000のデータ,そしてアルク社のSVLリストを比較したものを報告したい.
2.研究の順序と方法
2.1TOEICの問題文108,945語を,過去に公開された問題,公式ガイド&問題集や,その
他,市販のTOEIC教材の中で,Part5,6,7(文法・語棄・リーディングパート)の実際の
問題に出来るだけ近い形の文(Part5,6では,疑問文ではない,HeやSheなどの代名
詞で始まらない,など)の基準に合ったものを集め,問題形式(4択)のものは完全な文章
の形に直して・TOEICミニコーパスを作る(Ibken:108,945/Types:10,057)ずなお,指
示文と質問文は重複を避けるために意図的に省略した.
2.2卯伽ZSmitMMSWもzlS伽aOを使い,上記のTOEICミニコーパスの語棄頻度リストを
作成する.この際,できた語棄頻度リストを染谷泰正氏のレマ・リストを使い,自動レマ化す
る
.
2.3作成したTOEICミニコーパスの語棄頻度リストとJACET8000の2つを関数を使い,対
照させる.しかし,レマ化されたリストはJACET8000のリストの見出し語に,,-s"がついただ
けのものであっても含まれていなかったものがあったので,''一s,‘s,.ed,.ing,-1y"などがそ
の特定の語棄に含まれていたらJACET8000のリストに合う形に手作業で全て修正した.
またアポストロフィーの付いた語は,縮約形の元の形に還元し(it,s→itとbe,you,Ⅱ→you
とwmなど),アルファベット1文字からなる1文字語もリストから削除し,語頭が大文字で
始まる固有名詞や形容詞も最終的に削除した.これによって,TOEICミニコーパスの語
棄頻度リスト収録語棄の設定がJACET8000における語の定義と同じになるように設定
する.(最終語棄頻度リスト総数:5,608語).最後に基本語棄のカバー率を考え,より精密
さを高めるために"JACET8000plus250,'もJACET8000リストに加えて分析を行った.
同時に,アルク社の設定したSVL(StandardVbcabularyList)の12000語を語黄の難
易度を測る基準として比較に用いた.
3.結果
3.1TOEICミニコーパスの語章頻度リストの5,608語のうち,JACET8000収録の見出し語
8,000語では4,378語がカバーできていた(全体の77%).TOEICミニコーパスにおけ
る頻度1のものを外してみると,TOEICミニコーパスの語棄リストの3,798語のうち
JACET8000は3,408語をカバーし全体の90%となる.
−60‐
3.2JACET8000でカバーできていなかった語で,TOEICミニコーパスの語黄頻度リストにお
いて頻度が10回以上のものは,頻度の高い順に以下のものである(カッコ内の数字は頻
度を表す).
merchandise(29)Cooperation(13)
p
a
c
i
f
i
c
(
1
1
)
i
n
c
(
2
7
)
C
O
(
1
3
)
s
t
o
c
k
h
o
l
d
e
r
(
1
1
)
CEO(19)
o
v
e
r
s
e
e
(
1
2
)
c
o
m
p
t
r
o
l
l
e
r
(
1
0
)
thousand(17)
c
o
m
(
1
2
)
l
t
d
(
1
0
)
r
e
i
m
b
u
r
s
e
(
1
6
)
complimentary(12)zoom(10)
n
o
n
(
1
5
)
u
p
c
o
m
i
n
g
(
1
2
)
g
a
s
o
l
i
n
e
(
1
3
)
i
n
v
o
i
c
e
(
1
1
)
3.3アルクの設定したSVL12000語リストのうち,「3000語レベル」までの語蕊で,TOEICミニ
コーパスの語棄リスト(頻度1のものを除く)3,798語のうち1,975語(52.0%)を,
JACET8000では順位リストの「3000位」までの3000語で1,992語(52.4%)をカバーし
ていた.その1,992語のうちの332語は,SVLでは4000語以上レベルのものであった(内
訳は4000語レベル−229語,5000語レベル−72語6000語レベル−20語,7000語
レベル−1語,8000語レベル−4語,9000語レベル−1語,リストに含まれないもの−5
語).
4.おわりに
上記の結果からJACET8000は本研究で対象となったTOEIC語棄に対しても高い相関
性があると言える.特に,TOEICミニコーパスにおける頻度1の語を外したときに90パ
ーセントの語棄についてカバーしていたという事実によって,JACET8000がTOEICの
試験対策の語棄リストとしても非常に有効であるということが言える.カバーできなかっ
た語棄に関しても,略語など,JACET8000に収録されている語の定義から外れるものが
多かったことが,カバー率を下げた一つの要因であろう.その他のカバーできなかった語
も,多くのものが接頭語,接尾語,派生語などの知識を身につけていれば推測が出来るも
のであるので,JACET8000を使ったTOEIC試験対策の語糞指導の際には,それらの知
識を学習者が身につけることが出来るよう心がけなければならない.またJACET8000は
順位設定もSVLの語蒙レベル設定に近く(3000語まで),TOEICにおいて重要な語棄が
上位から並んでいるという観点から,TOEIC受験者が順に学習していくのにはふさわし
いものだと結論づけられる.ゆえにJACET8000のこれからの課題を挙げるならば,この
語章リストを学習者が活用していく方法をどのように提供していくかという点であろう.
−61‐