PowerPoint プレゼンテーション

小学館コーパスネットワーク
機能説明
株式会社ネットアドバンス
• 各種機能
1.語句検索
KWIC表示
2.品詞検索
語句集計
表示設定
ソート
サブコーパス
ソート
表示変更
ダウンロード
表示設定
ソート
サブコーパス
共起結果
3.共起検索
表示設定
4.単語リスト
ダウンロード
単語リスト結果
ダウンロード
1
1.語句検索
検索語(句)を入力する。最大100文字迄。
検索語(句)の位置指定。文頭または文末。
基本形で検索するにチェックを入れると、活用形も
含んだ結果を得ることができる。ただしその場合、
検索語は原形で入力する必要がある。
例)
is, are, was, were を検索する場合 → be
have, has , hadを検索する場合 → have
アスタリスクを使って離れた2語を検索する場合に、その
間の語数を指定することができる。
例) 「too * to」
「2」語以内の場合は「*」に最大2語まで含まれる文章が
検索される。
検索結果上限数やレイ
アウト、表示内容を設定
することができる。
検索対象となるサ
ブコーパスを指定
することができる。
例)Spoken
検索結果の並び順を指
定することができる。
2
2.品詞検索
• 単語の品詞を指定して検索できる
一単語に複数の品詞がある場合に特定の品詞をすることが可能
例) 形容詞のcompleteを検索
• 表記形、基本形のどちらかに入力する必要有
• 検索語は1語だけ指定可能
3
3.共起検索
検索したい単語(一つだけ)を入力する。
基本形で検索するにチェックを入れると、活
用形も含んだ結果を得ることができる。ただ
しその場合、検索語は原形で入力する必要
がある。
例)
is, are, was, were を検索する場合 → be
have, has , hadを検索する場合 → have
検索したい単語の品詞を指定する場合に、品詞コードを入力する。この例で
は名詞(N..)を指定している。
共起する単語の品詞を指定する場合に、品詞コードを入力する。この例で
は動詞(VB.*|VD.*|VH.*|VV.*)を指定している。
右側にある「?」のリンクから品詞コードの一覧を表示して、該当する品詞の
箇所をクリックすることで入力欄に品詞コードを入力できる。
検索結果に表示される共起語を並べる順番を
指定する。
・共起頻度
― 単純な共起回数
・Tスコア
― 2単語の結びつきが強い
ものが上位に並ぶ(T検定)
・M.I.スコア ― 頻度が低くても結びつき
の強いものが上位に並ぶ
・LogLogスコア ― M.I.スコアの改良版
4
3.共起検索 ― 具体例
名詞のhandと共起しやすい動詞の一覧
•
•
•
•
go hand in hand with
get out of hand
shake hands
change hands
協力する、提携する
手に負えなくなる
握手する
所有主が変わる
名詞のhandと共起しやすい形容詞の一覧
•
•
•
•
close at hand
ready to hand
on the other hand
helping hand
すぐ近くに
手の届くところに
一方
手助け
5
3.共起検索 ― 具体例
名詞のheadと共起しやすい動詞の一覧
• shake one’s head
首を横に振る
その他の例
• 名詞のmoneyと共起しやすい動詞は?
• 名詞のtimeと共起しやすい動詞は?
• advanceと共起しやすい単語は?
• coffee, tea, beer, wine と共起しやすい単語は?
6
4.単語リスト
• 単語に対してどのような品詞がつけられているのかを検索できる
例)take ― 完全一致
該当箇所が青色でハイライトされる
7
KWIC表示
「give up」を「基本形で検索」にチェックをいれて検索した結果画面。検索語部分のリンクをク
リックすると本文を閲覧することができる
検索結果のデータをダウン
ロードすることができる。
検索結果から前後に出現する単
語を集計することができる。
ここでは「give up」の直後に出現
する動名詞を集計している。
8
具体的な使用例
• ある句動詞と対応する同義語の口語・文語での出現割合を調べる
例) put up with と endure
1.「語句検索」で口語のサブコーパスを指定します。
2.検索語を入力して基本形で検索にチェックを入れて検索を行い、総件数の
右側に表示される100万語当たりの出現回数を調査します。
100万語あたりの出現回数
9
3.「語句検索」画面に戻り文語のサブコーパスを指定します。
4.検索語を入力して基本形で検索にチェックを入れて検索を行います。
100万語あたりの出現回数
5.1~4を調査対象の語(句)に対して繰り返します
10
結果
右の表から「put up with」は口語で用いられ易く、 put up with
「endure」は文語で用いられ易いことが分かります。 endure
Spoken Written
9.62
5.55
1.96
10.54
※100万語あたりの出現回数
他の句動詞について調べてみると下記の通りとなり、句動詞は同義語に比べて口語に
おいてより用いられ易いのではないかと推測することができます。
100万語あたりの出現回数
Spoken
Written
35.00
take after
2.30
1.66
30.00
25.00
resemble
1.19
17.90
20.00
put off
4.77
5.05
15.00
postpone
1.87
10.07
10.00
do away with
6.05
2.28
5.00
abolish
4.26
18.18
0.00
get over
18.06
5.14
overcome
10.14
32.94
Spoken
Written
参考
コーパスによる英語句動詞研究 ― 谷明信、堀池保昭、杉森直樹、冨田かおる
http://repository.hyogo-u.ac.jp/dspace/bitstream/10132/699/1/AN100669640160003.pdf
11
【お問い合わせ】
株式会社ネットアドバンス
小学館コーパスネットワーク事務局 三浦 伸子
〒101-0051東京都千代田区神田神保町2-30 昭和ビル3F
TEL: 03-5213-0872 FAX: 03-5213-0876
E-mail: [email protected]
12