並列マルチメディア・コーパスと 対照言語行動研究*

並列マルチメディア・コーパスと
*
対照言語行動研究
-指示代名詞「コレ」と‘이것(yi-geot)’の発話時を例に-
1)
孫 栄 奭**
<目 次>
1. はじめに
3. 指示代名詞「コレ」と‘이것’
2. マルチメディア・コーパスの並列化
3.1. 問題のありか
2.1. 収録番組の概要
3.2. 直示用法の再定義
2.2. 文字化テクストの作成単位
3.3. 調査結果
2.3. 文字化テクストと映像との同期単位
3.4. 結論
2.4. 番組・話者情報の搭載
4. まとめと今後の課題
2.5. 対訳情報の搭載
Key Word : 直示(deixis), 指示代名詞(demonstrative pronoun), 言語行動(Language Behavior),
対照研究(Contrastive Study), 並列コーパス(Parallel Corpus)
1. はじめに
筆者は、日本語と韓国語における言語行動を比較するため、テレビ放送を
資料に、これまで「日本語対談番組のマルチメディア・コーパス」と「韓国語対
談番組のマルチメディア・コーパス」の、2種類のコーパスを作成してきた。
* This work was supported by the National Research Foundation of Korea Grant funded
by the Korean Government(NRF-2013S1A5B5A01030202)
** 済州大学校講師, 日本語学・コーパス言語学
56 日本言語文化……第35輯
マルチメディア・コーパスとは、「話し手の発話(音声)を文字化したテク
ストとその発話場面の映像とをコンピュータ上で同期させ、文字化テクスト
上の文字列(単語など)を検索すると同時に、その発話時の映像・音声をも参
照できるようにしたコーパスのことである」(石井・孫2013)。そしてその最
大の特徴は、発話場面の映像(音声を含む)を参照することによって、話し手
と聞き手のコミュニケーション行動をまるごと観察できるという点にある。
一例として손영석(2015a)は、「日本語対談番組のマルチメディア・コーパ
ス」(以下、「日本語対談番組コーパス」)と「韓国語対談番組のマルチメディ
ア・コーパス」(以下、「韓国語対談番組コーパス」)を使って、「私たち」・「僕
ら」・‘우리(uri)’・‘저희(jeohui)’などの一人称複数代名詞を検索し、その発話
場面の映像から、これらを話すときの、話し手の視線のありかについて調べ
ている。
しかし、調査・分析の過程でさまざまな問題に直面しており、その主な原
因は、コーパス間で情報の付与方法が異なっていたり、片方のコーパスにあ
る情報が欠けていたりしたことにあったといえる。
たとえば「日本語対談番組コーパス」では、ツールとして利用したマイクロ
ソフト社“Excel”の行ごとに一文を入力し、文字化テクストと発話場面の映
像との同期も行ごとに行っているので、コーパスで検索を行うと、発話場面
の映像が文単位で参照できる。だが、「韓国語対談番組コーパス」では、話者
交替を基準に文字化テクストを作成しており、交替なしに一人が続けて話す
場合は、(1)のように複数の文章がExcelの一行に入力されてしまうという問
題があった。
(1)
그렇습니다. 그 우리나라에 뭐 외환사정이라고 그러면 우리의 그 기초 생필
품인 생필품 석유 그 다음에 식량인 (中略) 생활물자 전체를 미국 원조 아니
고는 우리 그 경제를 꾸려나갈 수 없을 때였습니다. 그리고 우리 수치상으로
도 수출은 없는 거지요. 근데 뭐 조금 우리가 수출을 해 가지고 외화를(中略)
(한국현대사증언)
そして発話場面の映像も、これらの複数の文章にまたがり再生時間が長く