並列マルチメディア・コーパスと * 対照言語行動研究 -指示代名詞「コレ」と‘이것(yi-geot)’の発話時を例に- 1) 孫 栄 奭** <目 次> 1. はじめに 3. 指示代名詞「コレ」と‘이것’ 2. マルチメディア・コーパスの並列化 3.1. 問題のありか 2.1. 収録番組の概要 3.2. 直示用法の再定義 2.2. 文字化テクストの作成単位 3.3. 調査結果 2.3. 文字化テクストと映像との同期単位 3.4. 結論 2.4. 番組・話者情報の搭載 4. まとめと今後の課題 2.5. 対訳情報の搭載 Key Word : 直示(deixis), 指示代名詞(demonstrative pronoun), 言語行動(Language Behavior), 対照研究(Contrastive Study), 並列コーパス(Parallel Corpus) 1. はじめに 筆者は、日本語と韓国語における言語行動を比較するため、テレビ放送を 資料に、これまで「日本語対談番組のマルチメディア・コーパス」と「韓国語対 談番組のマルチメディア・コーパス」の、2種類のコーパスを作成してきた。 * This work was supported by the National Research Foundation of Korea Grant funded by the Korean Government(NRF-2013S1A5B5A01030202) ** 済州大学校講師, 日本語学・コーパス言語学 56 日本言語文化……第35輯 マルチメディア・コーパスとは、「話し手の発話(音声)を文字化したテク ストとその発話場面の映像とをコンピュータ上で同期させ、文字化テクスト 上の文字列(単語など)を検索すると同時に、その発話時の映像・音声をも参 照できるようにしたコーパスのことである」(石井・孫2013)。そしてその最 大の特徴は、発話場面の映像(音声を含む)を参照することによって、話し手 と聞き手のコミュニケーション行動をまるごと観察できるという点にある。 一例として손영석(2015a)は、「日本語対談番組のマルチメディア・コーパ ス」(以下、「日本語対談番組コーパス」)と「韓国語対談番組のマルチメディ ア・コーパス」(以下、「韓国語対談番組コーパス」)を使って、「私たち」・「僕 ら」・‘우리(uri)’・‘저희(jeohui)’などの一人称複数代名詞を検索し、その発話 場面の映像から、これらを話すときの、話し手の視線のありかについて調べ ている。 しかし、調査・分析の過程でさまざまな問題に直面しており、その主な原 因は、コーパス間で情報の付与方法が異なっていたり、片方のコーパスにあ る情報が欠けていたりしたことにあったといえる。 たとえば「日本語対談番組コーパス」では、ツールとして利用したマイクロ ソフト社“Excel”の行ごとに一文を入力し、文字化テクストと発話場面の映 像との同期も行ごとに行っているので、コーパスで検索を行うと、発話場面 の映像が文単位で参照できる。だが、「韓国語対談番組コーパス」では、話者 交替を基準に文字化テクストを作成しており、交替なしに一人が続けて話す 場合は、(1)のように複数の文章がExcelの一行に入力されてしまうという問 題があった。 (1) 그렇습니다. 그 우리나라에 뭐 외환사정이라고 그러면 우리의 그 기초 생필 품인 생필품 석유 그 다음에 식량인 (中略) 생활물자 전체를 미국 원조 아니 고는 우리 그 경제를 꾸려나갈 수 없을 때였습니다. 그리고 우리 수치상으로 도 수출은 없는 거지요. 근데 뭐 조금 우리가 수출을 해 가지고 외화를(中略) (한국현대사증언) そして発話場面の映像も、これらの複数の文章にまたがり再生時間が長く
© Copyright 2024 ExpyDoc