日心第71回大会 (2007) 促音と非促音の知覚範疇境界 ○天野成昭・麦谷綾子・小林哲生（日本電信電話株式会社，NTT コミュニケーション科学基礎研究所） Key words: 促音音声知覚音声生成はじめに Hirata & Whiton (2005)は促音と非促音の生成における範疇境界を，促音あるいは非促音の閉鎖区間長を単語長で割った値(closure-word ratio, CW 比)の観点から調べた。彼らは促音と非促音の生成範疇境界の CW 比が発声速度によらず不変であり，その値が 0.35 であることを明らかにした。音声の生成と知覚は密接に関係している(例えば Miller, Green, & Reeves, 1986)ことから，生成において不変である CW 比が知覚においても不変である可能性が考えられる。そこで本研究では，促音と非促音の知覚における範疇境界に関し，CW 比が発声速度によらず一定となるか，またその値は 0.35 に一致するかについて調べた。これまでの研究によって，促音と非促音の知覚を規定する主な要因は閉鎖区間長であること(福井,1978)，促音と非促音の知覚範疇境界に対し，閉鎖区間に先行する母音の時間長は強い影響を及ぼすこと(渡部・平藤, 1985)，しかし閉鎖区間に後続する母音の時間長は影響を及ぼさないこと(平藤・渡部 1987)が分かっている。また発声速度の変化は主に母音長の変化によってもたらされること(比企・金森・大泉, 1967)も分かっている。これらの先行研究を踏まえ，本研究では閉鎖区間長を変化させて促音と非促音の刺激を作成し，また先行母音の時間長を伸縮させて発声速度を制御した。 Closure-word Ratio 実験被験者：20-39 歳(平均 25.4 歳，標準偏差 0.74 歳)の日本人 40 名(男女各 20 名)を被験者とした。刺激：2 モーラ頭高型アクセントの原音声 5 種(/bipa/, /guku/, /kuku/, /kuto/, /tapi/)をナレーターに発声させ，デジタル録音した。この原音声から促音-非促音の刺激連続体を作成するために，閉鎖区間長を 10ms ステップで 21 段階に変化させるとともに，高品質音声分析合成法 STRAIGHT(Kawahara, Masuda-Katsuse, & de Cheveigne, 1999)を用いて閉鎖区間に先行する母音の時間長を 50%, 100%, 150%に伸縮し 315 刺激を作成した。なお予備聴取の結果に基づいて，原音声から変化させる閉鎖区間長の範囲は，時間伸縮率 50%, 100%, 150%の順に -60ms～140ms, -20ms～180ms, 20ms～220ms とした。実験手続き：被験者毎にランダム順とした 1575 刺激(315 刺激×5 回繰り返し)をヘッドホンで被験者に両耳呈示し，コン 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 Time-stretch Rate 50% 100% 150% /bipa/ /guku/ /kuku/ /kuto/ /tapi/ Stimulus Figure 1. 促音と非促音の知覚範疇境界におけるＣＷ比。点線は生成範疇境界におけるＣＷ比を表す。ピュータの画面上に表示した促音と非促音のボタンのいずれかをマウスでクリックさせ，二肢強制選択を行わせた。結果と考察閉鎖区間長を独立変数 x とし，促音の反応確率，すなわち促音と判断された試行数を総試行数で割った値を従属変数 y として，ロジスティック関数で回帰を行なった。この関数上で y=0.5 の反応確率点に対応する閉鎖区間長 x の値を各刺激種における促音と非促音の知覚範疇境界とした。この知覚範疇境界から求めた CW 比を Figure 1 に示す。刺激(5 種)×時間伸縮率(3 種)の２要因分散分析の結果，刺激の要因は有意であった[F(4,8) = 72.7, p < .0001]。しかし時間伸縮率の要因は有意ではなかった。従って知覚範疇境界の CW 比は刺激に依存して値が異なるけれども，刺激内では時間伸縮率すなわち発声速度には依存せず一定であるといえる。時間伸縮率が 50%から 150%という広範囲に及ぶにもかかわらず，刺激内で CW 比が一定となったことは，生成と同様に知覚においても CW 比が発声速度の変化に対して，かなり頑健な不変量である可能性を示唆している。ただし刺激間で CW 比に差が生じる原因については今後の検討が必要である。知覚範疇境界の CW 比の平均値は，生成範疇境界の CW 比 0.35(Hirata & Whiton, 2005)と有意に異なっていた[t(15) = 5.34, p < .0001, 両側]。よって知覚と生成の CW 比は一致しないといえる。 CW 比が知覚と生成で一致しない原因は今後の検討が必要である。可能性としては，Hirata & Whiton (2005)ではキャリアセンテンスを使用しているのに対し，本研究ではそれを使用していないこと，および本研究では先行母音の時間長のみを変化させ，後続母音を含むその他の音韻の時間長を変化させていないことなどが原因として考えられる。引用文献福井誠二 (1978). 日本語の閉鎖音の延長・短縮による促音・非促音としての聴取音声学会会報, 159, 9-12. 比企静雄・金森吉成・大泉充郎 (1967). 連続音声中の音韻区分の持続時間の性質電気通信学会雑誌, 50, 849-856. Hirata, Y., & Whiton, J. (2005). Effects of speaking rate on the single/geminate stop distinction in Japanese. The Journal of the Acoustical Society of America, 118, 1647-1660. 平藤暢夫・渡部真一郎 (1987). 促音の知覚と後続母音の持続時間との関係音声言語, 2, 99-106. Kawahara, H., Masuda-Katsuse, I., & de Cheveigne, A. (1999). Restructuring speech representations using a pitch-adaptive time-frequency smoothing and an instantaneous-frequency-based F0 extraction: Possible role of a repetitive structure in sounds. Speech Communication, 27, 187-207. Miller, J. L., Green, K. P., & Reeves, A. (1986). Speaking rate and segments: A look at the relation between speech production and speech perception for voicing contrast. Phonetica, 43, 106-115. 渡部真一郎・平藤暢夫 (1985). 二音節語における無声破裂音と促音の判断境界と先行母音の長さの関係音声言語, 1, 1-8. (AMANO Shigeaki, MUGITANI Ryoko, KOBAYASHI Tessei)