・2007年度実施項目 1)発話語に依存しない話者識別(情報源の識別技術) Accuracy and Ratio (%) →音声時間波形の狭帯域包絡線間相関を利用 使用周波数範囲を4kHz範囲で約80%の認識率 →個人性が,声帯基本周波数,副鼻腔共振周波数 ( 100 声帯音源基本周波数 男:100~150Hz(8-11) 女:250~300Hz(13-15) 80 60 第2フォルマント周波数 40 600~4kHz(19-30) 第1フォルマント周波数 200~1.4kHz(12-23) 20 0 6-14,22-31 7-11,22-31 副鼻腔共振周波数 (68-0.2k,10k-5.2k) (81-162,1.1k-5.2k) 3.1k~5.4kHz(28-31) Used Band Number 帯域番号:7-11,22-31 : used f range/all, :used band /all, :C ) ⇒発話者が男性 【今後の研究予定】 話者識別システムの実用化に向けた検討 1)音声基本周波数を活用して識別率を向上 2)重要帯域の近傍帯域での識別率調査 3)公の音声DBを用いた提案手法の有効性検証 4)重要帯域の物理要因調査 【進捗状況】 9月ASJ投稿予定 1)音声基本周波数を活用して識別率を向上 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数 ・副鼻腔共振周波数 関連しそう である 基本周波数の時間変動の平均と分散 ⇒個人を特定する特徴量になるか (小橋川の卒業研究) 作業担当者:B4 高山 現在,卒研資料の確認作業を行なっている 【進捗状況】 2)重要帯域の近傍帯域での識別率調査 個人性を多く含む重要帯域 ・6-14, 22-31 →近傍帯域での識別率調査 →ロバスト性の検証(3月ASJ) 前回,調査できなかった一部の帯域 (9-14, 22-31・10-14, 22-31)を調査 ⇒結果を3)と4)の項目で使用する 作業担当者:B4 青木 現在,作業を担当者に依頼し,調査中 【進捗状況】 9月ASJ・大学紀要投稿予定 3)公の音声DBを用いた提案手法の有効性検証 これまでは自分たちで収録した音声を使用 →追従実験が難しい →信頼性が十分ではない 公の音声DB(ETL-WD-Ⅰ&Ⅱ)を使用 →追従実験が可能 →登録話者数を増やせる(+女性10名) →提案手法の有効性が得られる 作業担当者:B4 波々伯部 現在,音声DBから識別に使用する単語を選出 →選出単語を用いて識別率を調査する 【進捗状況】 9月ASJ投稿予定 4)重要帯域の物理要因調査 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数 ・副鼻腔共振周波数 関連しそう である 鼻を塞ぎ共振特性を変えた音声を使用 (被験者:前回の音声収録者4名) ⇒識別率が下がれば関連している 作業担当者:M1 末廣 現在,音声収録の準備を行なっている 9月ASJに講演申込する物理特性要因調査について 【目的】 副鼻腔の骨形状に個人性は依存するのかを調査 【方法】 1)副鼻腔の振動を物理的に止めた音声を使用 2)鼻に詰物をした音声を使用 →止める/塞ぐ方法はどうするか? 図1 ノーズクリップ 図2 ダイビング用マスク まずは副鼻腔の振動が外部から止められるかを調べる 副鼻腔の構造 ・上顎洞 ・前頭洞 ・蝶形(骨)洞 ・篩骨洞(篩骨蜂巣) 前頭洞 篩骨洞(篩骨蜂巣) 蝶形洞 上顎洞 参考:http://www.sanada.gr.jp/clinic/lecture/paranasal1.html 鼻を塞ぐだけで副鼻腔の振動を止められるか?
© Copyright 2024 ExpyDoc