インターネット・マルチプラットホーム対応の対話型音声分析システム

3
インターネット・マルチプラットホーム対応の対話型音声分析システム
三輪 譲二、△熊谷 勝、△山本 真人 (岩手大・工)
まえがき
1.
なお、インタープリタ動作により、分析速度の低下
音声分析システムは、音声信号の音響的特徴を記述
が危ぶまれたが、最近の計算機のスピードアップ化に
するため、従来から様々なシステムが開発されてきた。
伴い、 FFT によるサウンドスペクトログラム分析も、
しかし、 UNIX 上のシステムは、種類が多いという長
実時間の数倍という十分実用的な時間で処理可能であっ
所があるが、多くの人文系の研究者にとって取り組み
た。
また、 Java 言語では、アプリケーションとアプレッ
難いという欠点があった。逆に、 Windows 上のシス
テムは、文書作成等に用いられているため、人文系の
トの2種類のプログラムを記述できるが、本システム
研究者に馴染み易いという長所があるが、工学系の研
では、人文系の研究者等の利用を考慮に入れて、 Java
究者があまりシステムを作成しないため、高度な分析
開発環境 (JDK) 等の複雑な設定が不要で、一般のブラ
機能が少ない等の欠点があった。
ウザのみで実行可能なアプレットプログラムを用いた。
また、インターネット上のディジタル音声ミュージ
このため、 Java のセキュリティ上の制限により、
アム等の設置に伴い、公開する方言音声等の貴重な音
WWW サーバ上にある音声ファイルと、アプレットの
声資料を、ネットワークを経由して、利用者の要求に
存在するコンピュータのホルダー以下にある音声ファ
応じて自由に音声分析して提供できるサービスも、今
イルだけが分析可能という制限が生じている。
後は必要になってきている。
このため、ネットワーク上にある音声資源に対応で
2.2
き、かつ、 Windows、 Machintosh、 UNIX 等のマル
チプラットホームに対応できるインターネット・マル
対話型音声分析システム
これまで、我々は、パーソナルコンピュータを用い
た初心者熟練者向けの対話型音声分析システムを、最
チプラットホーム対応の対話型音声分析システム (IN-
初に第1版 [2] として開発し、次に、ノートパソコン用
SAS/M: INteractive Speech Analysis System for Multi-
のポータブル型を第2版 [3] として開発、さらに、ワー
platform) を、 Java 言語を用いて開発したので、本報
告では、そのシステム構成等について述べる。
クステーション用の第3版を開発してきた。このため、
今回開発したネットワーク・マルチプラッタホーム版
システムは、第4版となる。なお、グラフィック表示
システム構成
2.
2.1
インターネット・マルチプラットホーム対応
のための Java メソッドの体系は、第1版の GL/M に
準拠させた。
米国のサンマイクロシステムズ社で開発された Java
言語 [1] は、バイトコードと呼ばれる中間言語を用いて
いるため、インタープリタにより様々なプラットホー
ムで動作し、ネットワーク対応のプログラミングも容
分析機能
3.
3.1
全体分析ウインドウ
易であるという長所を持っている。さらに、オブジェ
図 1 の使用例に示すように、 WWW ブラウザによ
クト指向性、マルチスレッド対応化、容易なGUIの
り、音声波形ウインドウを中心にして、種々の分析結
構築性等を総合的に考慮し、本システムは、 Java 言語
果を、マルチウインドウ形式で表示できる。
を用いてシステムを記述した。
3
Interactive Speech Analysis System for Internet and Multi-platform.
By Jouji Miwa, Masaru Kumagai and Masato Yamamoto (Faculty of Engineering, Iwate Univ.).
space
スペース
図 1 INSAS/M システム分析表示例
3.2
図 1 の右上に音声波形切り出しウインドウの例を示
す。このウインドウは、指定したファイルを読み込み、
単語や文章の切り出しが主な目的であるが、談話音声
の単語長やポーズ長等の計測も可能である。
この図の例では、下部にマウスクリック点の詳細な
波形を表示し、さらに、右下部に数値データとして、
上がクリック点におけるファイル先頭からの絶対時刻、
下が始端から終端までの相対時間長を示している。な
お、これらの数値は、図 1 の左下のように、 Java コン
ソールにもテキスト形式で表示されるため、カット&
ペーストにより、文書ファイルに取り込むことも可能
である。
3.3
ホルマント周波数等の分析結果も数値として表示さ
波形切り出しウインドウ
サウンドスペクトログラム
図 1 の右下にサウンドスペクトログラムの表示結果
の例を示す。この例では、 4.5 秒分の分析結果を1つ
のウインドウに表示するようになっており、メニュー
から、 Forward コマンドをクリックすることにより、
れる。この結果は、始端フレームの分析結果を示し、
ソナグラムと同様に、 Forward、 Backward コマンド
により、後または前のフレームの分析結果を表示する
ことが可能である。
むすび
4.
本報告では、開発したインターネット・マルチプラッ
トホーム対応の対話型音声分析システムについて述べ
た。本システムは、 Java によるインタプリタ動作であ
るが、対話型音声分析として、十分実用になる処理速
度が得られた。また、このシステムのバイトコードは、
オンデマンドネットワーク型日本語アクセント音声教
育システム [4] の分析プログラムとしても利用している。
本システムは、以下の URL 等で公開する予定であ
る。
http://sp.cis.iwate-u.ac.jp/sp/INSASM/
謝辞
本研究の一部は、平成8 - 9年度文部省科学研究費補助金・
基盤研究 (A)(1) (課題番号:08551007) の補助を受けた。
次の 4.5 秒分の分析結果を表示し、 Backward のコマ
ンドにより、前の 4.5 秒分を表示することができる。
参考文献
[1] Sun Microsystems, Inc. :Java プログラミング講座,
アスキー出版局, 東京 (Oct. 199 6).
3.4
セクション
図 1 の左上にセクションとして、始端フレームの LPC
分析の結果の例を示す。この結果には、
[2] 三輪, パソコン音声処理, 昭晃堂, p.81 (July 1991).
[3] 三輪、科研費試験研究成果報告書、 (Mar. 1993).
[4] 三輪、熊谷、吉田、本講論集(Mar. 1998).