報告家庭用22.2マルチチャンネル音響再生システム松井健太郎 22.2 Multichannel Sound Reproduction System for Home Use Kentaro Matsui 要約８Kスーパーハイビジョン（８K Super HiVision）の音響方式として，22.2マルチチャンネル音響方式の開発を進めている。この方式は，空間的に配置された22チャンネルと，低音効果用の２チャンネルから構成され，３次元的な空間音響を再生するものである。また，家庭でのさまざまなスーパーハイビジョン視聴環境に対応するために，22.2マルチチャンネル音響をより少ないスピーカー数で再生する再生法の開発も進めている。本稿では，フラットパネルディスプレーに一体化された12個のスピーカーによるバイノーラル再生法を提案する。この方法を用いれば，24 個のスピーカーを設置することなく，22.2マルチチャンネル音響を体験することができる。 ABSTRACT NHK has developed a 22.2 multichannel sound system for 8K Super HiVision（8K），an ultra highdefinition TV. The system consists of 24 spatially arranged audio channels including two low frequency effect channels for reproducing threedimensional spatial sound. To respond to various viewing circumstances of SHV in homes，we have also developed several reproduction methods to reproduce 22.2 multichannel sound with fewer loudspeakers. In this paper ， we propose binaural reproduction of 22.2 multichannel sound with 12 loudspeakers integrated into a flat panel display，which makes it possible for us to experience 22.2 multichannel sound without installing 24 discrete loudspeakers. NHK技研 R&D/No.148/2014.11 45 報告１．はじめに８Kスーパーハイビジョン（以下，８Kと略称）の音響方式として，22.2マルチチャンネル音響（以下，22.2ch 音響）方式の研究を進めている。22.2ch音響方式は，視聴者を取り囲むように配置された22チャンネルと，低音効果（LFE：Low Frequency Effects）用の２チャンネルから構成され，その場にいるかのような高い臨場感と３１図ヘッドホンによるバイノーラル再生次元的な音響空間構築を実現することができる１）。８K 放送の実用化に向けて，22.2ch音響方式の国際標準化が進められている。一方，ライフスタイルの多様化に伴ってテレビの視聴スタイルも変化する中で２），多くの場合，各家庭で24個のスピーカーを配置することは困難と考えられる。従って， 22.2ch音響を，より少ないスピーカー数で，より簡易に聴取することができる再生法を選択肢として提案することクロストークは，重要な研究課題の１つである。この課題を解決する技術として，人間の聴覚特性を利用し，音像＊１を任意の位置に定位して知覚させる「バイノーラル再生法」は有力な技術の１つである。この技術を用いれば，スピーカーを置けない方向のチャンネルを音像として合成することにより，少ないスピーカー数で22.2 ２図クロストーク ch音響を再生することができる。本稿ではまず，このバイノーラル再生法を概説するとともに，人間の音像定位知覚に関する特徴量を含み，バイする再生法をバイノーラル再生法と言う。ノーラル再生法の基礎となる頭部伝達関数（HRTF： 2.2 スピーカーによるバイノーラル再生法 HeadRelated Transfer Function）の推定法について報両耳に直接信号を提示することができるヘッドホン受聴告する。次に，当所が提案する，枠型スピーカーによるでは，左右の耳のHRIRを畳み込んだ音源信号（以下，所 22.2ch音響のバイノーラル再生法について報告する。望信号）を，直接左右のドライバーユニットから再生すればよい（１図）。しかし，スピーカー受聴の場合には，ス２．バイノーラル再生法ピーカーから同じ側の耳（同側耳）への信号の伝搬に加 2.1 ヘッドホンによるバイノーラル再生法え，反対側の耳（対側耳）への音の漏洩（クロストーク） HRTFは，自由音場＊２において，「頭がない状態での頭が発生する（２図）。従って，このクロストークを抑圧し，部中心に相当する位置から頭外音源位置を経て両耳鼓膜位所望信号のみをそれぞれの耳に伝送するための補償処理が置もしくは外耳道入口までの音響伝達関数」として定義さ必要となる。この補償処理を，クロストーク・キャンセれる。または，近似的に「頭外音源位置から両耳鼓膜位置レーションと言う。３図に，２個のスピーカーによるバもしくは外耳道入口までの音響伝達関数」として定義されイノーラル再生のブロック図を示す。３図において，G る。このHRTFには，両耳間時間差やレベル差，周波数特はそれぞれのスピーカーから左右の耳までの音響伝達関＊３数，X は左右の耳に提示する所望方向のHRTF，H はク性上のスペクトラルキューなど，音像の定位知覚に関係のある多くの特徴量が含まれている。そのため，HRTF ロストーク・キャンセレーションのための制御器を表す。を測定し，音源信号に作用させることにより，すなわち入力信号 u から出力信号 y までは，次式のような関係で HRTFの時間領域表現である頭部インパルス応答表される。（HRIR：HeadRelated Impulse Response）を音源信号に畳み込むことにより，任意の方向に音像を定位知覚させることができる。このようにして生成される信号をバイノーラル信号，バイノーラル信号をヘッドホンにより提示 46 NHK技研 R&D/No.148/2014.11 ＊１到来音の方向と距離を知覚することによって得られる到来音の形象。＊２等方性かつ均質の媒質中で，境界の影響を無視できる音場。＊３音像の定位知覚に寄与すると考えられている周波数振幅特性上のピークやノッチ。 xr hrr grr hrl u hlr yr grl glr gll xl yl hll ３図２個のスピーカーによるバイノーラル再生（１）る。この場合，制御器は，離散周波数ビン＊４ごとに逆行列を計算し，逆フーリエ変換により時間領域に戻すことによって，FIR（Finite Impulse Response）フィルターとただし，して求められる。ここまで２個のスピーカーを用いたバイノーラル再生法について概説したが，これは３個以上の複数スピーカーを用いた方法に容易に拡張できる。スピーカーの数を増やすと，その数に比例して制御点の数も増やすことができる（２）ため，複数スピーカーによる制御は，聴取範囲を広げる有力な手段である。このとき（２）式は，次のようになる。制御器 H は，聴取者の耳の位置において所望信号，すなわち入力信号に所望方向のHRTFを作用させた信号が合成されるように設計される。その結果，入力信号と出力信号の関係は，（５）（３）となる。従って，制御器 H は G の逆システムとして設計される。すなわち（４）なお，制御対象となる聴取者の耳の位置を制御点と言う。この制御器の設計に関しては，さまざまなアプローチが検討されている。当所でも，畳み込み演算に基づく時間領ここで，p は制御点の数を，q はスピーカーの数を表す。域での処理３），特異値分解法による周波数領域での処理４）を検討してきた。現在は，計算時間，占有する作業領域などの計算負荷を考慮し，周波数領域での処理を採用してい＊４離散値の周波数領域成分。 NHK技研 R&D/No.148/2014.11 47 報告３．HRTFの多方向同時推定４章で述べるように，当所では枠型スピーカーを用いた複数スピーカーによるバイノーラル再生法の研究を進めている。スピーカーの数が増えるとHRTFの測定が煩雑となり，長時間を要するようになる。そこで，システム同定（10）理論＊５に基づくHRTFの多方向同時推定法を開発した。各方向のHRIRは有限長 n 次のFIRモデルで近似できると仮定する。また，m 方向のHRIRの集合を，入力を m 方向の測定信号，出力を片耳の外耳道入口で収音される信号としたMISO（Multiple Input Single Output）システムと見なす。一般に， m 入力１出力の n 次FIRモデルはとおくと，（８）式は（11）（６）と書き表すことができる。この入出力関係を満たすパラメーター θ を，最小二乗法により推定する。詳細な導出法と表される。ここで（は離散時間の時刻kにおける出力， y k）は文献５）に譲るが，１段先予測＊６に基づく評価規範（k）は正規性雑音を表す。また，x（ w i k）は i 番目の方向の入力 u（ i k）から構成される入力ベクトル，θiは i 番目の方（12）向のFIRモデルのパラメーターベクトルを表し，それぞれ次式で与えられる。を最小化するパラメーターが最小二乗推定値であり，（13）（７）で与えられる。ここで，更に，（６）式を時刻 k ＝1, 2, … N まで並べると（14）と置いた。なお，（12）式の・は２ノルム（ユークリッドノルム）を表す。従って，HRTFの多方向同時推定で（８）は，まず，推定する m 方向から測定信号を同時に印加し，左右の耳の外耳道入口で応答を収音する。次に，左右の耳と書き表すことができる。ここで Xi は各時刻における入それぞれの応答について（13）式を計算することにより，力ベクトルx（ i k）を並べた行列であり，次式で与えられる。各方向のFIRモデルのパラメーターの推定値を求める。（13）式が解を持つためには，Rが正定値行列＊７である必要がある。この条件を満たす測定信号は，以下の手順により作成することができる６）。（k）を作成し，これを１）周期 T のM系列＊８から信号 m １番目の方向の入力（９）簡単化のために，＊５対象をブラックボックスと見なし，その入出力データから統計的な手法により対象のパラメーターを算出する理論。＊６離散時間線形時不変システムにおいて，１ステップ前の時刻までに測定された入出力データに基づいた出力の予測。＊７その固有値がすべて正となるエルミート行列。＊８２値擬似ランダム系列の一種。 48 NHK技研 R&D/No.148/2014.11 スピーカーユニット６図 HRTFの測定４図枠型12スピーカー３）以下同様に，i 番目の方向の入力 u（ i k）は，i −１番目の方向の入力 ui−１（k）を時間軸上で l サンプルだけ負の方向に巡回シフトしたものとする。（18）４．枠型スピーカーによる22.2ch音響のバイノーラル再生 4.1 フラットパネルディスプレー一体型の枠型スピーカー５図高調波ひずみを低減するエッジ構造一般的なリビングルームでの８Kの視聴を考えると，スピーカーの数に対する制限に加え，部屋の広さや家具など（15）とする。ここで，周期 T は次式を満たす。により，その設置場所も制限されることが予想される２）。そこで当所では，フラットパネルディスプレー（FPD： Flat Panel Display）一体型の枠型スピーカーの研究を進めている。（16） 85型液晶ディスプレーのために開発した枠型12スピーカーを４図に示す。４図から分かるように，枠の上辺と下辺には各５個のスピーカーユニットが等間隔で配置さ２）１番目の方向の入力 u（１ k）を時間軸上で l サンプルれ，左右の側辺にはその中間位置に各１個のスピーカーだけ負の方向に巡回シフトしたものを２番目の方向ユニットが配置されている。この配置は，22.2ch音響方式の入力の前方チャンネルに対応している。枠上の各ユニットは，相互の干渉と混変調を防ぐために，独立したキャビティー（空気室）に収められている。それぞれのユニットは高い耐入力と低いひずみ特性を有しており，振動板の直径は７（17） cmと小型であるにもかかわらず，最大音圧レベルは92dB となっている。更に，５図に示すように，NHKの標準モとする。ニター用の技術であるエッジ構造を小型化して導入し，大 NHK技研 R&D/No.148/2014.11 49 報告 1 1 left right 0.8 0.6 0.4 0.4 0.2 0.2 振幅振幅 0.6 0 0 −0.2 −0.2 −0.4 −0.4 −0.6 −0.6 −0.8 −0.8 −1 50 left right 0.8 −1 100 150 200 250 300 350 400 450 500 50 100 150 200 250 300 350 400 450 500 サンプルサンプル（a）左耳（b）右耳７図スピーカーユニットから左右の耳へのHRIRの例 20 20 left right left right 0 −20 （dB） −20 （dB） −40 −40 振幅振幅 0 −60 1,000 10,000 −60 1,000 周波数（Hz）周波数（Hz）（a）左耳（b）右耳 10,000 ８図スピーカーユニットから左右の耳へのHRTFの例振幅時の高い直進性と逆共振の抑圧を実現することによとして合成される。実験によれば，水平方向のパンニングり，従来の同口径ユニットに比べ，中域で20dB程度のひと比較して，垂直方向のパンニングは前方により安定したずみ低減に成功している。虚音像を合成することが可能である。従って，上記３チャ左右の側辺にはそれぞれ２個のサブウーファーユニッンネルの合成には，各チャンネルを挟む上辺と下辺のストが備えられており，LFEチャンネルの再生により，広ピーカーユニットを用いている。側方，後方のチャンネルがり感や包み込まれ感などの空間印象を向上させるとともは，12個のスピーカーユニットを用いたバイノーラル再に，22.2ch音響の低域成分の再生により，低域音響特性を生により，規格上の所定位置に音像として合成される。聴改善している。取位置は視距離1.5H（Hはディスプレーの高さ）の１点と 4.2 フラットパネルディスプレー一体型の枠型した。このとき（４）式は劣決定問題＊11となり，解が一意スピーカーによるバイノーラル再生に定まらない。そのため，制御器を設計する際に計算する 22.2ch音響方式の各チャンネルのうち，ディスプレーの位置に重なるFLcチャンネル，FRcチャンネル，FCチャンネル＊９を除いた前方チャンネルは，枠型12スピーカー上の各スピーカーユニットに割り当てられる。一方，除外された３チャンネルは，振幅パンニング＊10により虚音像 50 NHK技研 R&D/No.148/2014.11 ＊９本特集号の解説「８Kスーパーハイビジョン音響制作システムの開発と標準化動向」を参照。＊10 隣接するスピーカーに音響信号を振り分けることにより，スピーカー間の任意の方向に音像を定位させる方法。＊11 観測の数が変数の数より少なく，変数の値を一意に決定できない問題。 1 1 left right 0.8 0.6 0.4 0.4 0.2 0.2 振幅振幅 0.6 0 0 −0.2 −0.2 −0.4 −0.4 −0.6 −0.6 −0.8 −0.8 −1 50 100 150 200 left right 0.8 −1 250 50 サンプル 100 150 200 250 サンプル（a）左耳（b）右耳９図側方から左右の耳へのHRIRの例 20 20 left right left right 0 −20 （dB） −20 （dB） −40 −40 振幅振幅 0 −60 1,000 10,000 −60 周波数（Hｚ） 1,000 10,000 周波数（Hｚ）（a）左耳（b）右耳 10図側方から左右の耳へのHRTFの例逆行列の条件数＊12が最も低くなり，制御器がロバスト＊13 となる最小ノルム解＊14 を採用している。所望信号の合成に使用するHRTF，すなわち側方や後方のスピーカーがない方位から聴取位置までのHRTFは，同制御器の設計に使用するHRTF，すなわち枠型スピーじダミーヘッドを用いて測定した。同時推定は困難であるカー上の各スピーカーユニットから聴取位置までのHRTF ため，測定信号には，信号長217サンプル，サンプリングは，３章で述べた同時推定法により求めた。当所の音響周波数48kHzのLogTSP（Logarithmic TimeStretched 無響室での測定の様子を６図に示す。枠型12スピーカー＊15 を用い，１方向ずつ測定した。 Pulse）の各ユニットに測定信号を印加し，聴取位置に配置したダ 17 例として，左右側辺のスピーカーユニットから左右の耳ミーヘッドで収音した。測定信号には，信号長2 −1サンへのHRIRを７図に，その周波数振幅応答（HRTF）をプル，サンプリング周波数48kHzのM系列信号を用いた。８図に示す。ただし，HRIRはピークがフルスケールを基スピーカーユニットは枠上に配置されているため，聴取位準として−２dBとなるように正規化を行ったのち，512 置からの距離はユニットごとに異なる。この距離差により生じる遅延と，スピーカーキャビネットでの反射を吸収するために，（18）式の巡回シフト量 l は，一般的なHRIR 長より長い1,200サンプルとした。測定音圧は，ダミーヘッドの頭部位置において70dBとした。＊12 外乱やデータの摂動に対する感度を表す値。２ノルムを用いると，行列の最大特異値と最小特異値の比が条件数となる。＊13 外乱やモデルの不確かさに対して，一定の性能を維持する状態。＊14 劣決定問題において，そのノルムが最小となる解。＊15 有限の継続時間内において，周波数が時間の対数に比例して変化する正弦波パルス信号。 NHK技研 R&D/No.148/2014.11 51 報告 1 1 left right left right 0.8 0.8 0.6 0.6 振幅振幅 0.4 0.4 0.2 0.2 0 0 −0.2 500 1,000 1,500 2,000 2,500 3,000 3,500 4,000 サンプル −0.2 500 1,000 1,500 2,000 2,500 3,000 3,500 4,000 サンプル（a）左耳位置（b）右耳位置 11図制御点で測定されたインパルス応答 20 20 left right 0 −20 −20 （dB）振幅振幅 0 left right （dB） −40 −40 −60 1,000 周波数（Hｚ） 10,000 −60 （a）左耳位置 1,000 周波数（Hｚ） 10,000 （b）右耳位置 12図制御点で測定された周波数振幅応答サンプルの矩形窓で切り出している。７図と８図において，「left」と「right」は，左右側辺それぞれのスピー 11図に測定されたインパルス応答を示す。また，そのカーユニットから測定信号を印加した場合の応答を示す。周波数振幅応答を12図に示す。11図と12図において，また，聴取位置側方，すなわちSiLチャンネル，SiR 「left」と「right」は，左右それぞれの入力端から単位イチャンネル＊16 の方向から左右の耳へのHRIRを９図に，ンパルスを印加した場合の応答を示す。この場合，同側耳その周波数振幅応答を10図に示す。では遅延を伴う単位インパルスが，対側耳では無信号が観 4.3 制御器の性能評価察されることが期待される。12図を見ると，同側耳で観制御器の性能を定量的に評価するために，応答の測定実察される信号は所望の全域通過特性を精度よく近似してお験を行った。前節のHRTF測定の際と同じ位置に枠型12 り，対側耳で観察されるクロストークはおおよそ全帯域でスピーカーとダミーヘッドを配置し，枠型12スピーカー 15dB以上抑圧されていることが分かる。いずれも，低域の入力に制御器を接続する。この制御器の左右の入力端よおよび高域において精度が低下しているが，これはスピーり所望信号を印加し，ダミーヘッドの左右の耳の位置でそカーユニットの再生周波数帯域の外の帯域となるためであの応答を収音する。所望信号は単位インパルスとした。たる。だし，単位インパルスを直接印加することは困難であるため，LogTSPを印加し，応答に逆信号を畳み込むことによ 52 りインパルス応答とした。 NHK技研 R&D/No.148/2014.11 ＊16 本特集号の解説「８Kスーパーハイビジョン音響制作システムの開発と標準化動向」を参照。２ユニット４ユニット６ユニット 12ユニット 13図制御器の安定性の評価に使用したスピーカーレイアウト 15 10 条件数 5 1 2 4 ユニット数 10,000 6 1,000 周波数（Hz） 12 14図条件数次に，制御器を設計する際に計算する逆行列の条件数を５．おわりに指標として，その安定性を評価した。条件数は，外乱や 22.2ch音響の家庭での再生方式として，FPD一体型の枠データの摂動に対する感度の測度として用いられ，条件数型スピーカーによるバイノーラル再生法を提案し，その概の大きい問題は「悪条件である」といい，微小なノイズや要について報告した。試作した枠型12スピーカーを用い計算過程の誤差混入に弱いとされている。ここでは，枠型た測定実験により，提案法の有効性を示した。また，バイ 12スピーカーのうちバイノーラル再生に使用するスピーノーラル再生法の基礎となるHRTFの多方向同時推定法にカーユニット数とレイアウトを13図に示すように変化さついて述べた。せ，周波数ごとの条件数を計算した。その結果を14図に現在は，安定性を優先して聴取位置を１点としている示す。条件数がユニット数におおよそ反比例して減少が，これを多点へ，更にはある限られた範囲へと拡張するし，２個のユニットを用いた再生で見られる条件数のピーことが当面の課題である。また，信号処理量の削減など，クが，ユニットの増加に伴い徐々に抑圧されることが見てシステムの実用化に資する検討も進める予定である。取れる。この結果は，バイノーラル再生に用いるスピーなお，本研究の一部は，慶應義塾大学理工学部・足立研カーの数を増やすことにより，制御器の安定性，ひいては究室と共同で行った。研究の進捗にご尽力いただいた足立合成される音像の安定性を向上させることができることを修一教授，学生諸氏に感謝する。示唆している。 NHK技研 R&D/No.148/2014.11 53 報告本稿は，日本音響学会誌および映像情報メディア学会誌に掲載された以下の論文を元に加筆・修正したものである。 H. Okubo，H. Sato，K. Mizuno，Y. Morita and S. Adachi： “Binaural Reproduction of 22.2 Multichannel Sound with 石川，徳住，丸田，足立，松井，安藤： “システム同定理論を Flat Panel Display Integrated Loudspeaker Frame for 用いた頭部伝達関数の三次元多方向同時推定， ”音響学誌， Home Use，”映情学誌，Vol. 68 ，No. 10 ，pp. J 447 J 456 Vol.69，No.7，pp.321330（2013）（2014） K. Matsui，S. Oishi，T. Sugimoto，S. Oode，Y. Nakayama，参考文献 1）鹿喰： “スーパーハイビジョンの研究開発， ”NHK技研R&D，No.137，pp.49（2013） 2）澤谷： “家庭におけるマルチチャンネル音響再生技術， ”NHK技研R&D，No.128，pp.1117（2011） 3）K. Matsui and A. Ando： “Binaural Reproduction of 22.2 Multichannel Sound over Loudspeakers， ”129 th Conv. Audio Eng. Soc．，Prepr.8272（2010） 4）K. Matsui and A. Ando：“Binaural Reproduction of 22.2 Multichannel Sound with Loudspeaker Array Frame， ”135th Conv. Audio Eng. Soc．，Prepr.8954（2013） 5）足立：MATLABによる制御のためのシステム同定，東京電機大学出版局，pp.5254，pp.9197（1996） 6）竹中，足立： “最小二乗法による多入力システム同定のための同定入力の生成法， ”計測自動制御学会論文集， No.47，Vol.6，pp.291293（2011）まついけんたろう松井健太郎 1998年入局。名古屋放送局を経て，2001 年から放送技術研究所において，高臨場感音響の研究に従事。現在，放送技術研究所テレビ方式研究部に所属。 54 NHK技研 R&D/No.148/2014.11