家庭用22.2マルチチャンネル音響 再生システム

報告
家庭用22.2マルチチャンネル音響
再生システム
松井健太郎
22.2 Multichannel Sound Reproduction System for
Home Use
Kentaro Matsui
要約
8Kスーパーハイビジョン(8K Super Hi­Vision)の音響方式として,22.2マルチチャンネル
音響方式の開発を進めている。この方式は,空間的に配置された22チャンネルと,低音効果用の
2チャンネルから構成され,3次元的な空間音響を再生するものである。また,家庭でのさまざ
まなスーパーハイビジョン視聴環境に対応するために,22.2マルチチャンネル音響をより少ない
スピーカー数で再生する再生法の開発も進めている。本稿では,フラットパネルディスプレーに
一体化された12個のスピーカーによるバイノーラル再生法を提案する。この方法を用いれば,24
個のスピーカーを設置することなく,22.2マルチチャンネル音響を体験することができる。
ABSTRACT
NHK has developed a 22.2 multichannel sound system for 8K Super Hi­Vision(8K),an ultra
high­definition TV. The system consists of 24 spatially arranged audio channels including two low
frequency effect channels for reproducing three­dimensional spatial sound. To respond to various
viewing circumstances of SHV in homes,we have also developed several reproduction methods
to reproduce 22.2 multichannel sound with fewer loudspeakers. In this paper , we propose
binaural reproduction of 22.2 multichannel sound with 12 loudspeakers integrated into a flat panel
display,which makes it possible for us to experience 22.2 multichannel sound without installing
24 discrete loudspeakers.
NHK技研 R&D/No.148/2014.11
45
報告
1.はじめに
8Kスーパーハイビジョン(以下,8Kと略称)の音響
方式として,22.2マルチチャンネル音響(以下,22.2ch
音響)方式の研究を進めている。22.2ch音響方式は,視聴
者を取り囲むように配置された22チャンネルと,低音効
果(LFE:Low Frequency Effects)用の2チャンネル
から構成され,その場にいるかのような高い臨場感と3
1図 ヘッドホンによるバイノーラル再生
次元的な音響空間構築を実現することができる1)。8K
放送の実用化に向けて,22.2ch音響方式の国際標準化が進
められている。
一方,ライフスタイルの多様化に伴ってテレビの視聴ス
タイルも変化する中で2),多くの場合,各家庭で24個のス
ピーカーを配置することは困難と考えられる。従って,
22.2ch音響を,より少ないスピーカー数で,より簡易に聴
取することができる再生法を選択肢として提案すること
クロストーク
は,重要な研究課題の1つである。
この課題を解決する技術として,人間の聴覚特性を利用
し,音像*1を任意の位置に定位して知覚させる「バイ
ノーラル再生法」は有力な技術の1つである。この技術
を用いれば,スピーカーを置けない方向のチャンネルを音
像として合成することにより,少ないスピーカー数で22.2
2図 クロストーク
ch音響を再生することができる。
本稿ではまず,このバイノーラル再生法を概説するとと
もに,人間の音像定位知覚に関する特徴量を含み,バイ
する再生法をバイノーラル再生法と言う。
ノーラル再生法の基礎となる頭部伝達関数(HRTF:
2.2 スピーカーによるバイノーラル再生法
Head­Related Transfer Function)の推定法について報
両耳に直接信号を提示することができるヘッドホン受聴
告する。次に,当所が提案する,枠型スピーカーによる
では,左右の耳のHRIRを畳み込んだ音源信号(以下,所
22.2ch音響のバイノーラル再生法について報告する。
望信号)を,直接左右のドライバーユニットから再生すれ
ばよい(1図)
。しかし,スピーカー受聴の場合には,ス
2.バイノーラル再生法
ピーカーから同じ側の耳(同側耳)への信号の伝搬に加
2.1 ヘッドホンによるバイノーラル再生法
え,反対側の耳(対側耳)への音の漏洩(クロストーク)
HRTFは,自由音場
*2
において,
「頭がない状態での頭
が発生する(2図)
。従って,このクロストークを抑圧し,
部中心に相当する位置から頭外音源位置を経て両耳鼓膜位
所望信号のみをそれぞれの耳に伝送するための補償処理が
置もしくは外耳道入口までの音響伝達関数」として定義さ
必要となる。この補償処理を,クロストーク・キャンセ
れる。または,近似的に「頭外音源位置から両耳鼓膜位置
レーションと言う。3図に,2個のスピーカーによるバ
もしくは外耳道入口までの音響伝達関数」として定義され
イノーラル再生のブロック図を示す。3図において,G
る。このHRTFには,両耳間時間差やレベル差,周波数特
はそれぞれのスピーカーから左右の耳までの音響伝達関
*3
数,X は左右の耳に提示する所望方向のHRTF,H はク
性上のスペクトラルキュー
など,音像の定位知覚に関
係のある多くの特徴量が含まれている。そのため,HRTF
ロストーク・キャンセレーションのための制御器を表す。
を測定し,音源信号に作用させることにより,すなわち
入力信号 u から出力信号 y までは,次式のような関係で
HRTFの 時 間 領 域 表 現 で あ る 頭 部 イ ン パ ル ス 応 答
表される。
(HRIR:Head­Related Impulse Response)を音源信号
に畳み込むことにより,任意の方向に音像を定位知覚させ
ることができる。このようにして生成される信号をバイ
ノーラル信号,バイノーラル信号をヘッドホンにより提示
46
NHK技研 R&D/No.148/2014.11
*1 到来音の方向と距離を知覚することによって得られる到来音の形象。
*2 等方性かつ均質の媒質中で,境界の影響を無視できる音場。
*3 音像の定位知覚に寄与すると考えられている周波数振幅特性上のピー
クやノッチ。
xr
hrr
grr
hrl
u
hlr
yr
grl
glr
gll
xl
yl
hll
3図 2個のスピーカーによるバイノーラル再生
(1)
る。この場合,制御器は,離散周波数ビン*4ごとに逆行
列を計算し,逆フーリエ変換により時間領域に戻すことに
よって,FIR(Finite Impulse Response)フィルターと
ただし,
して求められる。
ここまで2個のスピーカーを用いたバイノーラル再生
法について概説したが,これは3個以上の複数スピーカー
を用いた方法に容易に拡張できる。スピーカーの数を増や
すと,その数に比例して制御点の数も増やすことができる
(2)
ため,複数スピーカーによる制御は,聴取範囲を広げる有
力な手段である。このとき(2)
式は,次のようになる。
制御器 H は,聴取者の耳の位置において所望信号,す
なわち入力信号に所望方向のHRTFを作用させた信号が合
成されるように設計される。その結果,入力信号と出力信
号の関係は,
(5)
(3)
となる。従って,制御器 H は G の逆システムとして設計
される。すなわち
(4)
なお,制御対象となる聴取者の耳の位置を制御点と言う。
この制御器の設計に関しては,さまざまなアプローチが
検討されている。当所でも,畳み込み演算に基づく時間領
ここで,p は制御点の数を,q はスピーカーの数を表す。
域での処理3),特異値分解法による周波数領域での処理4)
を検討してきた。現在は,計算時間,占有する作業領域な
どの計算負荷を考慮し,周波数領域での処理を採用してい
*4 離散値の周波数領域成分。
NHK技研 R&D/No.148/2014.11
47
報告
3.HRTFの多方向同時推定
4章で述べるように,当所では枠型スピーカーを用い
た複数スピーカーによるバイノーラル再生法の研究を進め
ている。スピーカーの数が増えるとHRTFの測定が煩雑と
なり,長時間を要するようになる。そこで,システム同定
(10)
理論*5に基づくHRTFの多方向同時推定法を開発した。
各方向のHRIRは有限長 n 次のFIRモデルで近似できる
と仮定する。また,m 方向のHRIRの集合を,入力を m
方向の測定信号,出力を片耳の外耳道入口で収音される信
号としたMISO(Multiple Input Single Output)システ
ムと見なす。一般に, m 入力1出力の n 次FIRモデルは
とおくと,
(8)
式は
(11)
(6)
と書き表すことができる。この入出力関係を満たすパラ
メーター θ を,最小二乗法により推定する。詳細な導出法
と表される。ここで (
は離散時間の時刻kにおける出力,
y k)
は文献5)に譲るが,1段先予測*6に基づく評価規範
(k)
は正規性雑音を表す。また,x(
w
i k)は i 番目の方向の
入力 u(
i k)から構成される入力ベクトル,θiは i 番目の方
(12)
向のFIRモデルのパラメーターベクトルを表し,それぞれ
次式で与えられる。
を最小化するパラメーター
が最小二乗推定値であり,
(13)
(7)
で与えられる。ここで,
更に,
(6)
式を時刻 k =1, 2, … N まで並べると
(14)
と置いた。なお,
(12)
式の ・ は2ノルム(ユークリッ
ドノルム)を表す。従って,HRTFの多方向同時推定で
(8)
は,まず,推定する m 方向から測定信号を同時に印加し,
左右の耳の外耳道入口で応答を収音する。次に,左右の耳
と書き表すことができる。ここで Xi は各時刻における入
それぞれの応答について(13)
式を計算することにより,
力ベクトルx(
i k)を並べた行列であり,次式で与えられる。
各方向のFIRモデルのパラメーターの推定値を求める。
(13)
式が解を持つためには,Rが正定値行列*7である必
要がある。この条件を満たす測定信号は,以下の手順によ
り作成することができる6)。
(k)を作成し,これを
1)周期 T のM系列*8から信号 m
1番目の方向の入力
(9)
簡単化のために,
*5 対象をブラックボックスと見なし,その入出力データから統計的な
手法により対象のパラメーターを算出する理論。
*6 離散時間線形時不変システムにおいて,1ステップ前の時刻までに
測定された入出力データに基づいた出力の予測。
*7 その固有値がすべて正となるエルミート行列。
*8 2値擬似ランダム系列の一種。
48
NHK技研 R&D/No.148/2014.11
スピーカーユニット
6図 HRTFの測定
4図 枠型12スピーカー
3)以下同様に,i 番目の方向の入力 u(
i k)は,i −1番
目の方向の入力 ui−1
(k)を時間軸上で l サンプルだけ
負の方向に巡回シフトしたものとする。
(18)
4.枠型スピーカーによる22.2ch音響の
バイノーラル再生
4.1 フラットパネルディスプレー一体型の
枠型スピーカー
5図 高調波ひずみを低減するエッジ構造
一般的なリビングルームでの8Kの視聴を考えると,ス
ピーカーの数に対する制限に加え,部屋の広さや家具など
(15)
とする。ここで,周期 T は次式を満たす。
により,その設置場所も制限されることが予想される2)。
そこで当所では,フラットパネルディスプレー(FPD:
Flat Panel Display)一体型の枠型スピーカーの研究を進
めている。
(16)
85型液晶ディスプレーのために開発した枠型12スピー
カーを4図に示す。4図から分かるように,枠の上辺と
下辺には各5個のスピーカーユニットが等間隔で配置さ
2)1番目の方向の入力 u(
1 k)を時間軸上で l サンプル
れ,左右の側辺にはその中間位置に各1個のスピーカー
だけ負の方向に巡回シフトしたものを2番目の方向
ユニットが配置されている。この配置は,22.2ch音響方式
の入力
の前方チャンネルに対応している。枠上の各ユニットは,
相互の干渉と混変調を防ぐために,独立したキャビティー
(空気室)に収められている。それぞれのユニットは高い
耐入力と低いひずみ特性を有しており,振動板の直径は7
(17)
cmと小型であるにもかかわらず,最大音圧レベルは92dB
となっている。更に,5図に示すように,NHKの標準モ
とする。
ニター用の技術であるエッジ構造を小型化して導入し,大
NHK技研 R&D/No.148/2014.11
49
報告
1
1
left
right
0.8
0.6
0.4
0.4
0.2
0.2
振幅
振幅
0.6
0
0
−0.2
−0.2
−0.4
−0.4
−0.6
−0.6
−0.8
−0.8
−1
50
left
right
0.8
−1
100 150 200 250 300 350 400 450 500
50
100 150 200 250 300 350 400 450 500
サンプル
サンプル
(a)左耳
(b)右耳
7図 スピーカーユニットから左右の耳へのHRIRの例
20
20
left
right
left
right
0
−20
(dB)
−20
(dB)
−40
−40
振幅
振幅
0
−60
1,000
10,000
−60
1,000
周波数(Hz)
周波数(Hz)
(a)左耳
(b)右耳
10,000
8図 スピーカーユニットから左右の耳へのHRTFの例
振幅時の高い直進性と逆共振の抑圧を実現することによ
として合成される。実験によれば,水平方向のパンニング
り,従来の同口径ユニットに比べ,中域で20dB程度のひ
と比較して,垂直方向のパンニングは前方により安定した
ずみ低減に成功している。
虚音像を合成することが可能である。従って,上記3チャ
左右の側辺にはそれぞれ2個のサブウーファーユニッ
ンネルの合成には,各チャンネルを挟む上辺と下辺のス
トが備えられており,LFEチャンネルの再生により,広
ピーカーユニットを用いている。側方,後方のチャンネル
がり感や包み込まれ感などの空間印象を向上させるととも
は,12個のスピーカーユニットを用いたバイノーラル再
に,22.2ch音響の低域成分の再生により,低域音響特性を
生により,規格上の所定位置に音像として合成される。聴
改善している。
取位置は視距離1.5H(Hはディスプレーの高さ)の1点と
4.2 フラットパネルディスプレー一体型の枠型
した。このとき(4)
式は劣決定問題*11となり,解が一意
スピーカーによるバイノーラル再生
に定まらない。そのため,制御器を設計する際に計算する
22.2ch音響方式の各チャンネルのうち,ディスプレーの
位置に重なるFLcチャンネル,FRcチャンネル,FCチャ
ンネル*9を除いた前方チャンネルは,枠型12スピーカー
上の各スピーカーユニットに割り当てられる。一方,除外
された3チャンネルは,振幅パンニング*10により虚音像
50
NHK技研 R&D/No.148/2014.11
*9
本特集号の解説「8Kスーパーハイビジョン音響制作システムの開
発と標準化動向」を参照。
*10 隣接するスピーカーに音響信号を振り分けることにより,スピーカー
間の任意の方向に音像を定位させる方法。
*11 観測の数が変数の数より少なく,変数の値を一意に決定できない問
題。
1
1
left
right
0.8
0.6
0.4
0.4
0.2
0.2
振幅
振幅
0.6
0
0
−0.2
−0.2
−0.4
−0.4
−0.6
−0.6
−0.8
−0.8
−1
50
100
150
200
left
right
0.8
−1
250
50
サンプル
100
150
200
250
サンプル
(a)左耳
(b)右耳
9図 側方から左右の耳へのHRIRの例
20
20
left
right
left
right
0
−20
(dB)
−20
(dB)
−40
−40
振幅
振幅
0
−60
1,000
10,000
−60
周波数(Hz)
1,000
10,000
周波数(Hz)
(a)左耳
(b)右耳
10図 側方から左右の耳へのHRTFの例
逆行列の条件数*12が最も低くなり,制御器がロバスト*13
となる最小ノルム解
*14
を採用している。
所望信号の合成に使用するHRTF,すなわち側方や後方
のスピーカーがない方位から聴取位置までのHRTFは,同
制御器の設計に使用するHRTF,すなわち枠型スピー
じダミーヘッドを用いて測定した。同時推定は困難である
カー上の各スピーカーユニットから聴取位置までのHRTF
ため,測定信号には,信号長217サンプル,サンプリング
は,3章で述べた同時推定法により求めた。当所の音響
周波数48kHzのLogTSP(Logarithmic Time­Stretched
無響室での測定の様子を6図に示す。枠型12スピーカー
*15
を用い,1方向ずつ測定した。
Pulse)
の各ユニットに測定信号を印加し,聴取位置に配置したダ
17
例として,左右側辺のスピーカーユニットから左右の耳
ミーヘッドで収音した。測定信号には,信号長2 −1サン
へのHRIRを7図に,その周波数振幅応答(HRTF)を
プル,サンプリング周波数48kHzのM系列信号を用いた。
8図に示す。ただし,HRIRはピークがフルスケールを基
スピーカーユニットは枠上に配置されているため,聴取位
準として−2dBとなるように正規化を行ったのち,512
置からの距離はユニットごとに異なる。この距離差により
生じる遅延と,スピーカーキャビネットでの反射を吸収す
るために,
(18)
式の巡回シフト量 l は,一般的なHRIR
長より長い1,200サンプルとした。測定音圧は,ダミー
ヘッドの頭部位置において70dBとした。
*12 外乱やデータの摂動に対する感度を表す値。2ノルムを用いると,
行列の最大特異値と最小特異値の比が条件数となる。
*13 外乱やモデルの不確かさに対して,一定の性能を維持する状態。
*14 劣決定問題において,そのノルムが最小となる解。
*15 有限の継続時間内において,周波数が時間の対数に比例して変化す
る正弦波パルス信号。
NHK技研 R&D/No.148/2014.11
51
報告
1
1
left
right
left
right
0.8
0.8
0.6
0.6
振幅
振幅
0.4
0.4
0.2
0.2
0
0
−0.2
500
1,000 1,500 2,000 2,500 3,000 3,500 4,000
サンプル
−0.2
500
1,000 1,500 2,000 2,500 3,000 3,500 4,000
サンプル
(a)左耳位置
(b)右耳位置
11図 制御点で測定されたインパルス応答
20
20
left
right
0
−20
−20
(dB)
振幅
振幅
0
left
right
(dB)
−40
−40
−60
1,000
周波数(Hz)
10,000
−60
(a)左耳位置
1,000
周波数(Hz)
10,000
(b)右耳位置
12図 制御点で測定された周波数振幅応答
サンプルの矩形窓で切り出している。7図と8図におい
て,
「left」と「right」は,左右側辺それぞれのスピー
11図に測定されたインパルス応答を示す。また,その
カーユニットから測定信号を印加した場合の応答を示す。
周波数振幅応答を12図に示す。11図と12図において,
また,聴取位置側方,すなわちSiLチャンネル,SiR
「left」と「right」は,左右それぞれの入力端から単位イ
チャンネル
*16
の方向から左右の耳へのHRIRを9図に,
ンパルスを印加した場合の応答を示す。この場合,同側耳
その周波数振幅応答を10図に示す。
では遅延を伴う単位インパルスが,対側耳では無信号が観
4.3 制御器の性能評価
察されることが期待される。12図を見ると,同側耳で観
制御器の性能を定量的に評価するために,応答の測定実
察される信号は所望の全域通過特性を精度よく近似してお
験を行った。前節のHRTF測定の際と同じ位置に枠型12
り,対側耳で観察されるクロストークはおおよそ全帯域で
スピーカーとダミーヘッドを配置し,枠型12スピーカー
15dB以上抑圧されていることが分かる。いずれも,低域
の入力に制御器を接続する。この制御器の左右の入力端よ
および高域において精度が低下しているが,これはスピー
り所望信号を印加し,ダミーヘッドの左右の耳の位置でそ
カーユニットの再生周波数帯域の外の帯域となるためであ
の応答を収音する。所望信号は単位インパルスとした。た
る。
だし,単位インパルスを直接印加することは困難であるた
め,LogTSPを印加し,応答に逆信号を畳み込むことによ
52
りインパルス応答とした。
NHK技研 R&D/No.148/2014.11
*16 本特集号の解説「8Kスーパーハイビジョン音響制作システムの開
発と標準化動向」を参照。
2ユニット
4ユニット
6ユニット
12ユニット
13図 制御器の安定性の評価に使用したスピーカーレイアウト
15
10
条件数
5
1
2
4
ユニット数
10,000
6
1,000
周波数(Hz)
12
14図 条件数
次に,制御器を設計する際に計算する逆行列の条件数を
5.おわりに
指標として,その安定性を評価した。条件数は,外乱や
22.2ch音響の家庭での再生方式として,FPD一体型の枠
データの摂動に対する感度の測度として用いられ,条件数
型スピーカーによるバイノーラル再生法を提案し,その概
の大きい問題は「悪条件である」といい,微小なノイズや
要について報告した。試作した枠型12スピーカーを用い
計算過程の誤差混入に弱いとされている。ここでは,枠型
た測定実験により,提案法の有効性を示した。また,バイ
12スピーカーのうちバイノーラル再生に使用するスピー
ノーラル再生法の基礎となるHRTFの多方向同時推定法に
カーユニット数とレイアウトを13図に示すように変化さ
ついて述べた。
せ,周波数ごとの条件数を計算した。その結果を14図に
現在は,安定性を優先して聴取位置を1点としている
示す。条件数がユニット数におおよそ反比例して減少
が,これを多点へ,更にはある限られた範囲へと拡張する
し,2個のユニットを用いた再生で見られる条件数のピー
ことが当面の課題である。また,信号処理量の削減など,
クが,ユニットの増加に伴い徐々に抑圧されることが見て
システムの実用化に資する検討も進める予定である。
取れる。この結果は,バイノーラル再生に用いるスピー
なお,本研究の一部は,慶應義塾大学理工学部・足立研
カーの数を増やすことにより,制御器の安定性,ひいては
究室と共同で行った。研究の進捗にご尽力いただいた足立
合成される音像の安定性を向上させることができることを
修一教授,学生諸氏に感謝する。
示唆している。
NHK技研 R&D/No.148/2014.11
53
報告
本稿は,日本音響学会誌および映像情報メディア学会誌に掲
載された以下の論文を元に加筆・修正したものである。
H. Okubo,H. Sato,K. Mizuno,Y. Morita and S. Adachi:
“Binaural Reproduction of 22.2 Multichannel Sound with
石川,徳住,丸田,足立,松井,安藤:
“システム同定理論を
Flat Panel Display ­ Integrated Loudspeaker Frame for
用いた頭部伝達関数の三次元多方向同時推定,
”音響学誌,
Home Use,”映情学誌,Vol. 68 ,No. 10 ,pp. J 447 ­ J 456
Vol.69,No.7,pp.321­330(2013)
(2014)
K. Matsui,S. Oishi,T. Sugimoto,S. Oode,Y. Nakayama,
参考文献
1)鹿喰:
“スーパーハイビジョンの研究開発,
”NHK技研R&D,No.137,pp.4­9(2013)
2)澤谷:
“家庭におけるマルチチャンネル音響再生技術,
”NHK技研R&D,No.128,pp.11­17(2011)
3)K. Matsui and A. Ando:
“Binaural Reproduction of 22.2 Multichannel Sound over Loudspeakers,
”129
th Conv. Audio Eng. Soc.,Prepr.8272(2010)
4)K. Matsui and A. Ando:“Binaural Reproduction of 22.2 Multichannel Sound with Loudspeaker Array
Frame,
”135th Conv. Audio Eng. Soc.,Prepr.8954(2013)
5)足立:MATLABによる制御のためのシステム同定,東京電機大学出版局,pp.52­54,pp.91­97(1996)
6)竹中,足立:
“最小二乗法による多入力システム同定のための同定入力の生成法,
”計測自動制御学会論文集,
No.47,Vol.6,pp.291­293(2011)
ま つ い けんたろう
松井健太郎
1998年入局。名古屋放送局を 経 て,2001
年から放送技術研究所において,高臨場感音
響の研究に従事。現在,放送技術研究所テレ
ビ方式研究部に所属。
54
NHK技研 R&D/No.148/2014.11