8Kスーパーハイビジョン 音響制作システムの開発と 標準化動向

解 説
8Kスーパーハイビジョン
音響制作システムの開発と
標準化動向
西口敏行
小野一穂
渡辺
馨
■
8Kスーパーハイビジョン(8K Super Hi­Vision)の音響方式である22.2マルチチャン
ネル音響(以下,22.2ch音響)は,3層のチャンネル配置からなる3次元音響により,
高い臨場感を実現する音響技術である。8Kの2016年の試験放送,2018年の実用放送に
向けて,NHKでは22.2ch音響の研究開発を進めている。また,国内外の標準化機関にお
いては,22.2ch音響の放送に必要な規格や運用規定の策定に向けた標準化活動が進めら
れている。本稿では,22.2ch音響を実現するために重要となる効率的な制作技術につい
て,開発の現況を紹介するとともに,試験放送や実用放送に向けて進められている国内
外の標準化の状況について概説する。
1.まえがき
HDTV(High Definition Television)の16倍の画素数をもつ8K映像と22.2ch音響に
よる8Kスーパーハイビジョン(以下,8Kと略称)は,その場にいるような高臨場感を
実現できるメディアである。日本では2016年に試験放送,2018年に実用放送を開始する
ことが国のロードマップに示されており,NHKはそれに向けて研究開発,設備整備,標
準化活動を進めている。
22.2ch音響についても,効率的な制作技術と家庭での再生技術を中心に,収音から再生
に至る一連の技術開発,および国内外の標準化活動を進めており,試験放送,実用放送
に向けて準備を整えつつある。本稿では,22.2ch音響に関する標準化活動の現状と,
22.2ch音響制作の高度化と効率化を目指した制作システムの開発状況について概説する。
2.8Kの音響方式の標準化動向
8KはHDTVの16倍となる横7,680×縦4,320画素を持つ超高精細な映像システムであ
*1
Hはディスプレーの高さ。
り,視力1.0の人がその画素構造を検知できない視距離(0.75H*1)において,水平面で
約100°の広い視野角(画面を見込む角度)を持ち,まさにその場にいるような高臨場感
を再現できる。この広視野映像には,前後左右のみの2次元音響である5.1チャンネル音
響(以下,5.1ch音響)を超えた高臨場感音響方式がふさわしい。そこで,8Kの音響方
式として,高さ方向にもスピーカーを配置した3次元音響である22.2ch音響方式が開発
された。本章では,8K用の22.2ch音響の標準化動向を解説する。
12
NHK技研 R&D/No.148/2014.11
5.1チャンネル音響
高臨場感音響
(a)8Kディスプレー上の音像
5.1チャンネル音響
高臨場感音響
(b)視聴者の周辺の音像
1図 高臨場感音響方式の要求条件を満たす音響方式が再現可能な音場表現の例
2.1 高臨場感音響方式の要求条件
8K映像にふさわしい「高臨場感音響方式の要求条件」は,ITU­R(International
Telecommunication Union ­ Radiocommunication Sector)勧告BS.1909 1)として以下
のように規定されている。
① 聴取位置を取り囲む全方向からの音の到来が再現できること
あたかもその場にいるような高臨場感を実現するためには,実際の音場と同様に
全方向からの音の到来が再現できることが重要である。
② 5.1ch音響を超えた高品質な3次元音響空間印象(包み込まれ感)を再現できること
コンサートホールの自然な音響空間を再現するためには,側方からの反射音
等,3次元的な包み込まれ感や広がり感が重要である。
③ 画面上の任意の位置での映像と音像の方向が一致すること
水平・垂直方向に広い視野角を持つ8Kの大画面上で,映像と音像の方向を一致
させることが重要である。
④ 広い視聴範囲を持つこと
複数の人が同時に視聴する場合を想定し,できるだけ広い範囲で高品質の音響を
再現できることが望ましい。
⑤ 既存のマルチチャンネル音響方式との後方互換性を有すること
すでに実用化されている2チャンネルステレオ方式や5.1チャンネルステレオ方式
との互換性が求められる。
⑥ ライブ収音および生伝送ができること
8K放送を目的としているので,ライブ収音や生伝送に対応できる必要がある。
この「高臨場感音響方式の要求条件」を満たす音響方式が再現可能な音場表現の例を
1図に示す。
2.2 ITU­R勧告BS.1909の要求条件を満たすスピーカー配置
当所では,前節で述べた要求条件のうち,①∼④を満たすスピーカー配置を主観評価
実験により調べた。その結果,以下のような指針を得た。
NHK技研 R&D/No.148/2014.11
13
1表 高臨場感音響方式の要求条件を満たすスピーカー配置
視聴位置
要求条件
全方向からの音の到来
3次元音響空間印象
中心位置
水平方向:60°
間隔
(中層・上層)
スピーカー数
中層:6個
上層:6個
垂直方向:45°
間隔
中層,上層および真上
水平面上の包み込まれ感:45°間隔
中層:8個
上層:8個
垂直面上の包み込まれ感:45°間隔 中層,上層および真上
前方画面内の映像と
音像の一致※
中心位置から外れた
横の位置
※
要求条件を満たすスピーカー配置
スピーカー間隔
水平方向:60°
間隔
中層:3個
上層:3個
下層:3個
垂直方向:30°
間隔
3層構造:
中層,上層,下層
水平方向:30°
間隔
(最大の映音ずれ10°
以内の場合)
中層:5個
上層:5個
下層:5個
中層:30°
間隔
上層および下層:60°
間隔
(最大の映音ずれ20°
以内の場合)
中層:5個
上層:3個
下層:3個
水平視野角約100°の画面をカバーするために必要な前方のスピーカーの個数。
① 全方向からの音の到来
良好な音像定位のためには,水平方向のスピーカーの間隔を60°以下,垂直方向の
スピーカーの間隔を45°以下にする必要がある。
② 高品質な3次元音響空間印象(包み込まれ感)の再現
3次元音響空間印象の再現音に包み込まれる感じを良好に与えるためには,水平
方向のスピーカーの間隔を45°以下,垂直方向のスピーカーの間隔を45°以下にす
る必要がある。また,5.1ch音響に比べて「包み込まれ感」を有意に改善するため
には,中層および上層に45°の間隔で計16(8×2)個のスピーカーを配置する必
要がある。
③ 画面上の任意の位置での映像と音像の方向が一致すること
視距離0.75Hの中心位置(スイートスポット)で視聴する場合,8K映像の水平視
野角約100°
,垂直視野角約60°の全画面上において映像と音像の方向を一致させる
ためには,水平方向のスピーカーの間隔を60°以下,垂直方向のスピーカーの間隔
を30°以下(上層・中層・下層の3層構造のスピーカー配置)にする必要がある。
④ 広い視聴範囲をもつこと
中心位置から外れた横の視聴位置においても,画面上任意の位置での映像と音像
の方向を一致させるためには,水平方向のスピーカーの間隔を30°以下にする必要
がある。ただし,映像と音像の方向のずれを最大20°とする場合は,上層と下層の
スピーカーの間隔は60°以下にする必要がある。
以上の主観評価実験により求められたスピーカー配置を1表に示す。1表のスピー
カー配置は,ITU­R勧告BS.1909の要求条件を満たすものである。
2.3 22.2マルチチャンネル音響方式のスタジオ規格
22.2ch音響のチャンネル配置の概略図を2図に示す。22.2ch音響は,聴取者の聴取高
さに位置する中層,上方(天井面)に位置する上層,下方(床面)に位置する下層の3
層から成るチャンネル配置で構成されている。各層のチャンネルは,中層10チャンネル,
上層9チャンネル,下層3チャンネル,および2つのLFE(Low Frequency Effects:
低音効果用)チャンネルである。2図ではチャンネルの位置を●,●,●印で示し,そ
14
NHK技研 R&D/No.148/2014.11
TpFR
TpFC
TpSiR
FR
TpFL
FRc
FC
BtFR
TpC
FL
TpBR
SiR
FLc
LFE2
BtFC
TpBC
LFE1
BR
TpSiL
BtFL
TpBL
BC
上層●
SiL
中層●
BL
下層●
低音効果スピーカー■
2図 22.2ch音響のチャンネル配置の概略図
TpFC
FC
FLc
FRc
FL
α1
SiL
α3
α2 α2
α1
設置角度
SiR
α3
180°
0°
90°
0°
TpFR
TpFL
FR
TpSiL
α3
α1
α1
90°
0°
α3
180
180°
TpSiR
TpC
許容範囲
BL
BR
TpBR
TpBL
TpBC
BC
45°≤  1≤ 60°  2= 1/ 2 110°≤  3 ≤ 135°
 1,  3 は中層の  1,  3 と同一の値。
(b)上層のスピーカー位置
(a)中層のスピーカー位置
BtFC
LFE1
許容範囲
LFE2
BtFR
BtFL
設置角度
トップ層
(後方)
トップ層
(前方)
α1
α1
α4 α4
ミドル層
(後方)
90°
β3
β3
β2
β1
ミドル層
(前方)
β4
ボトム層(前方)
1 は中層の 
 1 と同一の値。
30° ≤  4 ≤ 90°
(c)下層のスピーカー位置
1 ,
中層の仰角  2:0°≤  1 ≤ 5°, 0° ≤  2 ≤ 15°
 3:30°
上層の仰角 ≤  3 ≤ 45°
 4:15°
下層の伏角 ≤  4 ≤ 30°
(d)断面のスピーカー位置
3図 22.2ch音響のスピーカーの設置角度(許容範囲)
れぞれに対応するチャンネルラベル名を併記している。
2)
にお
この22.2ch音響は,ITU­R勧告BS.2051「番組制作における高度音響システム」
いて,チャンネル配置の1つとして標準化されている。また,国内規格として電波産業
会(ARIB:Association of Radio Industries and Businesses)によりARIB STD­B59
3)
として標準化されている。これらの規
「三次元マルチチャンネル音響方式スタジオ規格」
NHK技研 R&D/No.148/2014.11
15
2表 22.2ch音響のデジタル音響信号規定
サンプリング周波数
48kHz,96kHz(オプション)
量子化ビット数
16ビット,20ビット,24ビット
格には,22.2ch音響のチャンネル配置として,3図に示すスピーカーの設置角度(許容
範囲)が規定されている。
また,SMPTE(Society of Motion Picture and Television Engineers)においても
8Kの映像・音響・インターフェースの標準化が行われており,8Kの音響方式はST­
2036−2−2008規格4)として標準化されている。SMPTE規格においては,22.2マルチチャ
ンネル音響方式のデジタル音響信号が規定されており,2表に示すサンプリング周波数
および量子化ビット数と,チャンネル数およびチャンネル順序が規定されている。一方,
スピーカー配置は参考例として示されている。
国内規格として電波産業会により標準化されているARIB STD­B59には,スピーカー
の設置角度(許容範囲)のほかに,2表のデジタル音響信号の規定や,量子化基準レベ
*2
デジタル信号の最大値を0dB
として,信号の大きさをデジベ
ルで表 す 単 位。FSは「フ ル ス
ケール」の略。
*3
人間が感じる騒音の大きさを模
擬するために,低域と高域を抑
圧した特性(C特性)を持つフィ
ルターを通して測定した音圧レ
ベル。
,スピーカーの標準再生レベル(中心位置で79
ル(−18dBFS*2または−20dBFS)
dBC*3)が規定されている。
2.4 22.2ch音響方式の符号化規格
日本国内において22.2ch音響方式による8K放送を実現するために,総務省令第87号
「標準テレビジョン放送等のうちデジタル放送に関する送信の標準方式」の改定が行われ
ている。高度BSデジタル放送,高度狭帯域CSデジタル放送および高度広帯域CSデジタ
ル放送における最大入力音声チャンネル数は,
「22チャンネルおよび低域を強調する2
チャンネルとする」こと,符号化方式はMPEG−4 AAC(Moving Picture Experts
Group− 4 Advanced Audio Coding )規格およびMPEG − 4 ALS ( Audio Lossless
Coding)規格に準拠する方式とすることが規定されている。
また総務省令・告示に対応して,電波産業会はARIB STD­B32「デジタル放送におけ
5)
の改定を行い,最大22.2チャンネルのマル
る映像符号化,音声符号化及び多重化方式」
チチャンネル音声モードに対応した,MPEG−4 AAC音声符号化方式のより詳細な仕様
に関する追加規定を行っている。同ARIB規格では,22.2ch音響を用いるときに,2ch,
5.1ch音響も同時に送る仕組みが規定されている。なお,MPEG−4 音声符号化規格に
は,2ch音響や5.1ch音響など一般的に用いられる音響システムごとに個別番号が割り当
てられており,22.2マルチチャンネル音響方式には番号13が割り当て済みである6)。
また,省令・告示およびARIB標準規格において,8K放送に用いるサンプリング周波
数は48kHz,量子化ビット数は16ビット以上と規定されており,MPEG−4 AAC符号化
方式のAAC­LC(Low Complexity)プロファイルを用いることが定められている。
3.22.2ch音響制作システムの開発
本章では,22.2ch音響によるコンテンツ制作の高度化と簡易化を目指して開発を進めて
いるマルチチャンネルワンポイント球形マイクロホン,ミキシングシステム,3次元残
響付加装置について解説する。
3.1 マルチチャンネルワンポイント球形マイクロホン
22.2ch音響は,音の方向とチャンネルが1対1に対応する,いわゆるマルチチャンネ
ル音響方式であるため,ワンポイントで収音するには,原音場内の1か所に指向性マイ
クロホン素子を各チャンネルの方向に向けて配置し,さらに各指向性ビームの幅が22.2
16
NHK技研 R&D/No.148/2014.11
4図 マルチチャンネルワンポイント球形マイクロホン
16kHz
0°
0
1kHz
30°
12kHz
330°
6kHz
-10
300°
60°
8kHz
-20
4kHz
相対感度
-30
90°
270°
(dB) -30
-20
2kHz
240°
120°
-10
0
250Hz
210°
150°
180°
500Hz
5図 球形マイクロホンの指向特性(水平面内1ch分)
(左右対称な特性のため,左半分に2kHz以下の特性を,
右半分に4kHz以上の特性を示す)
ch音響の1チャンネル分に対応するマイクロホンを使用することが望ましい。しかし,
周波数によらずこのような一定幅の指向性ビームを単体のマイクロホンで実現すること
は難しい。そこで,指向性ビームの十分な狭さと,周波数の変化に対するビーム幅の安
定性の両立を目指し,球を音響遮蔽板により立体角に仕切り,仕切られた各空間内にマ
イクロホン素子を設置して指向性を得る方式のワンポイント球形マイクロホンを開発し,
屋外で22.2ch音響を簡易に収音することを可能とした。開発した直径45 cmの球形マイク
ロホン7)を4図に示す。このマイクロホンは,22.2ch音響の背景音等の収音を目的とし,
FLcとFRcを除く中層の8チャンネルと,TpCを除く上層の8チャンネルの音を収音で
きる。遮蔽板で仕切られた空間の中には任意の指向性のマイクロホン素子を取り付ける
ことが可能であるが,低域の振幅特性が平坦で,遮蔽板の効果のみで一定の指向性が得
られる全指向性の素子を用いることとした。
5図に中層の1チャンネル分の水平面内指向特性を示す。マイクロホン素子はゼンハ
イザ製MKH­8020を使用した。5図より,4kHz以下の周波数帯域では周波数が低いほ
NHK技研 R&D/No.148/2014.11
17
6図 ソチ五輪での球形マイクロホンの使用風景
7図 22.2ch音響制作ミキシングシステム
どビーム幅が広がる傾向にあり,500Hzではほぼ全指向性となる一方,6kHz以上の周波
数帯においては,音響遮蔽板の効果によりビームの半値幅が約50°
(5図の片側で約25°
)
で一定となる特徴を有する。半値幅の50°は,水平方向を8分割した45°と近く,22.2ch
音響のチャンネル配置に適合していると言える。
本マイクロホンは,スポーツ番組を中心に,22.2ch音響の収音に用いられている。特
に,多数のマイクロホンを設置することなく22.2ch音響の背景音を収音できることから,
マイクロホンの設置可能な場所が限定される五輪などで広く使われている。ロンドン五
輪では,開会式,水泳,自転車など,収録を行った競技の多くで使用され好評を得たほ
か,ソチ五輪でも使用された(6図)
。
3.2 ミキシングシステム
22.2chのメインバス(ミキシングした信号をまとめる回路)を有し,1,000トラックの
オーディオ信号のミキシングに対応可能な22.2ch音響制作ミキシングシステムを開発し
た(7図)
。このシステムは3表の仕様を持つミキシングシステムをベースに,特に高度
な22.2ch音響制作をより効率的に行うために,3次元パンニング機能とテンプレート機
能を有している。
18
NHK技研 R&D/No.148/2014.11
3表 22.2ch音響制作ミキシングシステムの主な仕様
項目
仕様
ミキシングトラック数
1,000トラック(全てイコライザー(EQ)とダイナミクス※1を使用可能)
メインバス
22.2ch,5.1ch,2ch
オートメーション※2
プラグイン※3を含む 60,000を超えるパラメーターに対応
処理遅延
全処理で0.5ms 以下
信号処理精度
36ビット浮動小数点(EQなど一部は72ビット浮動小数点)
ディスクレコーダー/エディター
1,000トラック再生,192トラック同時レコーディング
ビデオ
HD/SDのビデオトラック
※1
※2
※3
リミッター(入力信号の振幅を制限する機能)やコンプレッサー(入力信号の振幅に応じて出力信号の振幅を抑える機能)など,
信号の振幅をコントロールする機能。
レベルやイコライザーの設定などのミキシング情報を,信号の時刻(タイムコード)上で時々刻々連続的に記録・再現する機能。
デジタルオーディオワークステーション上で,機能拡張のために追加するソフトウエア。
8図 3次元パンニング機能のGUIの例
3次元パンニング機能は,3次元空間内の任意の方向に音を提示する機能であり,受
音点における音響インテンシティー(音のエネルギーの強さと方向を表す量)を,3つ
のスピーカーからの音波を合成することによって再現している8)。従来は,3次元空間内
の所望の方向に音を提示するには,複数のスピーカーに対して分配する音源信号のレベ
ルを手動で加減していたため,多くの作業時間を要していた。本システムでは,グラ
フィカルユーザーインターフェース(GUI:Graphical User Interface,8図)を見なが
らマウス,ジョイスティックまたはロータリーノブで音源の方向を指示することで,複
数のスピーカーへの信号配分が自動的に行われ,即時にパンニングを行うことが可能に
なった。
また,テンプレート機能は,複数の音像の移動や回転などの基本的な制作パターンを
あらかじめ保存しておく機能である。この機能により,ミキシングの工程数を大幅に減
らすことができる。例えば3次元パンニング機能を用いて複数の音源を同一方向に移動
させる場合,通常のオートメーション機能(ミキシングのパラメーターを,タイムコー
ド上で時々刻々記録・再現する機能)では,音源ごとに移動操作を記録する必要がある。
これに対しテンプレート機能を用いれば,所望の移動方向に対応するテンプレートを呼
び出し,適用する音源(トラック)を指定するだけで操作を完了することができる。テ
ンプレート機能の有無による制作時間の比較例では,3つの音源を移動させる場合は約
3割に,約60音源から成るコンテンツ制作の場合は6割未満に短縮することができた。
このミキシングシステムは,世界初の22.2ch音響対応のMA(Multi Audio)ルームで
あるNHK放送センターのCD­606スタジオに導入された。
NHK技研 R&D/No.148/2014.11
19
9図 3次元残響付加装置の外観
8
7
大谷採掘場
6
残響時間︵秒︶
5
富士水泳場
4
3
グリーンドーム前橋
NHKホール
エコールーム
スタジオパーク
2
ログハウス
CR506
1
パーカッションブース
CR506
CR506
メインフロア
ボーカルブース
0
1,000
10
100
藝大奏楽堂(残響可変)
とどろきアリーナ
CR509
10,000
100,000
森の中
1,000,000
測定音場の容積(m3)
10図 残響のインパルス応答の測定場所と特性
3.3 3次元残響付加装置
3次元残響付加装置は,さまざまな音場で実測した残響の22chのインパルス応答
9)
を内部に持ち,入力信号にこのIRの畳み込み演算を行うこと
(IR:Impulse Response)
により,22chの残響音を出力する装置である(9図)
。
10図に,これまでにIRを実測した主な測定場所,残響時間,測定音場の容積を示す。
残響時間が1秒未満のCR506スタジオのボーカルブースから,6秒を超える大谷採掘場
まで,多様な空間印象を選択できる。さらに,3次元残響付加装置は,出力チャンネル
ごとのディレー(遅延時間)や,イコライザー(等化器)
,残響時間が可変であり,細や
かに空間印象を調節できる。IRを測定するための信号には,測定時にスピーカーのひず
み成分を分離可能で,測定音場の暗騒音(その場にもともと存在する騒音)の影響が大
き い 低 域 に 関 し て も 実 用 的 なSN比(Signal to Noise Ratio)が 得 ら れ るLog­TSP
*4
有限の継続時間内において,周
波数が時間の対数に比例して変
化する正弦波パルス信号。
20
*4
を採用した10)11)。
(Logarithmic Time Stretched Pulse)
この装置は,これまでに,ロンドン五輪やドラマ,紅白歌合戦など,さまざまな22.2
ch音響コンテンツ制作のポストプロダクション(撮影後の作業)で利用されている。
NHK技研 R&D/No.148/2014.11
4.むすび
8Kの音響制作システムの開発と標準化動向について概説した。今後,8Kの2016年の
試験放送,2018年の実用放送に向けて,放送に必要な国内外の規格や運用規定の策定を
進めると同時に,より臨場感の高い音響をより簡易に制作可能な機器の開発を進めてい
く予定である。
参考文献
1) Rec. ITU­ R BS.1909 ,“Performance Requirements for an Advanced Multichannel
Stereophonic Sound System for Use with or without Accompanying Picture”
(2012)
2) Rec. ITU­R BS.2051,
“Advanced Sound System for Programme Production”
(2014)
にしぐちとしゆき
西口敏行
3) ARIB STD­B59 1.0版,
“三次元マルチチャンネル音響方式スタジオ規格”
(2014)
4) SMPTE ST 2036­2:2008,“Ultra High Definition Television ­ Audio Characteristics
and Audio Channel Mapping for Program Production”
(2008)
5) ARIB STD­B32 3.0版,
“デジタル放送における映像符号化,音声符号化及び多重化方式”
(2014)
6) ISO/IEC 14496­3:2009/AMD 4:2013,
“Information Technology ­Coding of Audio­
visual Objects­ Part 3:Audio”
(2013)
1996年入局。名古屋放送局を
経て,1998年から2009年ま
で放送技術研究所において,
音 響 デ バ イ ス,広 帯 域 オ ー
ディオの研究に従事。再び名
古屋放送局を経て,2012年か
ら放送技術研究所において,
音響制作システムの研究開発
に従事。現在,放送技術研究
所テレビ方式研究部に所属。
博士(工学)
。
7) 小野,西口,松井:
“音響遮蔽板を利用したマルチチャンネルワンポイント球形マイクロホ
ン,
”JASジャーナル,Vol.54,No.3,pp.20­25(2014)
8) 安藤ほか:
“三次元音響パンニング法とその評価,
”音響学会春季講演論文集,1­5­10
(2010)
9) 森,西口,小野ほか:
“三次元残響付加装置に用いるインパルス応答測定におけるマイクロホ
ンの指向性に関する一検討,
”音響学会春季講演論文集,1­P­22(2013)
10)藤本:
“低域バンドでのSN比改善を目的としたTSP信号に関する検討−高調波歪の除去−,
”
11)A. Farina:“Simultaneous Measurement of Impulse Response and Distortion with a
Swept­sine Technique,
”108th AES Convention,Preprint 5093(2000)
お
の かずほ
小野一穂
音響学会春季講演論文集,3­P­18(2000)
1991年入局。同年から放送技
術研究所において,立体音響
再生技術,
音響トランスデュー
サ ー の 研 究 に 従 事。
(一 財)
NHKエンジニアリングシステ
ム出向を経て,現在,放送技
術研究所テレビ方式研究部上
級研究員。
わたなべ
かおる
渡辺
馨
1981年入局。福岡放送局を経
て,1984年から放送技術研究
所において,デジタル放送用
音声符号化方式,高臨場感音
響システムの研究開発および
標準化に従事。ITU­R「先進
的マルチチャンネル音響技術」
ラポータグループ共同議長。
2014年から,
(一社)電波産業
会に業務指定派遣。
NHK技研 R&D/No.148/2014.11
21