i +1

An Algorithm for Low Memory Bandwidth
Wavelet Video Compression and its VLSI
Implementation
大阪大学大学院工学研究科 情報システム工学専攻
情報システム工学基礎論講座 情報システム構成学領域
博士後期課程3年 大巻 ロベルト 裕治
発表内容
1.研究の背景
2.離散ウェーブレット変換とその画像圧縮への
応用
3.ハードウェア向きDWTアルゴリズムの概要
3.1 離散ウェーブレット変換
3.2 埋め込みゼロツリー
3.3 評価結果
4.アーキテクチャおよび実装結果
5.結論
背景 (1)

マルチメディアデータの様々な分野におけ
る利用
静止・動画像符号化アルゴリズムに要求される
機能の多様化
スケーラビリティ
• 解像度
• ビットレート
従来の符号化アルゴリズムでは対応が困難
背景 (2)

離散ウェーブレット変換
(DWT: Discrete Wavelet Transform)
 自然画像の圧縮に適している
 解像度のスケーラビリティ
 埋め込みコードの出力によるビットレートのスケーラビ
リティ
大容量のメモリが必要
VLSI化が困難
ハードウェア実装に適したDWTベースの動画像符号化手法
の考案,およびそのVLSI化実現
発表内容
1.研究の背景
2.離散ウェーブレット変換とその画像圧縮
への応用
3.ハードウェア向きDWTアルゴリズムの概要
3.1 離散ウェーブレット変換
3.2 埋め込みゼロツリー
3.3 評価結果
4.アーキテクチャおよび実装結果
5.結論
ウェーブレット変換

「小さな波」へのシフトとスケール操作に
よって生成される関数基底による信号の
近似
シフト
0.1
1
2
3
4
5
6
7
-0.1
-0.2
スケール
2次元離散ウェーブレット変換
原画像
水平方向1次元DWT
垂直方向1次元DWT
• 低周波成分と高周波成分に分割
(情報は低周波成分に集中)
• 空間情報の保存
EZW(Embedded Zerotree Wavelet) ア
ルゴリズム
DWT係数の特徴
• 絶対値が小さい値が多い
• サブバンド間の相関性
ゼロツリーデータ構造を導入
埋め込みコードを生成することにより、1つのビットストリーム
であらゆるビットレートに対応
データアクセスが複雑なため、DWT係数を格納するために
大容量バッファが必要
EZWによるDWT係数の符号化
Pixel val.
DWT coef.
EZW
2次元DWT
転置
メモリ
EZW code
係数
バッファ
bitstream
算術符号化
メモリ容量 / バンド幅
の増大
DWTとDCT(離散コサイン変換)
DCT
ブロック
ノイズ
レート
制御
処理単位
DWT
有り
(低ビットレート時)
無し
複雑
EZWにより容易
に実現
ブロック単位(88)
フレーム全体
DWTでは大容量のメモリが必要
2次元DWTにおけるメモリ削減
Overlapped Block-based DWT
overlap
互いにオーバーラップする
ブロックを単位に2次元DWT
を実行
Line-Based DWT
水平1-D DWTと垂直1-D
DWTを並行して行う
従来方式の問題点



オーバーラップブロックベースDWTでは大
量のレジスタが必要
制御回路の増大
DWT,EZW間に必要となるバッファについ
ては考慮されていない
まとめ
離散ウェーブレット変換
 DCTよりも高い圧縮効率
 大容量のメモリが必要
 2-D DWTのメモリ容量の削減法は提案
されているが,符号化器全体を考慮した研
究は少ない
発表内容
1.研究の背景
2.離散ウェーブレット変換とその画像圧縮への応
用
3.ハードウェア向きDWTアルゴリズムの概要
3.1 離散ウェーブレット変換
3.2 埋め込みゼロツリー
3.3 評価結果
4.アーキテクチャおよび実装結果
5.結論
提案符号化アルゴリズムの概要

メモリの容量および帯域幅の削減



ハードウェア量の削減


低メモリバンド幅2次元DWTによる転置メモリ
の削減
部分ゼロツリーEZWによるバッファの削減
フレーム内圧縮のみ
スケーラビリティ

EZWによる柔軟なレート制御
提案2次元DWTアルゴリズム
従来方式
Horizontal lev.1 Vertical lev.1 Horizontal lev.2 Vertical lev.2
提案方式
Horizontal lev.1 Horizontal lev.2 Vertical lev.1 Vertical lev.2
転置メモリ容量の比較
512×512ピクセル画像
(5,3) フィルター
従来
Overlapped Linebased
block
提案
メモリー
(ワード数)
262,144
2,555
4,096
32,768
種別
memory
register
memory
memory
ゼロツリーデータ構造
•ビットプレーン単位で処理を行う
•全ての子孫が0であるサブツリー
はZR(Zerotree Root)という単独
シンボルとして符号化
MSB
PS
+1
0
-1
IZ
0
0
0
0
0 0 0 +1 0 0 0 0
NS
0
ZR
-
ZR
IZ
-
IZ PS -
-
-
-
-
部分ゼロツリーEZW探索
PS
Vertical DWT coefs
IZ
NS
IZ
ZR
IZ
ZR
- IZ
ZR ZR
- ZR
- ZR
- ZR
ZR
PS
Horizontal lev.3 (Low-freq.)
ZR
Input to vertical
DWT
-
ZR
IZ
-
IZ PS
Partial zerotree
システム全体のメモリ容量の比較
512×512ピクセル画像
(5,3) フィルター
従来
Overlappe
d
block
Linebased
提案
DWT
262,144
2,555
4,096
32,768
EZW
262,144
262,144
262,144
32,768
合計
524,188
264,699
266,240
65,536
性能評価 (Football)
性能評価(Mobile)
復元画像
Football frame # 10
MPEG-2
(PSNR:28.2 dB)
DWT
(PSNR:30.2 dB)
DCTによるブロックノイズ
MPEG2
MPEG-2
DWT
提案方式
まとめ

低メモリバンド幅2-D DWTアルゴリズム
転置メモリの削減

部分ゼロツリーEZW探索
• DWT,EZW間のバッファ容量の削減
• 水平方向と垂直方向のDWT係数を
独立に処理
フレーム内圧縮のみで高い圧縮効率を実現
発表内容
1.研究の背景
2.離散ウェーブレット変換とその画像圧縮への応
用
3.ハードウェア向きDWTアルゴリズムの概要
3.1 離散ウェーブレット変換
3.2 埋め込みゼロツリー
3.3 評価結果
4.アーキテクチャおよび実装結果
5.結論
提案符号化器アーキテクチャ
リフティングアルゴリズムによるDWTフィル
タ
 部分ゼロツリーEZWによる水平,垂直方向
ゼロツリー探索を独立に処理
 ビットプレーン処理rの並列化

提案符号化器の全体構成
Pixel data
M
U
X
DWT Unit
Stage 1 FU
Stage 2 FU
M
U
X
Dominant
Path code
AC Unit
EZW
Unit
Compressed
dominant code
Output Buffer
Horizontal
lev. 3L
Horizontal
lev. 3L
Line Buffer Control
Horizontal
Partial zerotrees
Line Buffer
DMA
External SDRAM
DWT演算器のアーキテクチャ (1)
リフティングアルゴリズム
FIRによる演算
C2k-2 C2k-1 C2k C2k+1 C2k+2
High
Freq.
・ ・ ・ Hk
Low
Freq.
Lk ・ ・ ・
1
3
High
Freq. C2k-2 Hk C2k
2
Low
Freq.
高周波成分と低周波成分
を独立に演算
C2k-2 C2k-1 C2k C2k+1 C2k+2 C2k+3
L
Hk+1 C2k+2 H
4
Hk
L
5
6
H
L
H
高周波成分の演算結果を
低周波成分の計算に利用
演算数を50%削減
DWT演算器のアーキテクチャ
(2)
DWT FILTER
リフティングフィルタ
DWT FILTER
レベル1
レベル2、3
3レベルの1次元DWTを
1係数/サイクルで実行
EZWユニット
ビットストリーム
bitplane 1(MSB)
0
Compare
+00110
bitplane 2
bitplane 3
0
+1(MSB)
bitplane 4
bitplane 5(LSB)
1
+001
Update
Sub.
Bits Gen.
10
Dominant Path Code
Subordinate Path Code
メモリアクセス回数の削減:
全てのビットを並列に処理
0
EZWユニット (2)
• 部分ゼロツリーアルゴリズム
を用いることにより水平EZW
と垂直EZWを独立に処理
レベル間比較のパイプライン化
が可能
AC (arithmetic coder) ユニット
bitplane i symbol
(PS/NS/ZR/IZ)
bitplane i-1 symbol
bitplane i output code
state transition
table
new state
current state
bitplane i+1 symbol
(PS/NS/ZR/IZ)
state register
bitplane i symbol
state transition
table
bitplane i +1 output code
new state
state register
current state
全てのビットプレーンの処理を並列に行う
水平モードにおける動作
M
Pixel U
Data X
DWT Unit
Stage 1 FU
Stage 2 FU
M
U
X
Dominant
Path code
AC Unit
EZW
Unit
Compressed
dominant code
Output Buffer
Horizontal
lev. 3L
Line Buffer Control
Line Buffer
Horizontal
Partial zerotrees
DMA
External SDRAM
垂直モードにおける動作
M
U
X
Dominant
Path code
DWT Unit
Stage 1 FU
Stage 2 FU
M
U
X
AC Unit
EZW
Unit
Compressed
dominant code
Output Buffer
Horizontal
lev. 3L
Horizontal
Partial zerotrees
Line Buffer Control
Line Buffer
DMA
External SDRAM
実装結果
テクノロジー
0.35 um 3LM
CMOS
動作電圧
3.3 V
チップサイズ
4.934.93 mm2
パッケージ
160 pin QFP
トランジスター数
341,440
動作周波数
33.0 MHz
消費電力
210 mW
ターゲット画像
NTSC (720480)
4:2:0 YCbCr 30fps
まとめ
リフティングアルゴリズムによるDWT
フィルタのゲート数の削減
 水平,垂直各方向の1-D DWTとEZW探索
処理をパイプライン化
 ビットプレーン処理を並列化
実時間処理と小面積を両立

発表内容
1.研究の背景
2.離散ウェーブレット変換とその画像圧縮への応
用
3.ハードウェア向きDWTアルゴリズムの概要
3.1 離散ウェーブレット変換
3.2 埋め込みゼロツリー
3.3 評価結果
4.アーキテクチャおよび実装結果
5.結論
結論
DWTによる動画像符号化アルゴリズム
およびそのVLSI化実現



低メモリバンド幅2次元DWT
部分ゼロツリーEZWによるモジュール間のバッファ容
量の削減
メモリの容量とバンド幅を削減することにより
小面積ハードウェアによる実時間処理を実現