スライド 1 - 舟橋研究室

マルチメディア情報の
ディジタル表現と処理
古坂 和義
1 マルチメディア
• メディア
– 表現メディア
• 情報を表現する手段(例:文字、音声、図形、画像)
– 伝達メディア
• 情報を物理的に伝達する手段
– 通信メディア(LAN、ISDN等)
– 放送メディア(地上波放送、衛星放送、CATV等)
– 蓄積メディア(MD、CD、DVD、ビデオテープ)
1 マルチメディア
• 表現メディアの分類
– 離散メディア:時間独立なテキスト、静止画等
– 連続メディア:時間依存の動画、音声等
• マルチメディア
– 複数の表現メディアを同一の伝達メディアによっ
て扱うこと
– 狭義の意味では、離散メディアと連続メディアを
同時に扱うこと
2 アナログとディジタル
• ディジタルとアナログ
• ディジタル化の長所と短所
アナログとは
• 物質・システムなどの状態を連続的に変化す
る物理量によって表現すること
• 人が普段接するものの多くはアナログ的なも
のである
ディジタルとは
• 物質・システムなどの状態を、離散的な数字・
文字などの信号によって表現すること
• 曖昧な中間部分をなくすこと
ディジタル化の長所と短所(1)
• 長所
– 画像、音声、動画などの情報を同一の次元で加
工処理できる
– 情報の圧縮や暗号化することができる
– データの劣化がない
– 情報の再利用や保存、取り出しが容易である
ディジタル化の長所と短所(2)
• 短所
– 音声や画像、動画の場合、標本化や量子化に
よって一部の情報が失われる
– 情報の劣化なしに複製することができる
– 情報を不正に書き換えることができる
– 個性が失われる
3 アナログデータのディジタル化
•
•
•
•
•
•
標本化
量子化
音声のディジタル化
画像のディジタル化
エイリアシング
標本化定理
標本化
標本化とは?
連続するデータを一定間隔ごとに、その区間の
代表的な値に変換すること
音声の場合
一定の時間間隔で標本化
画像の場合
一定の面積ごとに標本化
量子化
量子化とは?
アナログ信号の大きさを数値として変換すること
音声のディジタル化
20
15
10
5
0
画像のディジタル化
標本化・量子化に伴う誤差
• 標本化を行う際に発生する誤差
– エイリアシング
• 量子化を行う際に発生する誤差
– 量子化誤差
エイリアシング
エイリアシング
標本化を行った時に発生する元のデータには含
まれていないデータのこと
音声の場合
本来無いはずの音が現れる
画像の場合
ジャギー(図形の縁がギザギザになっている)の発生
エイリアシングの例
標本化定理
標本化を行う際に、原信号に含まれる周波数成分をすべて
正確に標本化するには、原周波数の2倍以上のサンプリン
グ周波数が必要となる
•音声の場合
人が聞き取れる最大の周波数は22KHzであるとさ
れている
よって、この時のサンプリング周波数は22KHzの
2倍である44KHzあれば全ての音声情報を正確に
標本化できる
CDは44KHzで標本化されている
標本化定理
信号周波数は0.25Hz
サンプリング周波数は0.5Hz
標本化定理
信号周波数は0.25Hz
サンプリング周波数は0.33Hz
量子化誤差
仮にこの目盛りを1mmの定規の目盛りとすると、この量子化に
よって、±0.5の誤差が生ずる
標本化定理の演習
• サンプリング周波数の変更による音の変化を
耳と目で観察する
• 量子化ビットの変更による音の変化を観察し
てみる
• 電話の音声をディジタル化するときにもっとも
適切なサンプリング周波数を求めよ
データの圧縮
• 圧縮の分類
– 可逆圧縮
• 圧縮されたデータを伸張したときに元のデータに完全
に復元できる
• 汎用的に用いることができる
• 主にデータの圧縮に用いられる
– データの圧縮ではLzh、Zip等
– 画像データのGif,PNG形式は可逆圧縮である
データの圧縮
– 不可逆圧縮
• 圧縮されたデータを伸張したときに元のデータには復
元する事ができない
• 圧縮対象となるデータの特徴を利用して圧縮すること
が多い
• 汎用的なデータの圧縮には不向き
– 音声:MPEG-1 Audio Layer3
– 画像:Jpeg
– 動画:MPEG-1、MPEG-2
JPEG
• Joint Photographic Expert Groupという
委員会でまとめられた
• 特徴
– 人は輝度の変化に比較して色の変化を認知する
能力が低い事を利用し、色差情報を間引く
– 緩やかに変化する部分の輝度、色の階調差には
敏感だが細かく変化する箇所では少ない階調で
も不自然さを感じない
RGBとYCrCb
• RGBは色の3原色赤、緑、青
• Y= 0.299R+0.587G+0.114B
• Cr= -0.169R-0.3316G+0.500B
• Cb= 0.500R-0.4186G-0.0813B
JPEG
• カラー画像をYCrCbへ変換する。この時Yを
基準としてその周囲4点のデータを平均した
値をCb、Crの値にする
Y成分
Cb、Cr成分
JPEG
JPEG
• 8×8画素ごとの小ブロックに分割する
• 各ブロックについてDCT(離散コサイン変換)
を行う
• DCTの結果から高周波成分を間引くか取り
去る
JPEG
• ブロックノイズやモスキートノイズが発生する
• 圧縮する度に画質が劣化していく
• 絵(CG等)の様な物は、写真に比べて、劣化
が目立つのでPNG形式等を用いる方がよい
• JPEG2000という新しい規格も存在する
圧縮による画質低下
元画像
圧縮後
拡大
GIFとPNG
• GIF
– LZW(Lempel Ziv Welch)圧縮アルゴリズムの改
良した物を用いている
– 256色までしか使用できない
– 写真より絵(CG)の圧縮に向いている
– 特許の問題から最近ではPNG形式への移行が
進んでいる
– アニメーションや透明処理ができる
GIFとPNG
• PNG
– zip圧縮アルゴリズムを用いている
– 理論上最大で280兆色まで使用できる
– GIFに比べ10~30%ほど圧縮率が高い
– 写真より絵(CG)の圧縮に向いている
– 複数色の透明処理ができる
– ライセンスフリーである
データ圧縮の演習
• 画像(写真と絵)をJpeg、Gif、PNGを用いて
圧縮し、ファイルサイズや画質等の特徴を比
べる
• Lzh、Zipを用いて圧縮し上と比較する