マルチメディア情報の ディジタル表現と処理 古坂 和義 1 マルチメディア • メディア – 表現メディア • 情報を表現する手段(例:文字、音声、図形、画像) – 伝達メディア • 情報を物理的に伝達する手段 – 通信メディア(LAN、ISDN等) – 放送メディア(地上波放送、衛星放送、CATV等) – 蓄積メディア(MD、CD、DVD、ビデオテープ) 1 マルチメディア • 表現メディアの分類 – 離散メディア:時間独立なテキスト、静止画等 – 連続メディア:時間依存の動画、音声等 • マルチメディア – 複数の表現メディアを同一の伝達メディアによっ て扱うこと – 狭義の意味では、離散メディアと連続メディアを 同時に扱うこと 2 アナログとディジタル • ディジタルとアナログ • ディジタル化の長所と短所 アナログとは • 物質・システムなどの状態を連続的に変化す る物理量によって表現すること • 人が普段接するものの多くはアナログ的なも のである ディジタルとは • 物質・システムなどの状態を、離散的な数字・ 文字などの信号によって表現すること • 曖昧な中間部分をなくすこと ディジタル化の長所と短所(1) • 長所 – 画像、音声、動画などの情報を同一の次元で加 工処理できる – 情報の圧縮や暗号化することができる – データの劣化がない – 情報の再利用や保存、取り出しが容易である ディジタル化の長所と短所(2) • 短所 – 音声や画像、動画の場合、標本化や量子化に よって一部の情報が失われる – 情報の劣化なしに複製することができる – 情報を不正に書き換えることができる – 個性が失われる 3 アナログデータのディジタル化 • • • • • • 標本化 量子化 音声のディジタル化 画像のディジタル化 エイリアシング 標本化定理 標本化 標本化とは? 連続するデータを一定間隔ごとに、その区間の 代表的な値に変換すること 音声の場合 一定の時間間隔で標本化 画像の場合 一定の面積ごとに標本化 量子化 量子化とは? アナログ信号の大きさを数値として変換すること 音声のディジタル化 20 15 10 5 0 画像のディジタル化 標本化・量子化に伴う誤差 • 標本化を行う際に発生する誤差 – エイリアシング • 量子化を行う際に発生する誤差 – 量子化誤差 エイリアシング エイリアシング 標本化を行った時に発生する元のデータには含 まれていないデータのこと 音声の場合 本来無いはずの音が現れる 画像の場合 ジャギー(図形の縁がギザギザになっている)の発生 エイリアシングの例 標本化定理 標本化を行う際に、原信号に含まれる周波数成分をすべて 正確に標本化するには、原周波数の2倍以上のサンプリン グ周波数が必要となる •音声の場合 人が聞き取れる最大の周波数は22KHzであるとさ れている よって、この時のサンプリング周波数は22KHzの 2倍である44KHzあれば全ての音声情報を正確に 標本化できる CDは44KHzで標本化されている 標本化定理 信号周波数は0.25Hz サンプリング周波数は0.5Hz 標本化定理 信号周波数は0.25Hz サンプリング周波数は0.33Hz 量子化誤差 仮にこの目盛りを1mmの定規の目盛りとすると、この量子化に よって、±0.5の誤差が生ずる 標本化定理の演習 • サンプリング周波数の変更による音の変化を 耳と目で観察する • 量子化ビットの変更による音の変化を観察し てみる • 電話の音声をディジタル化するときにもっとも 適切なサンプリング周波数を求めよ データの圧縮 • 圧縮の分類 – 可逆圧縮 • 圧縮されたデータを伸張したときに元のデータに完全 に復元できる • 汎用的に用いることができる • 主にデータの圧縮に用いられる – データの圧縮ではLzh、Zip等 – 画像データのGif,PNG形式は可逆圧縮である データの圧縮 – 不可逆圧縮 • 圧縮されたデータを伸張したときに元のデータには復 元する事ができない • 圧縮対象となるデータの特徴を利用して圧縮すること が多い • 汎用的なデータの圧縮には不向き – 音声:MPEG-1 Audio Layer3 – 画像:Jpeg – 動画:MPEG-1、MPEG-2 JPEG • Joint Photographic Expert Groupという 委員会でまとめられた • 特徴 – 人は輝度の変化に比較して色の変化を認知する 能力が低い事を利用し、色差情報を間引く – 緩やかに変化する部分の輝度、色の階調差には 敏感だが細かく変化する箇所では少ない階調で も不自然さを感じない RGBとYCrCb • RGBは色の3原色赤、緑、青 • Y= 0.299R+0.587G+0.114B • Cr= -0.169R-0.3316G+0.500B • Cb= 0.500R-0.4186G-0.0813B JPEG • カラー画像をYCrCbへ変換する。この時Yを 基準としてその周囲4点のデータを平均した 値をCb、Crの値にする Y成分 Cb、Cr成分 JPEG JPEG • 8×8画素ごとの小ブロックに分割する • 各ブロックについてDCT(離散コサイン変換) を行う • DCTの結果から高周波成分を間引くか取り 去る JPEG • ブロックノイズやモスキートノイズが発生する • 圧縮する度に画質が劣化していく • 絵(CG等)の様な物は、写真に比べて、劣化 が目立つのでPNG形式等を用いる方がよい • JPEG2000という新しい規格も存在する 圧縮による画質低下 元画像 圧縮後 拡大 GIFとPNG • GIF – LZW(Lempel Ziv Welch)圧縮アルゴリズムの改 良した物を用いている – 256色までしか使用できない – 写真より絵(CG)の圧縮に向いている – 特許の問題から最近ではPNG形式への移行が 進んでいる – アニメーションや透明処理ができる GIFとPNG • PNG – zip圧縮アルゴリズムを用いている – 理論上最大で280兆色まで使用できる – GIFに比べ10~30%ほど圧縮率が高い – 写真より絵(CG)の圧縮に向いている – 複数色の透明処理ができる – ライセンスフリーである データ圧縮の演習 • 画像(写真と絵)をJpeg、Gif、PNGを用いて 圧縮し、ファイルサイズや画質等の特徴を比 べる • Lzh、Zipを用いて圧縮し上と比較する
© Copyright 2024 ExpyDoc