Document

インターネット概論
デジタルデータの量
圧縮
デジタルは、1 、 0 ?

Dig-it-al [-l] a. 研究社 新英和中辞典




1. 指(状)の;指のある; 数字(digit)を使う
2. 指幅(約3/4インチ)
3. アラビア数字(0-9)のうちの1つ;本来指で数えた)
単にコンピュータの数字の表現方法が2進数



コンデンサーが電化されている・いない
電圧がある・ない
スイッチがON/OFF
電源がなければ動かない


MPU,主記憶,ハードディスク,各種インターフェースに電力を
供給
交流100Vを変換



+5V
+12V
-5V
-12V
最近の電圧事情

低消費電力,高速化

+3.3V, +2.5V,+1.9V
電圧
5V
1.9V
時間
クロックと値

クロックの値
 データ転送では、情報転送速度


シリアル、パラレル
計算では、計算の速さ
Clock
6bit の情報
データ転送
計算
計算1
計算2
計算3
計算4
コンピュータ上での表現方法





2進数
数字の最小表現単位: bit
8 bit = 1 byte
1 byte: 1文字を表現
アルファベット: 小文字2+大文字+数字+
特殊記号


26+26+10+32=94
表現できる数

1bit = 2, 2bit = 4, 3bit = 8, 4bit = 16, 5bit = 32,
6bit = 64, 7bit = 128, 8bit =256
Bit, byteの表現方法


Bit: 0か1
Byteまたはbit列を表現する方法

00001010:



8進数の値として表現
013: 通常頭に0をつけることが多い
A:


2進数としての表現
13:

単純なbitの列として表現
16進数の値として表現
0x0A: 通常頭に0xをつけることが多い
10:
10進数の値として表現
Byteでの表現方法
01001000 11100011 16bit 2byteのbit列
16進数の場合 4
8
E
3
4bitづつで考える
=> 0x48E3
01001000 11100011 16bit 2byteのbit列
8進数の場合 0 4
4
3
4
3
3bitづつで考える
=> 044343
単位






bit: 0 or 1
Byte: 8bit
1 K = 1024 = 2 ** 10
1 M = 1024 K = 2 **20
1 G = 1024 M = 2 ** 30
1 T = 1024 G = 2 ** 40
単位その2

ディスクやメモリなどの情報量


通信速度



Byte
bps (bit per second)
Bps (Byte per second)
CPUの速度


mips (Million Instruction per second) (Million = 100万)
flopsやポリゴン数やいろいろ
ざっくり情報量







CNSのquotaは、1G byte ぐらい
CNSのディスクの総量は、大体1T byteぐらい
Floppy Disk 1枚で、1.44M byte
CD-ROM1枚で、約600M byte
ZIPドライブで、約100M byte
最近のPCのメモリは、大体64M byte~512MByte
画像ファイル 1ページ分は、数10K byte
ざっくり通信速度







モデムは、19.2Kbps, 28.8Kbps, 36.6Kbps
ISDNは、64Kbps, 128Kbps
LANは、10Mbps ~ 1Gbps
CNSのバックボーンは、100 Mbps ~ 155Mbps
光ファイバー1本で、155Mbps, 600Mbps,
2.4Gbps
普通のテレビ(圧縮して)4~15Mbps/ch
高精細テレビ(圧縮して)40~60 Mbps/ch
ざっくりCPUの速さ





Pentiumで200 MIPSぐらい
ちょっと前のMAC MC68040で、20MIPS
早いといわれているDEC Alphaで、2GIPS
SegaSaturn: CPU 50MIPS, 5万ポリゴン/秒
PlayStation: CPU 30MPIS, 36万ポリゴン/秒
ざっくり相互関係


情報量・通信速度・CPUの速さの関係
例1 「音楽CD 1曲を, ISDNでコピーしたら、何時
間?」

音楽1曲 5分として、データ量は、


600 * (5/60) = 50(M byte)
50(M byte) / 64(K bit / sec) = 400000 (K bit) / 64(K bit/sec) =
6250 sec = 約105分 = 約2時
ざっくり相互関係

例2「プレステーションて、どのくらいのもの?」




36万ポリゴン/秒
テレビは、30 Frame/secだから、1 Frame =1万ポリ
ゴン
1万の多角形で、絵がかけるだけの性能
1万多角形とは、画面を縦と横で、それぞれ1/100づ
つ
静止画像





動画ではない
紙などに印刷されているもの
ディスプレイに表示されていて、動かない
ドキュメント
紙のイメージ
イメージのデータ


絵を細かな点(ドット、ピ
クセル)に分割する
単位:


dpi: dot per Inch
 プリンタ: 300 dpi, 480
dpi
pixel x pixel(画素数)
 VGA: 640 x 480
 SVGA: 800 x 600
 デジカメ: 768x576: 41
万画素
 35mmカラーフィルム:
600万画素程度
色の表現方法

加法混色




RGB(Red, Green, Blue)
3色の光を比率に変えて混
合する
R+G = イエロー、G+B= シ
アン、B+R= マゼンタ、
R+G+B=白
減法混色


CMY(シアン、マゼンタ、イ
エロー)
白からR,G,Bの1色を引い
たもの(加法混色の原色の
補色)
色データ







3原色のそれぞれのパーセンテージ
銀塩写真: アナログ連続階調表現
デジタルの世界は、例えば8bit 256階調表現
それぞれの原色を8bitで表現して、24bitで1色
もちろん白黒なら1bit
最近のスキャナーやデジタルカメラでは、1024 ~4096
階調も出始めている。
しかし、コンピュータの処理系、および出力系では、8bit
階調が主流
静止画像の情報量

Pixelの総数 x Depth







300dpiのA4プリンタ
A4=210mm x 297mm
= 8.3 x 11.7 inch(1 inch = 2.54cm)
2490 x 3510 = 8,739,900 Pixel = 約8Mbit = 約
1Mbyte
モノクロプリンタならdepth=1
600dpiだったら、4倍の約4Mbyte
Full Color(Depth=24bit)だったら、24Mbyte
情報量(続き)

ディスプレイ(VRAMの量)






800x600 = 480000 pixel = 480Kbit = 60Kbyte
白黒なら、60Kbyte
同時発色数 256 色の場合、 480Kbyte
16bit Colorの場合、960Kbyte
24bit Colorの場合、1.44Mbyte
1024 x 768 x 24 = 約 2.35 Mbyte
プリンタ

レーザープリンタ





黒いトナーを乗せて熱で焼きつける
トナーの細かさが重要
乾式、湿式
ビームを微妙にずらす疑似解像度
インクジェットプリンタ



インクを吹き付ける
バブルジェットプリンタ
インクの泡をはじけさせた時の粒を吹き付ける
ビットマップファイル

ヘッダ情報



データに関する情報
イメージデータ
XWD
圧縮


保存、通信にとっては必須
メディアの性質を利用



FAXなどでは、「白画素、黒画素は、それぞれ継続する確率が
高い」=>ランレングス符号化
静止画像や動画像では、「画素間やフレーム間の相関が高い」
人間の視覚特性を利用したデータ圧縮
 「斜め方向の視覚感度は、水平・垂直方向に比べて低い」
 「早い動きに対して視覚感度は、低下する」
可逆符号化と非可逆符号化

可逆符号化




文字情報、2値画像など劣化があると困る場合
文字:LZW符号化
2値画像:
 MH(モディファイドハフマン)符号化
 MR(モディファイドリード)符号化
非可逆符号化




複合化して得られる再生信号は、原信号を完全には再現してい
ない。
符号化により生じる歪み(雑音)を人間が許容できる
画像: JPEG(可逆符号化もある)
動画: H.261, MPEG1, MPEG2
テキストの圧縮


ASCII Code: 7bit固定長で文字を表現
文字の出現頻度別に可変長のコード






例えば、
T最も多く出現する: 1
2番目は、hだった:
10
3番目は、eだったので:
11
あまり使われていないZは、7Bit以上になる。
これでも約1/2ぐらいまで圧縮できる。
テキストの圧縮

文字単位で可変長のコードを与える



半分ぐらいまで圧縮できるといわれてい
ハフマン符号
単語単位でコードを与える
 1/4ぐらいまで圧縮できると言われている

zip
ハフマン符号化

Huffman Code


D.A.Huffman(Proceedings of the Institiute of
Radio Engineers 40: pp1098-1101, 1952
テキスト上に現れる文字の出現確立の比を調べ
る
動画像




Video CD
DVD
Digital Video
QuickTime Move
テレビ



アナログ
一般のビデオ機器がほとんどテレビ方式を基本
テレビ方式との整合する機能が必要
テレビ放送方式の必然の要因



1本の信号ですべてをおくる必要
画像データのバッファを持たない
モノクロテレビとの互換性
NTSCの通信周波数領域
6MHz
キャリア
周波数
FM音声
輝度信号領域
色信号領域
I信号
領域
-1
0
領域
IQ信号
領域
5 MHz
インターレース、ノンインターレース
1
2
3
261
262
インターレース走査(2:1)
2フィールドで1フレームを構成
263
1
2
5
525
ノンインターレース走査(2:1)
1フィールドで1フレームを構成
インターレースとノンインターレース

N:1インターレース方式(飛び越しスキャン方式)



N本おきに飛び越し走査し、次に1本ずれたところか
ら、N本おきに飛び越し走査
テレビは、2:1インターレース方式
現在の多くのコンピュータ用CRTは、


順次に走査する。
ノンインターレース(または、プログレッシブ走査、線
順次走査)
インターレース方式をとる理由

動画を滑らかに見せるためには、



毎秒24~30フレーム
ところがCRTのちらつきを目立たなくするために
は、画面全体を毎秒60回以上で走査する必要
がある。
=>フレーム数は、毎秒30フレームで、書き換
えタイミングを毎秒60回にする。これがインター
レース
コンピュータの端末は、ノンインター
レース




コンピュータは、メモリ内の情報を毎秒60回で読
み出して表示することは、簡単。
エッジがシャープなものは、インターレースだとち
らつく
最近のテレビでは、メモリを受像機側でもって、ノ
ンインターレース化を行い表示しているものもあ
る。
DVDプレイヤーなどもノンインターレース(プログ
レッシブ)な出力が可能になってきている
色信号処理

RGBとY/C(モノクロとの互換)



コンピュータ: RGBをそのまま扱う
テレビ: 輝度信号Y(モノクロ濃淡信号)と色差信
号Cで伝送
コンポジットとコンポーネント信号


コンポジット:色情報を1つのチャネルに合成して
伝送する(電波やケーブルで送る場合)
コンポーネント:色情報をマルチチャネルに分けて
伝送するものの総称(AV機器を接続する場合)
テレビ信号のデジタル・サンプリング

テレビ方式とサンプリング例
方式
NTSC
PAL
SECAM
画素数
走査方式 フレーム
レート
720x480 2:1 イ ン 30
ターレー
ス
720x575
25
使用国
日本、アメリカカ
ナダ、メキシコ
フランスを除くほ
とんどの欧州
フランス、ロシ
ア、東欧
サンプリング


1画素の輝度信号、色差信号をそれぞれ8ビットでサン
プリングするのが標準
人間の視覚特性により、輝度信号に対して色差信号の
サンプリングレートを落とす
 4:2:2フォーマット




水平方向の隣接する2画素をまとめて色差信号を割り当てる方式
1画素あたり16bit
色差情報は輝度情報の1/2
4:2:0フォーマット

水平垂直各方向に隣接する2画素(計4画素)をまとめて色差信号を割り
当てる
1画素あたり12bit

色差情報は輝度情報の1/4

ビデオデータの圧縮


30秒のコマーシャルで、600MB、CD1枚
JPEGやMPEGなどの圧縮



ビデオキャプチャ方式が最も汎用性がある



JPEGで1/10 ~1/30
画素数を間引く(水平垂直方向1/2にすれば)
ファイルへの保存
通信
データの圧縮が必要
Motion JPEG

基本的には静止画像用圧縮標準




DCT(Discrete Cosine Transform: 離散コサイン変
換)
シーケンシャル表示(左上から右下へ)
プログレッシブ表示(最初に低解像度から高解像度)
Motion JPEG, JPEG Movie

すべてのフレーム毎にJPEG圧縮
H.261





テレビ会議の画像圧縮符号化方式
早送りや巻きもどしなどの機能を考慮しない
(VCR Function)
フレーム間の差分(フレーム相関)を用いて圧縮
最初の1フレームだけ、フレーム内符号化
それ以後は、前のフレームとの相関のみ符号化
MPEG


VCR Functionを考慮した動画像圧縮符号化
何フレームか毎にフレーム内(Intra-frame)符号
化を行う




このフレームのことをI Picture(IP; Intraframe
Picture)と呼ぶ
Iフレーム以後は、フレーム相関を用いて圧縮
早送り再生や巻き戻し再生時は、IPのみ再生
任意のフレームへのジャンプは、最寄りのIPから
の計算
MPEGにおけるフレーム相関
I ピクチャ: フレーム内データのみで圧縮
P ピクチャ: 時間的に前のI もしくはPからの変化分
B ピクチャ: 前後両方の再生画像からの予測



1
2
3
4
5
6
7
I
B
B
P
B
B
P
順方向予測
順方向予測
逆方向予測
順方向予測
逆方向予測
順方向予測
MPEG 1

H.261/JPEGとの共通性

符号化単位をマクロブロック
(MB)とする


DCTによる空間的情報圧
縮
エントロピー符号化(可変長符
号化)


MPEG1の新しい考え方

動き補償フレーム間予測
などを利用
全体の符号発生量の制御

DCT係数の量子化ステッ
プ制御で行う
ランダムアクセスを可能にする


MBをサブブロックに細分


時間的画面相関で情報圧
縮

符号化処理の時間の許容


GOP(Group of Pictures)
構造
復号処理はリアルタイム
性
解像度に自由度を

NTSC, PALの両方式との
親和性
デジタルデータの量
圧縮方式
NTSC 非圧縮
DV 圧縮
デジタル S
MPEG2
MPEG1
M-JPEG
データ量(分)データレート
1623MB
216Mbps
187MB
25Mbps
375MB
50Mbps
30MB
4.0Mbps
10MB
1.4Mbps
720MB
96Mbps
H.261, MPEG1 MPEG2の違い
H.261
符号化レート
P*64Kbps
(p=1 – 30)
符号化対象画像 352*288*30(CI
F)
176*144*30(QC
IF)
基本アルゴリズ 動き補償予測+
DCT
ム
フレーム内符号 マクロブロック
化の周期
単位で132回
の符号化に少な
くとも1回
MPEG1
- 1.5Mbps
352*240*30 or
352*288*25
MPEG2
- 15Mbps
Max720*576*3
0
動き補償予測+ 動き補償予測+
DCT
DCT
GOP単位
GOP単位