第四回 レポート課題 1. 確率分布が表 1 となる情報源を Huffman アルゴリズムで符号化した 時の平均符号長 R を求め,圧縮限界と比較せよ. 表 1: X の確率分布と符号語 X Pr{X = xi } x1 0.36 x2 0.14 x3 0.13 x4 0.12 x5 0.10 x6 0.09 x7 0.04 x8 0.02 回答例 Huffman アルゴリズムより,確率が大きい順に並べた後,一番小さ い二つのかく率を加算してからまた大きい順に並べると,次の表.2-8 のようになる. 表.2-8 にて,最も小さい二つの確率(確率和)に対応する変数に, 0 と 1 を割り当てると,表.9 の最後の行に示した符号語が得られる が,x = (xi )8i=1 の符号長は ` = (2 3 3 3 3 3 4 4) となるので, p = (Pr{X = xi })8i=1 とおくと,平均符号長は R = `pT = 2.7 [ビット] となる. シャノンの符号化定理により,離散無記憶情報源の圧縮限界は H(X) となるので, H(X) = − Pr{X = xi } log2 Pr{X = xi } = 2.6209 [ビット] であり,表.9 で与えられた符号は無歪み圧縮の条件式 R ≥ H(X) を満たす. 1 x1 0.36 x2 0.14 x1 0.36 x3 0.13 x2 0.14 x1 0.36 表 2: 一回目 x4 x5 0.12 0.10 表 3: 二回目 x3 x4 x5 0.13 0.12 0.10 x6 0.09 x6 0.09 表 4: 三回目 x6 + x7 + x8 x2 x3 0.15 0.14 0.13 x1 0.36 x1 0.36 x4 + x5 0.22 x7 0.04 表 5: 四回目 x6 + x7 + x8 0.15 x7 + x8 0.06 x4 0.12 x2 0.14 x8 0.02 x5 0.10 x3 0.13 表 6: 五回目 x2 + x3 x4 + x5 x6 + x7 + x8 0.27 0.22 0.15 表 7: 六回目 x4 + x5 + x6 + x7 + x8 x1 0.37 0.36 x2 + x3 0.27 表 8: 七回目 x1 + x2 + x3 x4 + x5 + x6 + x7 + x8 0.63 0.37 2. 集合 X = {x1 , x2 , x3 } の入力 X に対して,出力 Y が集合 Y = {y1 , y2 , y3 } 上の要素となる三元無記憶対称通信路において,xi ,i = 1, 2, 3, が入力された時に yj ,j = 1, 2, 3, が出力される確率を次の通 信路確率行列の (i, j) 番目に記述して表現した場合,この通信路の 容量を求め,通信路容量を達成するための X の確率分布を求めよ. 0.3 0.2 0.5 p(y|x) = 0.5 0.3 0.2 0.2 0.5 0.3 回答例 Pr{X = xi } = pi , i = 1, 2, 3 とおくと,相互情報量は定義および資 2 表 9: 割り当て符号語の変化 x1 X E(xi ) 一回目 二回目 三回目 四回目 五回目 六回目 七回目 0 00 x2 0 0 10 010 x3 x4 0 0 00 00 100 1 1 11 011 x5 x6 1 1 01 01 101 0 0 0 10 10 110 x7 0 10 10 10 110 110 1110 x8 1 11 11 11 111 111 1111 料 p.65 の三行目の式を用いて I(X; Y ) = H(Y ) − H(Y |X) 3 3 ∑ ∑ = H(Y ) − pi p(yj |xi ) log p(yj |xi ) i=1 j=1 で表される. p(y|x) の書き方により,p(yj |xi ) は p(y|x) 行列の (i, j) 番目の値な ので 3 ∑ p(yj |xi ) log p(yj |xi ) j=1 = −(0.2 log2 0.2 + 0.3 log2 0.3 + 0.5 log2 0.5) である. この i に依存しない値を h3 とおくと I(X; Y ) = H(Y ) − h3 3 ∑ pi = H(Y ) − h3 i=1 より C = max I(X; Y ) = max H(Y ) − h3 p p が得られ,H(Y ) は確率変数 Y が均一の確率分布を持つ時に最大と なるので,通信路容量は C = log2 3 − h3 = 0.0995 [ビット] 3 である. 次に,通信路容量を達成する X の分布を求める.表現の便宜上, p = (p1 , p2 , p3 ) とし,y = (Pr{Y = y1 }, Pr{Y = y2 }, Pr{Y = y3 }) とすると, y = pp(y|x) の関係式となるので,Y が均一の確率分布を持つ X の分布は 1 0.3 0.2 0.5 3 (p1 , p2 , p3 ) 0.5 0.3 0.2 = 13 0.2 0.5 0.3 1 3 となる p を求めることになる.具体的な解き方は線形代数の教科書 に譲るが,結果的には ( ) (p1 , p2 , p3 ) = 13 13 13 である. 3. 二重バリティ・ビット方式が 1 ビットの誤りを訂正できる事実から 符号語間の最小 Hamming 距離が満たすべき条件を導き,橋本版資 料 (p45) の符号器から送られた次の受信語を復号せよ. (a) 11110010101111101001 (b) 11110010101111100101 回答例 符号語間の最小 Hamming 距離を dmin とすると,橋本先生のテキス トの定理 3-2 より,最小距離復号より訂正可能な最大ビット数は tmax ≤ b dmin − 1 c 2 を満たす.二重バリティ・ビット方式が 1 ビットの誤りを訂正でき るので, dmin − 1 1≤b c 2 を満たし,この符号の最小 Hamming 距離は3もしくは 4 となる. 橋本先生のテキスト http://borodin.ee.uec.ac.jp/~hasimoto/lecture/Joho/book_ind.pdf p.223 にある問題 3-3 の回答を参考 4
© Copyright 2024 ExpyDoc