授業展開#1

情報基礎
講義番号:X61029 科目区分:教養教育科目
対象年次:1-4
 必修
 クラス指定 工(応化)
 講義の内容
コンピュータの構造や歴史を理解し、基本的な情報
処理に関する能力を身に付ける。
 成績評価方法
小テスト、中間試験、期末試験により総合的に評価
する。

情報基礎の位置付け
学習教育目標のC1 数学・自然科学・情報処
理に関する基礎知識
C2科目
 情報処理I
への基礎。
二年次 コンピュータの理解
化学構造式作成ソフト
O
O
H
H
H
O
H
H
H
H
H
OH
CHO
O
O
OHH
CHO
CHO
CHO
OH
H+
O H
H
O H
H
CHO
O
H+
なぜ情報理論を学ぶのか

コンピュータ知識
ワープロ(文書作成)
インターネット(情報収集)

情報処理技術
統計処理(エクセル)
シミュレーション(計算機科学)

理系としての基礎知識
実験データの処理、レポート・論文の作成
分子軌道計算
授業展開#1
序論
1.情報
2.情報の伝達、蓄積
3.情報の処理、アルゴリズム
情報とは
 情報という言葉は、価値観に強く結びついて
いる。価値がなければ、情報は含まれていな
い。利用する主体の主観に依存
 情報技術とは
情報を得る技術、伝える技術、蓄積する
技術、暗号など
データと情報
情報=価値のあるデータ。関心のあるデータ
集めたデータは、主観や価値観によって選別
され、必要な情報となる。
一方で、
 無意味なデータでも、ある人にとっては、貴
重な情報源かもしれない。
記号化されたデータや映像化されたデータ
は情報と同義に扱える。

情報の質
内容:必要な内容が網羅されているか。
時間:更新されているか。
精度:間違いはないか。
よく使う情報はよく更新されるため間違いが少ない。
あまり使わない情報は慎重に評価する必要。
情報が多いと手間・容量・費用の点で大変。
データを検索する・・・基準や整理が必要
情報管理論やデータベース論で重要
情報科学
情報を単なる文字記号列として扱う
シャノン情報理論
 Claude E. Shannon
 情報を意味内容と直接に関係しない客観的
な対象とする。単なる文字列、記号列として、
その大きさ(情報量)を量る方法を提案した。
 すなわち、情報は文字記号列として表され、
情報量は記号の量として量る。
コンピュータ
 コンピュータは、情報を記号化して扱う。
 0か1。2通り。これを1ビット(bit)という。
 0か1がいくつか並んだものをビット列という。
・長さ5のビット列には、25=32通りの可能性
がある。
・長さ5のビット列を5bitという
 ある文字記号を特定のビット列に対応させる
ことにより、文字記号をコンピュータで扱える
ようになる。
情報量
情報量 I(a)=-log2p(a) ( p(a):確率 )
 トランプから1枚引いて、ハートである場合の情報量
は、
I(a) = -log2(13/52)=2 bit
となる。
 確率が小さければ小さい程、情報量は多くなる。
 「二つに一つ」=- log2(1/2)=1 bit
「万に一つ」 = - log2(1/10000)=13.288 bit
 確率が256分の1の事象
=- log2(1/256)=8 bit = 1 byte
1 byte で256種類の事象を記述することができる。

情報の表現と通信






通信:遠隔地に情報を伝えること
伝令、飛脚、伝書鳩・・・・物や人を運ぶ・・・効率が悪い
のろし、手旗信号、モールス信号、電話・・・・情報を符号化
ノイズ・・・・情報通信の問題の一つ
シャノンの通信モデル
送り手 → 符号化 → 通信路 → 復号 → 受け手
encode
↑
decode
ノイズ
重要な結論:どんなに誤りを多く発生させる通信路であっても、
復号された文字列の誤りを、任意に設定した誤り率以下に抑
えるような符号化の方法が存在する。
→ CD、インターネット、宇宙通信
符号語間距離

符号語間距離(ハミング距離)
符号語A:0000、符号語B:1111とする。
符号の中で記号が異なっている数を、
符号語間距離(d)という。(AとBの間では、d=4)

ある符号語の集合体において、すべての符号語間
距離のうち最小となるものを最小符号語間距離dmin
と呼ぶ。
誤り訂正符号
誤り訂正符合とは
記憶装置などからデータを読み出す際、データの
誤りを訂正するために本来のデータとは別に付加さ
れる冗長なデータのこと。
例 集合{0,1}(dmin=1)に対して、
「0」には「000」、「1」には「111」という3シンボルを
付加する。
集合{0000, 1111} (dmin=4)
「000」 「111」の冗長な符号語を誤り訂正符合とい
う。これによって、dminが増大する。

誤り訂正の原理
「0010」の間違ったデータ(「0000」:真)が送られて来たとする。
A「0000」からのd=1
B「1111」からのd=3
→ 本当はAの可能性が高い
1ビット間違える確率を1/100とする
4ビット符号語のうち距離1の符号に誤る確率
→(1/100)×(99/100)×(99/100)×(99/100)
4ビット符号語のうち距離3の符号に誤る確率
→(1/100)×(1/100)×(1/100)×(99/100)
両者の差は10000倍である。
誤りが起こってもある符号語からt以内の距離にあ
れば、その一番近い符号語に訂正すればよい
 どの符号語からもt以上離れている場合は誤りが起
こったという検出のみ可能

前ページの例の場合、
・{0001、0010、0100、1000}と検出
→ {0000}に訂正
・{1110、1101、1011、0111}と検出
→ {1111}に訂正
・{0011、0110、1001、1010}と検出
→ 訂正不可能

集合
符号語間距離
1234
1235
1236
1237
1238
1239
1234
1235
1236
1237
1238
1239
1234が1233
と誤ったら…
d=1
d=1
d=1 どれかわからない
d=1 が誤り
d=1
d=1
集合
符号語間距離
1234A
1235B 1234Aが1233A
1236C と誤る
1237D
1238E
1239F
1234A
1235B
1236C
1237D
1238E
1239F
d=1 ← これっぽい
d=2
d=2
d=2
d=2
d=2
 一般に、符号がt個までの誤りを訂正できるた
めの必要十分条件は、どの符号間距離を
取っても2t+1以上あることである。
dmin≧2t+1
 逆にdminがわかっている時、誤り訂正能力
t(c)は次のように表される。
t(c)=int[(dmin-1)/2]
通信と暗号

機密情報の保護
プライバシー、ネット取引・・・暗号化が必要
暗号化の方法
換字法:文中の文字を他の文字に置き換えて、意味
のない文字列とする方法
キー変換方式:キーと呼ばれる特定の文字列によっ
て、変換する方法
情報の蓄積と通信
時間を隔てて情報を利用するためには、情報
の蓄積が必要である。
情報を記号化し、メモリやディスクに書き込み、
ネットワークで送ることは、情報の蓄積・通信で
ある。
制御と情報
水洗トイレの水流制御:レバーを動かすと水が流れ、給
水弁が開いて給水し、満水になると弁が閉まる。
水槽内のフロートは水位情報を測定するセンサ
水位情報は、記号列ではない。
 エアコンの温度制御:センサから得られる情報を数値化
し、コンピュータによる総合判断を行って制御する。
温度情報はデジタル化され記号列で処理される。

情報の処理とアルゴリズム



情報は通信のみならず、処理の対象でもある。
情報の処理:記号列で表された情報を別の記号
列に変換すること。
例 2つの数値の積を計算する。
アルゴリズム:コンピュータを使ってある特定の目
的を達成するための情報処理の方法、処理手順。
アルゴリズムをプログラミング言語を用いて具体
的に記述したものをプログラムという。
情報の表現・情報の蓄積と通信・情報の処理と
アルゴリズムは情報科学の対象である。
情報倫理
 情報社会においては、著作権などの知的財
産権、プライバシー権などに注意する必要が
ある。
 不正コピーの防止
 個人情報保護
 ウイルス
 ハッキング
演習
①
②
③
④
⑤
情報とはいったいどういった概念か。
通信手段をいくつか例示せよ。
情報通信の時に起こる問題とは何か。
記数法について例を2つ挙げよ。
古いフランスの貨幣単位の例
1リーブル=20スー、1スー=12ドゥニエとす
る。
8リーブル16スー7ドゥニエの品物と11リーブ
ル18スー8ドゥニエの品物を購入した時の合
計金額はいくらか。また、30リーブル出したと
きのおつりはいくらか?