情報基礎 講義番号:X61029 科目区分:教養教育科目 対象年次:1-4 必修 クラス指定 工(応化) 講義の内容 コンピュータの構造や歴史を理解し、基本的な情報 処理に関する能力を身に付ける。 成績評価方法 小テスト、中間試験、期末試験により総合的に評価 する。 情報基礎の位置付け 学習教育目標のC1 数学・自然科学・情報処 理に関する基礎知識 C2科目 情報処理I への基礎。 二年次 コンピュータの理解 化学構造式作成ソフト O O H H H O H H H H H OH CHO O O OHH CHO CHO CHO OH H+ O H H O H H CHO O H+ なぜ情報理論を学ぶのか コンピュータ知識 ワープロ(文書作成) インターネット(情報収集) 情報処理技術 統計処理(エクセル) シミュレーション(計算機科学) 理系としての基礎知識 実験データの処理、レポート・論文の作成 分子軌道計算 授業展開#1 序論 1.情報 2.情報の伝達、蓄積 3.情報の処理、アルゴリズム 情報とは 情報という言葉は、価値観に強く結びついて いる。価値がなければ、情報は含まれていな い。利用する主体の主観に依存 情報技術とは 情報を得る技術、伝える技術、蓄積する 技術、暗号など データと情報 情報=価値のあるデータ。関心のあるデータ 集めたデータは、主観や価値観によって選別 され、必要な情報となる。 一方で、 無意味なデータでも、ある人にとっては、貴 重な情報源かもしれない。 記号化されたデータや映像化されたデータ は情報と同義に扱える。 情報の質 内容:必要な内容が網羅されているか。 時間:更新されているか。 精度:間違いはないか。 よく使う情報はよく更新されるため間違いが少ない。 あまり使わない情報は慎重に評価する必要。 情報が多いと手間・容量・費用の点で大変。 データを検索する・・・基準や整理が必要 情報管理論やデータベース論で重要 情報科学 情報を単なる文字記号列として扱う シャノン情報理論 Claude E. Shannon 情報を意味内容と直接に関係しない客観的 な対象とする。単なる文字列、記号列として、 その大きさ(情報量)を量る方法を提案した。 すなわち、情報は文字記号列として表され、 情報量は記号の量として量る。 コンピュータ コンピュータは、情報を記号化して扱う。 0か1。2通り。これを1ビット(bit)という。 0か1がいくつか並んだものをビット列という。 ・長さ5のビット列には、25=32通りの可能性 がある。 ・長さ5のビット列を5bitという ある文字記号を特定のビット列に対応させる ことにより、文字記号をコンピュータで扱える ようになる。 情報量 情報量 I(a)=-log2p(a) ( p(a):確率 ) トランプから1枚引いて、ハートである場合の情報量 は、 I(a) = -log2(13/52)=2 bit となる。 確率が小さければ小さい程、情報量は多くなる。 「二つに一つ」=- log2(1/2)=1 bit 「万に一つ」 = - log2(1/10000)=13.288 bit 確率が256分の1の事象 =- log2(1/256)=8 bit = 1 byte 1 byte で256種類の事象を記述することができる。 情報の表現と通信 通信:遠隔地に情報を伝えること 伝令、飛脚、伝書鳩・・・・物や人を運ぶ・・・効率が悪い のろし、手旗信号、モールス信号、電話・・・・情報を符号化 ノイズ・・・・情報通信の問題の一つ シャノンの通信モデル 送り手 → 符号化 → 通信路 → 復号 → 受け手 encode ↑ decode ノイズ 重要な結論:どんなに誤りを多く発生させる通信路であっても、 復号された文字列の誤りを、任意に設定した誤り率以下に抑 えるような符号化の方法が存在する。 → CD、インターネット、宇宙通信 符号語間距離 符号語間距離(ハミング距離) 符号語A:0000、符号語B:1111とする。 符号の中で記号が異なっている数を、 符号語間距離(d)という。(AとBの間では、d=4) ある符号語の集合体において、すべての符号語間 距離のうち最小となるものを最小符号語間距離dmin と呼ぶ。 誤り訂正符号 誤り訂正符合とは 記憶装置などからデータを読み出す際、データの 誤りを訂正するために本来のデータとは別に付加さ れる冗長なデータのこと。 例 集合{0,1}(dmin=1)に対して、 「0」には「000」、「1」には「111」という3シンボルを 付加する。 集合{0000, 1111} (dmin=4) 「000」 「111」の冗長な符号語を誤り訂正符合とい う。これによって、dminが増大する。 誤り訂正の原理 「0010」の間違ったデータ(「0000」:真)が送られて来たとする。 A「0000」からのd=1 B「1111」からのd=3 → 本当はAの可能性が高い 1ビット間違える確率を1/100とする 4ビット符号語のうち距離1の符号に誤る確率 →(1/100)×(99/100)×(99/100)×(99/100) 4ビット符号語のうち距離3の符号に誤る確率 →(1/100)×(1/100)×(1/100)×(99/100) 両者の差は10000倍である。 誤りが起こってもある符号語からt以内の距離にあ れば、その一番近い符号語に訂正すればよい どの符号語からもt以上離れている場合は誤りが起 こったという検出のみ可能 前ページの例の場合、 ・{0001、0010、0100、1000}と検出 → {0000}に訂正 ・{1110、1101、1011、0111}と検出 → {1111}に訂正 ・{0011、0110、1001、1010}と検出 → 訂正不可能 集合 符号語間距離 1234 1235 1236 1237 1238 1239 1234 1235 1236 1237 1238 1239 1234が1233 と誤ったら… d=1 d=1 d=1 どれかわからない d=1 が誤り d=1 d=1 集合 符号語間距離 1234A 1235B 1234Aが1233A 1236C と誤る 1237D 1238E 1239F 1234A 1235B 1236C 1237D 1238E 1239F d=1 ← これっぽい d=2 d=2 d=2 d=2 d=2 一般に、符号がt個までの誤りを訂正できるた めの必要十分条件は、どの符号間距離を 取っても2t+1以上あることである。 dmin≧2t+1 逆にdminがわかっている時、誤り訂正能力 t(c)は次のように表される。 t(c)=int[(dmin-1)/2] 通信と暗号 機密情報の保護 プライバシー、ネット取引・・・暗号化が必要 暗号化の方法 換字法:文中の文字を他の文字に置き換えて、意味 のない文字列とする方法 キー変換方式:キーと呼ばれる特定の文字列によっ て、変換する方法 情報の蓄積と通信 時間を隔てて情報を利用するためには、情報 の蓄積が必要である。 情報を記号化し、メモリやディスクに書き込み、 ネットワークで送ることは、情報の蓄積・通信で ある。 制御と情報 水洗トイレの水流制御:レバーを動かすと水が流れ、給 水弁が開いて給水し、満水になると弁が閉まる。 水槽内のフロートは水位情報を測定するセンサ 水位情報は、記号列ではない。 エアコンの温度制御:センサから得られる情報を数値化 し、コンピュータによる総合判断を行って制御する。 温度情報はデジタル化され記号列で処理される。 情報の処理とアルゴリズム 情報は通信のみならず、処理の対象でもある。 情報の処理:記号列で表された情報を別の記号 列に変換すること。 例 2つの数値の積を計算する。 アルゴリズム:コンピュータを使ってある特定の目 的を達成するための情報処理の方法、処理手順。 アルゴリズムをプログラミング言語を用いて具体 的に記述したものをプログラムという。 情報の表現・情報の蓄積と通信・情報の処理と アルゴリズムは情報科学の対象である。 情報倫理 情報社会においては、著作権などの知的財 産権、プライバシー権などに注意する必要が ある。 不正コピーの防止 個人情報保護 ウイルス ハッキング 演習 ① ② ③ ④ ⑤ 情報とはいったいどういった概念か。 通信手段をいくつか例示せよ。 情報通信の時に起こる問題とは何か。 記数法について例を2つ挙げよ。 古いフランスの貨幣単位の例 1リーブル=20スー、1スー=12ドゥニエとす る。 8リーブル16スー7ドゥニエの品物と11リーブ ル18スー8ドゥニエの品物を購入した時の合 計金額はいくらか。また、30リーブル出したと きのおつりはいくらか?
© Copyright 2024 ExpyDoc