Chapter 4 slides

Chapter 4
Network Layer
A note on the use of these ppt slides:
We’re making these slides freely available to all (faculty, students, readers).
They’re in PowerPoint form so you can add, modify, and delete slides
(including this one) and slide content to suit your needs. They obviously
represent a lot of work on our part. In return for use, we only ask the
following:
 If you use these slides (e.g., in a class) in substantially unaltered form,
that you mention their source (after all, we’d like people to use our book!)
 If you post any slides in substantially unaltered form on a www site, that
you note that they are adapted from (or perhaps identical to) our slides, and
note our copyright of this material.
Computer Networking:
A Top Down Approach
Featuring the Internet,
2nd edition.
Jim Kurose, Keith Ross
Addison-Wesley, July
2002.
Thanks and enjoy! JFK/KWR
All material copyright 1996-2002
J.F Kurose and K.W. Ross, All Rights Reserved
Network Layer
4-1
Chapter 4: Network Layer
目標:
概要:
 ネットワーク層サービスの背
 ネットワーク層サービス
後にある原理の理解:




経路制御(パス選択)
大規模化
ルータ動作
最近の話題: IPv6, モビリ
ティ
 インターネットにおける事例
と実装
 経路制御の原理: パス選択
 階層ルーティング
 IP
 インターネット経路制御プロトコル


intra-domain
inter-domain
 ルータの内部構造
 IPv6
 モビリティ
Network Layer
4-2
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer
4-3
ネットワーク層の機能
 始点ホストから終点ホストへのパ
ケット転送(プロセス間ではない)
 ネットワーク層機能は,全てのホ
スト,ルータにある
3つの重要な機能:
 経路決定: 送信ホスト・受信ホス
ト間の経路.経路制御アルゴリズ
ム
 フォワーディング: ルータ入力ポ
ートから適切な出力ポートへの交
換
 呼設定: アーキテクチャによって
は,データ転送前にパスに沿った
ルータ呼設定が必要
application
transport
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
network
data link
physical
application
transport
network
data link
physical
Network Layer
4-4
ネットワークサービスモデル
Q: 送信ホストから受信ホ
ストまでパケットがとお
る“チャネル”のための
サービスモデルは?
 帯域保証か?
 パケット間の同期保証か(
ジッタなし)?
 ロスフリーか?
 順序保証か?
 送信ホストへの輻輳通知
ありか?
ネットワーク層によって提供され
るサービスの抽象化において最
も重要なものは:
? ?
?
仮想回線(バーチャルサーキット)
か
データグラムか?
Network Layer
4-5
仮想回線(VC)
“送受信間パスは電話回線のように振舞う”


性能指向
送受信間パスにそったネットワークアクション
 データ転送の前後に呼設定と開放
 パケットはVC識別子を含む(終点ホストIDではない)
 送受信パス上のルータは経由するコネクションの状態を保持

エンドシステム間のトランスポート層コネクション
 リンク,ルータ資源(帯域,バッファ)の各VCへの割当

専用回線の性能を得るために
Network Layer
4-6
仮想回線:シグナリングプロトコル
 VCの設定,維持,開放に使用
 ATM, frame-relay, X.25 で使用
 今日のインターネットでは用いられていない
application
transport 5. Data flow begins
network 4. Call connected
data link 1. Initiate call
physical
6. Receive data application
3. Accept call
2. incoming call
transport
network
data link
physical
Network Layer
4-7
データグラムネットワーク:インターネットモデル
 ネットワーク層における呼設定なし
 ルータ: エンド間コネクションに関する状態保持せず
 ネットワーク層レベルでのコネクションの概念なし
 終点ホストアドレスにもとづくパケットフォワーディング
 送受信ペア間のパケットは異なるパスを通りうる
application
transport
network
data link 1. Send data
physical
application
transport
network
2. Receive data
data link
physical
Network Layer
4-8
ネットワーク層におけるサービスモデル
:ATMネットワーク
Network
Architecture
Internet
Service
Model
Guarantees ?
Congestion
Bandwidth Loss Order Timing feedback
best effort none
ATM
CBR
ATM
VBR
ATM
ABR
ATM
UBR
constant
rate
guaranteed
rate
guaranteed
minimum
none
no
no
no
yes
yes
yes
yes
yes
yes
no
yes
no
no (inferred
via loss)
no
congestion
no
congestion
yes
no
yes
no
no
 インターネットモデルへの拡張: Intserv, Diffserv

6章
Network Layer
4-9
データグラムかVCか: なぜ?
インターネット
 コンピュータ間のデータ交換
“エラスティック(伸縮)”サー
ビス,厳密なタイミング保証
の必要なし
 “賢い”エンドシステム(コンピュー
タ)


適応性があり,制御を実行で
き,誤り回復を実行できる
ATM
 電話網から発展
 会話:
同期,信頼性への要求条件
 品質保証サービスの必要性
 “賢くない(dumb)”エンドシステム
 電話
 ネットワーク内は複雑

ネットワーク内は簡単化,“エ
ッジ”は複雑
 リンクの多様性
 多様な性質
 一様なサービスは困難

Network Layer 4-10
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理


Link state routing
Distance vector routing
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer
4-11
経路制御(ルーティング)
ルーティングプロトコル
目標: 送受信間の“良好な”パス
(ルータのつながり)の決定
5
2
A
経路制御アルゴリズムのた
めのグラフによる抽象化:
B
2
1
D
3
C
3
1
5
F
1
E
2
 グラフのノードはルータを
表す
 グラフのエッジは物理リン
クを表す

 “良好な”パス:
 通常は最小コストパスのこと
 他の定義も可能
リンクコスト:遅延,費用,
輻輳レベル
Network Layer 4-12
経路制御アルゴリズムの分類
グローバルまたは分散情報?
静的または動的?
グローバル:
静的:
 全ルータは完全なトポロジ,リン
クコスト情報をもつ
 “リンクステート”アルゴリズム
分散型:
 ルータは,隣接ルータと隣接ルー
タへのリンクコスト情報をもつ
 隣接ノードとの情報交換と計算
の繰り返し処理
 “距離ベクトル”アルゴリズ
 経路が時間的にゆっくり
変化
動的:
 経路がすばやく変化
 周期的に更新

リンクコストの変化に
応じて更新
Network Layer 4-13
リンクステート経路制御アルゴリズム
Dijkstra アルゴリズム
 全ノードはネットワークトポロジ
とリンクコストを知っている
 “リンクステートブロードキ
ャスト”によって実現
 全ノードは同じ情報をもつ
 あるノード(“ソース”)から他の
全ノードへの最小コストパスを
計算
 経路表を得る

反復:k 反復後,k 終点まで
の最小コストを得る
記号:
 c(i,j): ノード i から j までのリ
ンクコスト.隣接ノードでなけれ
ばコストは無限大
 D(v): ソースから終点 V まで
の現在のパスコスト
 p(v): ソースから v にいたる
パス上で v の直前のノード,す
なわちその次ノードは v
 N: 最小コストパスが既知とな
ったノードの集合
Network Layer 4-14
Dijsktra アルゴリズム
1 Initialization:
2 N = {A}
3 for all nodes v
4
if v adjacent to A
5
then D(v) = c(A,v)
6
else D(v) = infinity
7
8 Loop
9 find w not in N such that D(w) is a minimum
10 add w to N
11 update D(v) for all v adjacent to w and not in N:
12
D(v) = min( D(v), D(w) + c(w,v) )
13 /* new cost to v is either old cost to v or known
14 shortest path cost to w plus cost from w to v */
15 until all nodes in N
Network Layer 4-15
Dijkstra アルゴリズム: 例
Step
0
1
2
3
4
5
start N
A
AD
ADE
ADEB
ADEBC
ADEBCF
D(B),p(B) D(C),p(C) D(D),p(D) D(E),p(E) D(F),p(F)
2,A
1,A
5,A
infinity
infinity
2,A
4,D
2,D
infinity
2,A
3,E
4,E
3,E
4,E
4,E
5
2
A
B
2
1
D
3
C
3
1
5
F
1
E
2
Network Layer 4-16
Dijkstra アルゴリズム,ディスカッション
アルゴリズムの複雑さ: n ノード
 反復ごとに N に含まれない全ノード w をチェックする必要あり
 n*(n+1)/2 比較: O(n**2)
 より効果的な実装が可能: O(nlogn)
発振の可能性:
 例,リンクコスト = 運ばれるトラヒック量
D
1
1
0
A
0 0
C
e
1+e
B
e
initially
2+e
D
0
1
A
1+e 1
C
0
B
0
… recompute
routing
0
D
1
A
0 0
2+e
B
C 1+e
… recompute
2+e
D
0
A
1+e 1
C
0
B
e
… recompute
Network Layer 4-17
距離ベクトル経路制御アルゴリズム
反復:
 ノードが情報交換しなくな
るまで繰り返し
 自律終了: 終了のための
“シグナル”はない
非同期:
 ノードは,ロックステップで
距離テーブルデータ構造
 各ノードが自分用のものをもつ
 行:とりうる終点ホストごと
 列:ノードにいたる隣接ノードごと
 例:ノード X 内,隣接ノード Z を経た
終点ノード Y:
は,情報交換の必要/繰り
返しなし
分散:
 各ノードは,直接の隣接ノ
ードとのみ通信
次ホップとして Z を選ん
= だ場合のノード X から Y
X
D (Y,Z)
への距離
= c(X,Z) + min {DZ(Y,w)}
w
Network Layer 4-18
距離テーブル:例
7
A
B
1
C
E
cost to destination via
D ()
A
B
D
A
1
14
5
B
7
8
5
C
6
9
4
D
4
11
2
2
8
1
E
2
D
E
D (C,D) = c(E,D) + min {DD(C,w)}
= 2+2 = 4
w
E
D (A,D) = c(E,D) + min {DD(A,w)}
E
w
= 2+3 = 5
loop!
D (A,B) = c(E,B) + min {D B(A,w)}
= 8+6 = 14
w
loop!
Network Layer 4-19
距離テーブルによる経路表の構築
E
cost to destination via
Outgoing link
D ()
A
B
D
A
1
14
5
A
A,1
B
7
8
5
B
D,5
C
6
9
4
C
D,4
D
4
11
2
D
D,4
Distance table
to use, cost
Routing table
Network Layer 4-20
距離ベクトルルーティング:概要
反復,非同期: 各局所反復は,
各ノードの動作:
以下の原因で発生:
 ローカルリンクコストの変化
 隣接ホストからのメッセージ受
信:隣接ホストからの最小コス
トパスの変化を知る
分散:
(隣接ノードからのメッセー
ジのローカルリンクコスト
の変化)を待つ
 各ノードは,任意の終点ホスト
への最小コストパスが変化した
場合にのみ,隣接ノードに通知

必要なら隣接ノードはその隣
接ノードに通知…
距離テーブルの再計算
任意の終点ホストへの最小コ
ストパスが変化すると,隣接ノ
ードに通知
Network Layer 4-21
距離ベクトルアルゴリズム:
全ノード X において:
1 Initialization: (初期化)
2 for (全ての隣接するノードvに対して):
3
D X(*,v) = ∞
/* *演算子は“全ての列に対して”を意味する。 */
4
D X(v,v) = c(X,v)
5 for (全ての終点ノードyに対して)
6 各隣接ノードに対して min DX(y,w) を送付
w
/* w は X の全隣接ノードにわたる。 */
Network Layer 4-22
距離ベクトルアルゴリズム(つづき):
8 loop (ループ)
9 wait (隣接ノードVに接続するリンクのコストが変化するか
10
隣接ノードVから更新情報を受信するまで)
11
12 if (c(X,V) がdだけ変化した場合)
13 /* 隣接ノードVを経由する全ての終点に至る経路のコストをdだけ変更する */
14 /* dは正の数もしくは負の数を取り得る */
15 for (全ての終点Yに対して : DX (y,V) = DX(y,V) + d )
16
17 else if (終点Yに関してVから更新情報を受信した場合)
18 /* VからYに至る最短経路が変化した。 */
19 /* Vはmin DV(Y,w)に関して新しい値を送付する。 */
w
20 /* 新しく受信した値を “newval“ と記する。 */
21 終点Yに関する最小コストを更新 : DX (Y,V) = c(X,V) + newval
22
23 if (任意の終点Yについてmin DX (Y,w)が変化した場合
w
24
新しいmin DX(Y,w)の値を全隣接ノードに送付
w
25
Network Layer 4-23
26 forever (ループ終端、永久に続ける)
距離ベクトルアルゴリズム:例
X
2
Y
7
1
Z
Network Layer 4-24
距離ベクトルアルゴリズム:例
X
2
Y
7
1
Z
X
Z
X
Y
D (Y,Z) = c(X,Z) + minw{D (Y,w)}
= 7+1 = 8
D (Z,Y) = c(X,Y) + minw {D (Z,w)}
= 2+1 = 3
Network Layer 4-25
距離ベクトル:リンクコストの変化
リンクコストの変化:
 ノードがローカルリンクコストの変化を検出
 距離テーブルの更新(15行目)
 最小コストパスのコストが変化した場合,隣
接ノードに通知(23,24行目)
“良いニ
ュースは
速く伝わ
る”
1
X
4
Y
1
50
Z
algorithm
terminates
Network Layer 4-26
距離ベクトル:リンクコストの変化
リンクコストの変化:
 良いニュースは速く伝わる
 悪いニュースはゆっくり伝わる
- “count to infinity” 問題!
60
X
4
Y
1
50
Z
algorithm
continues
on!
Network Layer 4-27
距離ベクトル: poisoned reverse
Xに到達するのにZがYを経由するのなら :
 ZはYに,ZからXへの距離は無限大であると伝
える(これによりYはZを介してXにいかない)
 この方法によってcount to infinity問題を完全
に解決できるだろうか?
60
X
4
Y
50
1
Z
algorithm
terminates
Network Layer 4-28
リンクステート型と距離ベクトル型の比較
メッセージ複雑度

ロバスト性: ルータがおかしく
なったら何がおこるか?
LS: n ノード, E リンクでは, O(nE)
メッセージが送信される
LS:
 DV: 隣接ノード間でのみ交換され
る

収束時間が変動する
収束速度
 LS: O(n2) アルゴリズムで,O(nE)
メッセージが必要
 発振の可能性
 DV: 収束時間は変動


経路がループしているかもしれ
ない
count-to-infinity 問題

ノードが間違ったリンクコスト
を広告する可能性がある

各ノードは自身のテーブルを
計算する
DV:


DV ノードは,誤ったパスコス
トを広告する可能性がある
各ノードのテーブルは他のノ
ードに利用される
• エラーがネットワークを介し
て伝播する
Network Layer 4-29
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-30
階層ルーティング
これまでの議論は理想化されていた
 全てのルータは同一
 ネットワークは“フラット”
… でも実際は違う
スケール: 2億もの終点ノー
ド:
 経路表に全終点ノードを記述
することは無理!
 経路表交換でリンクがいっぱ
いになる!
管理の自律性
 インターネット = ネットワークの
ネットワーク
 ネットワーク管理者は,自身のネ
ットワーク内の経路制御を自分
で管理したいかもしれない
Network Layer 4-31
階層ルーティング
 ルータ群をリージョン“自律シ
ステム(AS: Autonomous
System)”に集約する
 同一 AS 内のルータは同一の
経路制御アルゴリズムを実行


“intra-AS” ルーティングプロ
トコル
異なるAS内のルータは,異な
るintra-ASルーティングプロ
トコルを実行するかもしれない
ゲートウェイルータ
 AS 内の特別なルータ
 AS 内の他のルータとは,
intra-AS ルーティングプロ
トコルを実行
 さらに,AS外の終点に対す
るルーティングもおこなう

他のゲートウェイルータ
と,inter-AS ルーティ
ング プロトコルを実行
Network Layer 4-32
Intra-AS と Inter-AS ルーティング
C.b
a
C
ゲートウェイ:
B.a
A.a
b
A.c
d
A
a
b
c
a
c
B
b
•ゲートウェイ間では
inter-AS ルーティ
ングを実行
•AS 内の他のルー
タとは intra-AS ル
ーティングを実行
ネットワーク層
ゲートウェイ A.c におけ
る inter-AS, intra-AS
ルーティング
リンク層
物理層
Network Layer 4-33
Intra-AS と Inter-AS ルーティング
C.b
a
Host
h1
C
b
A.a
Inter-AS
routing
between
A and B
A.c
a
d
c
b
A
Intra-AS routing
within AS A
B.a
a
c
B
Host
h2
b
Intra-AS routing
within AS B
 特定の inter-AS と intra-AS インターネットルーティ
ングプロトコルを紹介
Network Layer 4-34
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル







4.5
4.6
4.7
4.8
4.9
4.4.1 IPv4 アドレッシング
4.4.2 始点ホストから終点ホストへのデータグラムの流れ
4.4.3 Datagram フォーマット
4.4.4 IP フラグメンテーション
4.4.5 ICMP: Internet Control Message Protocol
4.4.6 DHCP: Dynamic Host Configuration Protocol
4.4.7 NAT: Network Address Translation
インターネットにおけるルーティング
ルータの内部構造
IPv6
マルチキャストルーティング
モビリティ
Network Layer 4-35
インターネットのネットワーク層
ホスト,ルータのネットワーク層機能:
Transport layer: TCP, UDP
Network
layer
IP protocol
•addressing conventions
•datagram format
•packet handling conventions
Routing protocols
•path selection
•RIP, OSPF, BGP
forwarding
table
ICMP protocol
•error reporting
•router “signaling”
Link layer
physical layer
Network Layer 4-36
IP アドレッシング: はじめに
 IP アドレス: ホスト,ル
223.1.1.1
ータのインタフェースの
ための32ビット識別子
 インタフェース: ホスト/
ルータと物理リンクを接
続



223.1.2.1
223.1.1.2
223.1.1.4
223.1.1.3
ルータは,通常,複数のイ
ンタフェースをもつ
ホストは,複数のインター
フェースを持つ場合がる
各インタフェースには IP
アドレスが割り振られる
223.1.2.9
223.1.3.27
223.1.2.2
223.1.3.2
223.1.3.1
223.1.1.1 = 11011111 00000001 00000001 00000001
223
1
1
1
Network Layer 4-37
IP アドレッシング
 IP アドレス:
 ネットワーク部(上位ビット)
 ホスト部(下位ビット)

223.1.1.1
223.1.2.1
223.1.1.2
223.1.1.4
223.1.2.9
ネットワークとは何か?
(IPアドレスから見た場合)


IPアドレスが同じネットワー
ク部をもつデバイスインタフ
ェース群
223.1.1.3
223.1.3.27
223.1.2.2
LAN
223.1.3.1
223.1.3.2
ルータが介在することなく,
互いに物理的に到達可能
3つのIPネットワークからなるネットワーク
(223で始まる24ビットネットワークアドレ
スをもつ)
Network Layer 4-38
IP アドレッシング
ネットワークをどのようには
っけんするか?
223.1.1.2
223.1.1.1
223.1.1.3
 ルータ,ホストからインタ
フェースを切り離す
223.1.1.4
223.1.9.2
223.1.7.0
 分離されたネットワーク
の“島”が出来上がる
223.1.9.1
223.1.7.1
223.1.8.1
223.1.8.0
223.1.2.6
6つのネットワークが相 223.1.2.1
互接続されたシステム
223.1.3.27
223.1.2.2
223.1.3.1
223.1.3.2
Network Layer 4-39
IP アドレス
ネットワークの概念を得たところで,IPアドレスについて再考しよう:
“クラス型”アドレッシング
class
A
0 network
B
10
C
110
D
1110
1.0.0.0 to
127.255.255.255
host
network
128.0.0.0 to
191.255.255.255
host
network
multicast address
host
192.0.0.0 to
223.255.255.255
224.0.0.0 to
239.255.255.255
32 bits
Network Layer 4-40
IP アドレッシング: CIDR
 クラス型アドレッシング:

アドレス空間の利用効率が悪い,アドレス空間の枯渇

例:たとえネットワークに2千のホストしかなくても,クラスBでは6万5
千のアドレスが割り当てられる
 CIDR: Classless InterDomain Routing


任意の長さのネットワーク部
アドレスフォーマット: a.b.c.d/x,ここで,x はネットワーク部のビット長
network
part
host
part
11001000 00010111 00010000 00000000
200.23.16.0/23
Network Layer 4-41
IP アドレス:どうやって得るか?
Q: ホストは IP アドレスをどうやって得るのか?
 システム管理者がファイル内に格納
Wintel: control-panel->network->configuration>tcp/ip->properties
 UNIX: /etc/rc.config (異なる場合がある)
 DHCP: Dynamic Host Configuration Protocol: サーバ
から動的にアドレスを入手
 “plug-and-play” (もっと簡単にいうと)

Network Layer 4-42
IP アドレス:どうやって得るか?
Q: ネットワークは,IPアドレスのネットワーク部をどう
やって得るのか?
A: プロバイダのISPアドレス空間の一部が割り当て
られる
ISP's block
11001000 00010111 00010000 00000000
200.23.16.0/20
Organization 0
Organization 1
Organization 2
...
11001000 00010111 00010000 00000000
11001000 00010111 00010010 00000000
11001000 00010111 00010100 00000000
…..
….
200.23.16.0/23
200.23.18.0/23
200.23.20.0/23
….
Organization 7
11001000 00010111 00011110 00000000
200.23.30.0/23
Network Layer 4-43
階層アドレッシング:ルート集約
階層アドレッシングは,効率的な経路情報広告を可能にする
Organization 0
200.23.16.0/23
Organization 1
“200.23.16.0/20で始
まるアドレスを持つもの
はこっちに送ってくれ”
200.23.18.0/23
Organization 2
200.23.20.0/23
Organization 7
.
.
.
.
.
.
Fly-By-Night-ISP
Internet
200.23.30.0/23
ISPs-R-Us
“199.31.0.0/16で始ま
るアドレスを持つものは
こっちに送ってくれ”
Network Layer 4-44
階層アドレッシング:より詳しい経路情報
ISPs-R-Us が Organization 1 への経路を持つ場合
Organization 0
200.23.16.0/23
Organization 2
200.23.20.0/23
Organization 7
.
.
.
.
.
.
Fly-By-Night-ISP
“200.23.16.0/20で始
まるアドレスを持つもの
はこっちに送ってくれ”
Internet
200.23.30.0/23
ISPs-R-Us
Organization 1
200.23.18.0/23
“199.31.0.0/16あるいは
200.23.18.0/23で始まる
アドレスを持つものはこっ
ちに送ってくれ”
Network Layer 4-45
IP アドレッシング:最後に…
Q: ISPはアドレスブロックをどうやって得るのか?
A: ICANN: Internet Corporation for Assigned
Names and Numbers
 アドレス割当
 DNSの管理
 ドメイン名の割当,紛争の解決
Network Layer 4-46
データグラムの始点・終点ホスト間の配送
forwarding table in A
Dest. Net. next router Nhops
223.1.1
223.1.2
223.1.3
IP datagram:
misc source dest
fields IP addr IP addr
data
A
 始点から終点までの間,デー
ある
223.1.1.1
223.1.2.1
タグラムは不変
 ここではアドレス部に興味が
223.1.1.4
223.1.1.4
1
2
2
B
223.1.1.2
223.1.1.4
223.1.2.9
223.1.2.2
223.1.1.3
223.1.3.1
223.1.3.27
E
223.1.3.2
Network Layer 4-47
データグラムの始点・終点ホスト間の配送
forwarding table in A
misc
data
fields 223.1.1.1 223.1.1.3
Dest. Net. next router Nhops
223.1.1
223.1.2
223.1.3
A から B に IPデータグラムを
送信する場合:
 フォワーディングテーブル内でBの
ネットワークアドレスを検索
 BがAと同じネットワークであること
を発見
 リンク層は,リンク層フレームにより
データグラムをBに直接送信
 BとAは直接接続されている
A
223.1.1.4
223.1.1.4
1
2
2
223.1.1.1
223.1.2.1
B
223.1.1.2
223.1.1.4
223.1.2.9
223.1.2.2
223.1.1.3
223.1.3.1
223.1.3.27
E
223.1.3.2
Network Layer 4-48
データグラムの始点・終点ホスト間の配送
forwarding table in A
misc
data
fields 223.1.1.1 223.1.2.2
Dest. Net. next router Nhops
223.1.1
223.1.2
223.1.3
AからEへの転送:
 フォワーディングテーブルでEのネ
ットワークアドレスを検索
 Eは違うネットワーク上にある
 AとEは直接つながっていない
 経路表:Eへの次ホップルータは,
223.1.1.4
 リンク層は,リンク層フレームによ
りデータグラムをルータ223.1.1.4
に送信
 データグラムが23.1.1.4に到達
 以下繰り返し…
A
223.1.1.4
223.1.1.4
1
2
2
223.1.1.1
223.1.2.1
B
223.1.1.2
223.1.1.4
223.1.2.9
223.1.2.2
223.1.1.3
223.1.3.1
223.1.3.27
E
223.1.3.2
Network Layer 4-49
データグラムの始点・終点ホスト間の配送
misc
data
fields 223.1.1.1 223.1.2.2
223.1.4に到着,223.1.2.2へ
 ルータのフォワーディングテーブ
forwarding table in router
Dest. Net router Nhops interface
223.1.1
223.1.2
223.1.3
ルで,Eのネットワークアドレスを
検索
 E は,ルータインタフェース
223.1.2.9と同じネットアドレス
A
ルータとEは直接接続
 リンク層はインタフェース223.1.2.9 を
介し,リンク層フレームによりデー
タグラムを223.1.2.2に送信
 データグラムが223.1.2.2に到着
! (万歳!)
B

-
1
1
1
223.1.1.4
223.1.2.9
223.1.3.27
223.1.1.1
223.1.2.1
223.1.1.2
223.1.1.4
223.1.2.9
223.1.2.2
223.1.1.3
223.1.3.1
223.1.3.27
E
223.1.3.2
Network Layer 4-50
IP データグラムフォーマット
IP protocol version
number
header length
(bytes)
“type” of data
max number
remaining hops
(decremented at
each router)
upper layer protocol
to deliver payload to
TCPのオーバヘッドは
どのくらいか?
 20 bytes of TCP
 20 bytes of IP
 = 40 bytes + app
layer overhead
32 bits
head. type of
length
ver
len service
fragment
16-bit identifier flgs
offset
upper
time to
Internet
layer
live
checksum
total datagram
length (bytes)
for
fragmentation/
reassembly
32 bit source IP address
32 bit destination IP address
Options (if any)
data
(variable length,
typically a TCP
or UDP segment)
E.g. timestamp,
record route
taken, specify
list of routers
to visit.
Network Layer 4-51
IP フラグメンテーションとリアッセンブリ
 ネットワークリンクには最大転送
サイズ(MTU: max.transfer
size)がある – 最大限可能なリン
クレベルフレームのサイズ
fragmentation:
in: one large datagram
out: 3 smaller datagrams
 種類の異なるリンクは,異なる
MTU を持つ
 ネットワーク内で大きな IP データ
グラムを分割(フラグメント)する

ひとつのデータグラムが複数
のデータグラムに

最終的な終点ホストにてのみ
再構築(リアッセンブル)され
る

関連するフラグメントを識別,
並べるためにIPヘッダのフィ
ールドが利用される
reassembly
Network Layer 4-52
IP フラグメンテーションとリアッセンブリ
例
 4000 バイトデータグ
ラム
 MTU = 1500 bytes
length ID fragflag offset
=4000 =x
=0
=0
ひとつの大きなデータグラムがいくつかの
小さなデータグラムになる
length ID fragflag offset
=1500 =x
=1
=0
length ID fragflag offset
=1500 =x
=1
=1480
length ID fragflag offset
=1040 =x
=0
=2960
Network Layer 4-53
ICMP: Internet Control Message Protocol
 ホスト,ルータ,ゲートウェイがネッ
トワークレベル情報を通信するた
めに利用
エラー報告:不達ホスト,ネット
ワーク,ポート,プロトコル
 エコー要求/応答 (ping で利
用される)
 IP “より上”のネットワーク層:
 ICMP メッセージは,IPデータ
グラムで運ばれる
 ICMPメッセージ: タイプ,コード+
エラーを起こしたIPデータグラム
の最初の8バイト

Type
0
3
3
3
3
3
3
4
Code
0
0
1
2
3
6
7
0
8
9
10
11
12
0
0
0
0
0
description
echo reply (ping)
dest. network unreachable
dest host unreachable
dest protocol unreachable
dest port unreachable
dest network unknown
dest host unknown
source quench (congestion
control - not used)
echo request (ping)
route advertisement
router discovery
TTL expired
bad IP header
Network Layer 4-54
DHCP: Dynamic Host Configuration Protocol
目標: ホストがネットワークに接続した際にネットワークサーバか
ら動的にIPアドレスを入手することを可能にする.
使用中のアドレスのリースを更新できる(使用中の場合のみアドレスを保
持できる)
アドレスの再利用を可能にする
モバイルユーザがネットワークを利用することをサポート
DHCP 概要:
 ホストは “DHCP discover” メッセージをブロードキャスト
 DHCP サーバは “DHCP offer” メッセージで応答
 ホストは IP アドレスを要求: “DHCP request” メッセージ
 DHCP サーバはアドレスを送信: “DHCP ack” メッセージ
Network Layer 4-55
DHCP クライアント・サーバ シナリオ
A
B
223.1.2.1
DHCP
server
223.1.1.1
223.1.1.2
223.1.1.4
223.1.2.9
223.1.2.2
223.1.1.3
223.1.3.1
223.1.3.27
223.1.3.2
E
arriving DHCP
client needs
address in this
network
Network Layer 4-56
DHCP クライアント・サーバ シナリオ
DHCP server: 223.1.2.5
DHCP discover
arriving
client
src : 0.0.0.0, 68
dest.: 255.255.255.255,67
yiaddr: 0.0.0.0
transaction ID: 654
DHCP offer
src: 223.1.2.5, 67
dest: 255.255.255.255, 68
yiaddrr: 223.1.2.4
transaction ID: 654
Lifetime: 3600 secs
DHCP request
time
src: 0.0.0.0, 68
dest:: 255.255.255.255, 67
yiaddrr: 223.1.2.4
transaction ID: 655
Lifetime: 3600 secs
DHCP ACK
src: 223.1.2.5, 67
dest: 255.255.255.255, 68
yiaddrr: 223.1.2.4
transaction ID: 655
Lifetime: 3600 secs
Network Layer 4-57
NAT: Network Address Translation
rest of
Internet
local network
(e.g., home network)
10.0.0/24
10.0.0.4
10.0.0.1
10.0.0.2
138.76.29.7
10.0.0.3
ローカルネットワークから外に向かう全
てのデータグラムは,同じ送信 NAT IP
アドレス(138.76.29.7)を持つが,そのソ
ースポート番号は異なる
このネットワーク内に終点または始
点をもつデータグラムは,(通常)
10.0.0/24 アドレスを,始点,終点に
もつ
Network Layer 4-58
NAT: Network Address Translation
 モチベーション: ローカルネットワークは,外部に接続されてい
る限りにおいては,ひとつのIPアドレスのみを使う:
 ISPからある範囲のアドレスを割当ててもらう必要がない:
- たった一つのIPアドレスが全デバイスで利用される

ローカルネットワーク内のデバイスのアドレスを外部に通知
することなく変更できる

ローカルネットワーク内のデバイスのアドレスを変えることな
く ISP を乗り換えることができる
 ローカルネットワーク内のデバイスは,外部から陽にはアク
セスできない,外部から見えない(安全性が増す)
Network Layer 4-59
NAT: Network Address Translation
実装: NAT ルータは次のことができなければならない:

外向データグラム: 外向きデータグラムの(始点 IP アドレス,

各(始点 IP アドレス,ポート番号)-(NAT IP アドレス,新規
ポート番号)変換対を(NAT変換テーブル内で)記憶
ポート番号)を(NAT IPアドレス,新規ポート番号)に置換
. . . 外部のリモートクライアント/サーバは,終点アドレスと
して(NAT IPアドレス,新規ポート番号)を使って応答
 到着データグラム:incoming
datagrams: replace 終点に(
NAT IP アドレス,新規ポート番号)をもつ到着データグラム
の終点をNAT変換テーブルに保持された(始点 IP アドレス,
ポート番号)に変換
Network Layer 4-60
NAT: Network Address Translation
2: NAT router
changes datagram
source addr from
10.0.0.1, 3345 to
138.76.29.7, 5001,
updates table
2
NAT translation table
WAN side addr
LAN side addr
1: host 10.0.0.1
sends datagram to
128.119.40, 80
138.76.29.7, 5001 10.0.0.1, 3345
……
……
S: 10.0.0.1, 3345
D: 128.119.40.186, 80
S: 138.76.29.7, 5001
D: 128.119.40.186, 80
138.76.29.7
S: 128.119.40.186, 80
D: 138.76.29.7, 5001
3: Reply arrives
dest. address:
138.76.29.7, 5001
3
1
10.0.0.4
S: 128.119.40.186, 80
D: 10.0.0.1, 3345
10.0.0.1
10.0.0.2
4
10.0.0.3
4: NAT router
changes datagram
dest addr from
138.76.29.7, 5001 to 10.0.0.1, 3345
Network Layer 4-61
NAT: Network Address Translation
 16ビットポート番号フィールド:
 60,000 の同時コネクション
 NAT の論点:
 ルータは3層までをサポートすべき
 エンド間という趣旨に違反
• NAT の存在をアプリケーション設計者(例えば,P2Pアプリケ
ーション)が考慮しなければならない

アドレス不足は,IPv6によって解決されるべきだ
Network Layer 4-62
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
 4.5.1 Intra-AS ルーティング: RIP と OSPF
 4.5.2 Inter-AS ルーティング: BGP
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-63
インターネットにおける経路制
 インターネットは,相互に接続された自律システム(
AS: Autonomous Systems)からなる:
Stub AS: 小企業: 他のASに対して1接続
 Multihomed AS: 大企業(非中継): 他のASに対して複
数接続
 Transit AS: プロバイダ,多くの AS が接続

 2レベル経路制御:
 Intra-AS: 管理者は,ネットワーク内の経路制御の選
択に関して責任がある
 Inter-AS: inter-AS 経路制御については唯一の標準
がある: BGP
Network Layer 4-64
インターネット AS 階層
Intra-AS border (exterior gateway) routers
Inter-AS interior (gateway) routers
Network Layer 4-65
Intra-AS 経路制御
 Interior Gateway Protocols (IGP) として知られている
 最も一般的な Intra-AS 経路制御プロトコル:

RIP: Routing Information Protocol

OSPF: Open Shortest Path First

IGRP: Interior Gateway Routing Protocol (Cisco
独自方式)
Network Layer 4-66
RIP ( Routing Information Protocol)
 距離ベクトルアルゴリズム
 1982年のBSD-UNIX ディストリビューションに含まれた
 距離メトリック: ホップ数(最大15ホップ)
 その理由はなぜか?
 距離ベクトル: 隣接ノード間と30秒ごとにResponse
Message (広告:advertisementとも呼ばれる)を介して交換
 各広告:AS内の最大25終点ネットワークのリスト
Network Layer 4-67
RIP: 例
z
w
A
x
D
B
y
C
Destination Network
w
y
z
x
….
Routing table in D
Next Router
Num. of hops to dest.
….
....
A
B
B
--
2
2
7
1
Network Layer 4-68
RIP: 例
Dest
w
x
z
….
Next
C
…
w
hops
4
...
A
AからDへの広告
z
x
Destination Network
w
y
z
x
….
D
B
C
y
Next Router
Num. of hops to dest.
….
....
A
B
B A
--
Routing table in D
2
2
7 5
1
Network Layer 4-69
RIP: リンク故障と復旧
180秒間広告を受信しなかった場合→隣接ノード/リンクが死
んだと判定
 隣接ノードを介した経路を無効化
 新しい広告を隣接ノードに送信
隣接ノードは,(テーブルが変更されたら)順番に新しい広
告を送信
 リンク故障情報が全ネットワークにすばやく伝播
 ピンポンループを防ぐためにポイズンリバースを使用
(無限距離 = 16 ホップ)

Network Layer 4-70
RIP テーブル処理
 RIP 経路テーブルは route-d (デーモン)とよばれるア
プリケーションレベルプロセスによって管理される
 広告は UDP パケットによって送信され,定期的に繰り返
される
routed
routed
Transprt
(UDP)
network
(IP)
link
physical
Transprt
(UDP)
forwarding
table
forwarding
table
network
(IP)
link
physical
Network Layer 4-71
RIP テーブルの例
Router: giroflee.eurocom.fr
Destination
-------------------127.0.0.1
192.168.2.
193.55.114.
192.168.3.
224.0.0.0
default
Gateway
Flags Ref
Use
Interface
-------------------- ----- ----- ------ --------127.0.0.1
UH
0 26492 lo0
192.168.2.5
U
2
13 fa0
193.55.114.6
U
3 58503 le0
192.168.3.5
U
2
25 qaa0
193.55.114.6
U
3
0 le0
193.55.114.129
UG
0 143454
 3つのクラス C ネットワーク(LAN)が接続
 ルータのみが接続された LAN への経路を知っている
 その他へはデフォルトルータを使用
 マルチキャストアドレス(224.0.0.0)への経路
 ループバックインタフェース(デバッグ用)
Network Layer 4-72
OSPF (Open Shortest Path First)
 “open”: パブリックに利用可能
 リンクステートアルゴリズムを使用
 LS パケットの配布
 各ノードにおけるトポロジマップ
 Dijkstraアルゴリズムを使った経路計算
 OSPF 広告は,隣接ノードあたり一つのエントリを運ぶ
 広告は,(フラッディングをもちいて)AS全体へ配信される
 (TCPやUDPというより)IPを介して直接 ISPF メッセージによって運
ばれる
Network Layer 4-73
OSPF の(RIPにはない)優れた特徴
 セキュリティ: 全ての OSPF メッセージは(悪意のある侵入を




防ぐため)認証される
複数の同一コストパス許される(RIPでは一つのパスのみ)
各リンクごとに,異なるTOS(例えば,衛星リンクコストをベス
トエフォートに対して低く,リアルタイムに対して高く設定)に
対して複数のコストメトリックを使用可能
ユニ,マルチキャストサポートの統合:
 マルチキャストOSPF (MOSPF) は,OSPFと同じトポロジ
データベースを使用
大きなドメインでは階層OSPF を使用
Network Layer 4-74
階層 OSPF
Network Layer 4-75
階層 OSPF
 2レベル階層: ローカルエリア,バックボーン

リンクステート広告はエリア内のみ
 各ノードはエリア内の詳細なトポロジ情報を有する;他の
エリアのネットワークへの方向(最短パス)のみを知る
 エリア境界ルータ: 自身のエリア内のネットワークへの距離
を“要約”し,他のエリア境界ルータに広告する
 バックボーンルータ: バックボーンに制限された OSPFルー
ティングを実行
 バウンダリルータ: 他の AS へ接続
Network Layer 4-76
インターネット inter-AS ルーティング: BGP
R4
R5
R3
AS1
BGP
AS2
(RIP intra-AS
routing)
BGP
R1
R2
(OSPF
intra-AS
routing)
AS3
(OSPF intra-AS
routing)
Figure 4.5.2-new2: BGP use for inter-domain routing
Network Layer 4-77
インターネット inter-AS ルーティング: BGP
 BGP (Border Gateway Protocol):
デファクトスタンダード
 パスベクトル プロトコル:
距離ベクトルプロトコルに類似
 各 Border Gateway は,隣接ゲートウェイ(ピア)に目
的ネットワークへの全パス(すなわち,ASの系列)をブロ
ードキャストする
 BGP は,個々のホストではなくネットワーク (AS)への経
路を決定する
 例,ゲートウェイ X は,Z へのパスを送信:

Path (X,Z) = X,Y1,Y2,Y3,…,Z
Network Layer 4-78
インターネット inter-AS ルーティング: BGP
仮定: ゲートウェイ X がピアゲートウェイ W にパスを送信
 W が X によって提供されたパスを選択するかどうかは任意
コスト,ポリシー(競合する AS を介したくない),ループ防
止,などの理由から
 W が X から提供されパスを選択した場合:
Path (W,Z) = w, Path (X,Z)
 注意: X は,ピアへのルート広告を制御することで,流入トラ
ヒックを制御できる:
 例,Z へのトラヒックを通したくない → Z への経路を広告
しない

Network Layer 4-79
BGP: 誰が自分を経由するかを制御
legend:
B
W
provider
network
X
A
customer
network:
C
Y
Figure 4.5-BGPnew: a simple BGP scenario
 A,B,C : プロバイダネットワーク
 X,W,Y: プロバイダ利用者
 X はデュアルホーム: 二つのネットワークに接続
X は,Xを介した B から C への経路を望まない
 X は,B に C への経路を広告しない

Network Layer 4-80
BGP: 誰が自分を経由するかを制御
legend:
B
W
provider
network
X
A
customer
network:
C
Y
 A は B にパス AW を広告
Figure 4.5-BGPnew: a simple BGP scenario
 B は X にパス BAW を広告
 B は C にパス BAW を広告すべきか?
 とんでもない!W も C も B の顧客ではないため,B は CBAW と経
由させてもいかなる収入もない
 B は,C が A を介した w への経路を利用するよう強制したい
 B は,自分の顧客への/からの経路のみを望む!
Network Layer 4-81
BGP オペレーション
Q: BGP ルータは何をするのか?
 隣接ゲートウェイからのルート広告を受信,フィルタリング
 経路選択
終点 X への経路を向けるために,いくつかの広告され
たパスのうちどれを選択するだろうか?
 ルート広告を隣接ゲートウェイに送信

Network Layer 4-82
BGP メッセージ
 BGP メッセージは TCP を介して交換される
 BGP メッセージ:
OPEN: ピアに TCP コネクションをオープンし,送信ピアを
認証する
 UPDATE: 新しいパスを広告する(あるいは古いパスを破
棄する)
 KEEPALIVE: UPDATE がなくてもコネクションを維持す
る; また,OPEN 要求に ACK を返す
 NOTIFICATION: 直前のメッセージにエラーを返す;ま
た,コネクションをクローズするのにも利用される

Network Layer 4-83
なぜ Intra- と Inter-AS ルーティングは異なるのか?
ポリシー:
 Inter-AS: 管理者は,自身のネットワークをどのくらいのトラ
ヒックが経由するのか,誰が経由するのかを制御したい
 Intra-AS: 一元管理だから,ポリシー決定の必要はない
スケール:
 階層ルーティングは,テーブルサイズを節約し,更新トラヒッ
クを削減する
性能:
 Intra-AS: 性能に重点をおくことが可能
 Inter-AS: 性能よりポリシーが重要
Network Layer 4-84
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-85
ルータアーキテクチャの概要
二つの主要機能:
 経路制御アルゴリズム/プロトコルの実行 (RIP, OSPF, BGP)

入力リンクから出力リンクへのデータグラムの交換
Network Layer 4-86
入力ポート機能
物理層:
ビットレベルの受信
データリンク層:
e.g., Ethernet
5章参照
分散入力ポート処理:
 データグラムの宛先にもとづき,入力ポート
内の経路制御表を使って出力ポートをルッ
クアップ
 目標:ラインスピードでの入力ポート処理
 待つ行列:交換基盤への転送レート以上の
速度でデータグラムが到着した場合
Network Layer 4-87
入力ポート待ち行列
 交換基盤速度が入力ポート速度の合計より低い場合
⇒入力ポートで待ち行列が形成される可能性
 ヘッドオブライン(HOL) ブロッキング: 待ち行列の先頭デー
タグラムが,競合しないポートを目指す,背後のデータグラ
ムをブロック

待ち行列遅延や入力ポートキューでのバッファオーバフロ
ーによる廃棄
Network Layer 4-88
3種類の交換基盤
Network Layer 4-89
メモリ型交換基盤
第一世代ルータ:
パケットはシステムの(単一)CPUによりコピーされる
 速度はメモリ帯域によって制限(データグラムあたり2度バ
スを通過)
Input
Port
Memory
Output
Port
System Bus
現在のルータ:
 入力ポートプロセッサがルックアップとメモリへのコピーを
実行(共有メモリアーキテクチャ)
 Cisco Catalyst 8500
Network Layer
4-90
バス型交換基盤
 共有バスを介して入力ポートメモリから
出力ポートメモリへデータグラム転送
 バス競合: 交換速度はバス帯域によっ
て制限
 1 Gbps bus, Cisco 1900: アクセスルー
タ,エンタープライズルータでは十分な
交換速度(非広域・バックボーンルータ)
Network Layer 4-91
内部接続網(クロスバスイッチ)型交換基盤
 バス帯域制約の解決
 バンヤンネットワーク,他がマルチプロセッサに
おけるプロセッサ接続に利用
 先端設計: データグラムを固定長セルに分割し,
交換基盤を介してセルを転送
 Cisco 12000: 最大 60 Gbps の交換能力
Network Layer 4-92
出力ポート
 データグラムが出力リンク速度を超えて交換基
盤から到着した場合にバッファリングが発生
 スケジューリング規律により伝送するデータグラ
ムを選択(FIFOとは限らない)
Network Layer 4-93
出力ポート待ち行列
 出力リンク速度を超えて交換基盤からデータグラムが到
着した場合に待ち行列が形成される

待ち行列遅延や出力ポートバッファあふれによる廃棄!
Network Layer 4-94
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-95
IPv6
 当初の動機: 32ビットアドレス空間は2008年まで
に全て割り当てられる(IPアドレスの枯渇)
 付加的な動機:
高速な処理・フォワーディングの助けとなるヘッダフォー
マット
 QoSを容易にする為のヘッダの変更
 “anycast” アドレス: 複数の複製(同機能・同IP)サーバ
より最適なサーバへの経路を選択

 IPv6のパケットフォーマット:
 40バイトの固定ヘッダ
 フラグメンテーションは認められない
Network Layer 4-96
IPv6 ヘッダ
プライオリティ: フローの中でのパケットの優先順位の識別
フローラベル: パケットの“フロー”の識別
(“フロー”の意味は明確に定義されていない)
ネクストヘッダ: 上位プロトコルを識別
Network Layer 4-97
IPv4からのその他の変更点
 チェックサム: 各ホップでの処理時間を減らす為
に完全に削除
 オプション: 使用可、ただし標準IPヘッダの外で。
ネクストヘッダフィールドで指し示される
 ICMPv6: 新しいバージョンのICMP
追加されたメッセージタイプ, 例: “Packet Too Big”
 マルチキャストグループ制御機能

Network Layer 4-98
IPv4からIPv6への移行
 全てのルータを一斉にアップグレートするのは不可能
一斉に切り替えを行う日(時間)がない・用意できない
 ではどうやってIPv4とIPv6のルータが混在する中でネッ
トワークを運営するか?

 2つの提案されたアプローチ:

二重スタック(デュアルスタック): 二重スタック(v6, v4)の
ルータはIPv4、IPv6両方のパケットの送受信が可能
 トンネリング: IPv6のパケットはIPv4のルータの間では
カプセル化された荷物として運ばれる
Network Layer 4-99
2重スタックのアプローチ
A
B
C
D
E
F
IPv6
IPv6
IPv4
IPv4
IPv6
IPv6
Flow: X
Src: A
Dest: F
Src:A
Dest: F
Src:A
Dest: F
Flow: ??
Src: A
Dest: F
data
data
data
data
B-to-C:
IPv4
B-to-C:
IPv4
B-to-C:
IPv6
A-to-B:
IPv6
Network Layer 4-100
トンネリング
Logical view:
Physical view:
A
B
IPv6
IPv6
A
B
C
IPv6
IPv6
IPv4
Flow: X
Src: A
Dest: F
data
A-to-B:
IPv6
E
F
IPv6
IPv6
D
E
F
IPv4
IPv6
IPv6
tunnel
Src:B
Dest: E
Src:B
Dest: E
Flow: X
Src: A
Dest: F
Flow: X
Src: A
Dest: F
data
data
B-to-C:
IPv6 inside
IPv4
B-to-C:
IPv6 inside
IPv4
Flow: X
Src: A
Dest: F
data
E-to-F:
IPv6
Network Layer 4-101
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-102
マルチキャスト: 一人の送信者から複数の受信者へ
 マルチキャスト: 一度の送信操作で複数の受信者にパケッ
トを送信すること
 類似例: 一人の教員から複数の生徒へ
 Question: どうやってマルチキャストを実現するか
ユニキャストによる
マルチキャスト
 送信者は全ての受信者に対
しユニキャストでそれぞれパ
ケットを送信する
ルータは
ユニキャストのパケットを
送信する
マルチキャスト受信者(赤)
受信者ではない端末
Network Layer 4-103
マルチキャスト: 一人の送信者から複数の受信者へ
 マルチキャスト: 一度の送信操作で複数の受信者にパケッ
トを送信すること
 類似例: 一人の教員から複数の生徒へ
 Question: どうやってマルチキャストを実現するか
ネットワークマルチキャスト
 ルータが必要に応じてパケッ
トをコピーし受信者に送信す
る
マルチキャスト
ルータ(赤)がパケットを複製し転送する
Network Layer 4-104
マルチキャスト: 一人の送信者から複数の受信者へ
 マルチキャスト: 一度の送信操作で複数の受信者にパケッ
トを送信すること
 類似例: 一人の教員から複数の生徒へ
 Question: どうやってマルチキャストを実現するか
アプリケーションレベルの
マルチキャスト
 受信者がユニキャストでパ
ケットを受け取り更にそれを
他の受信者にユニキャスト
で送信する
Network Layer 4-105
インターネットマルチキャストサービスモデル
128.59.16.12
128.119.40.186
multicast
group
226.17.30.197
128.34.108.63
128.34.108.60
マルチキャストグループの概念: 間接アドレス形式の使用
 ホストアドレスIPパケットからマルチキャストグループへ
 ルータはマルチキャストパケットをそのマルチキャストグルー
プへ参加しているホストへ送信する
Network Layer 4-106
マルチキャストグループ
 クラスDインターネットアドレスがマルチキャスト用に予約され
ている
 ホストグループ意味論:
o 誰でもマルチキャストグループに「参加」することができる
o 誰でもマルチキャストグループに送信できる
o メンバーのホストはネットワーク層から特定はされない
 必要: マルチキャスト宛のパケットをそのマルチキャストグル
ープに参加している全てのホストに届けるためのインフラ
Network Layer 4-107
マルチキャストグループへの参加: 2つのステップ

ローカル: ホストはローカルマルチキャストルータにグループ
に参加したいことを知らせる: IGMP (Internet Group
Management Protocol)
 広域; ローカルルータはマルチキャストパケットフローを受け
取るため他のルータと交信する
 沢山のプロトコル (例: DVMRP, MOSPF, PIM)
IGMP
IGMP
wide-area
multicast
routing
IGMP
Network Layer 4-108
IGMP: Internet Group Management
Protocol

ホスト: アプリケーションがマルチキャストグループに参
加する際にIGMPレポートを送る
 IP_ADD_MEMBERSHIP ソケットオプション
ホストはグループ離脱の際、明示的にグループ離脱メ
ッセージを送る必要はない
 ルータ; 一定周期でIGMPクエリを送信する


マルチキャストグループに属するホストはクエリに対し
返信しなければならない
query
report
Network Layer 4-109
IGMP
IGMP version 1
 ルーター : ホストメンバー
シップ・クエリメッセージは
LAN上から全ホストに対
し送出される
 host: ホストメンバーシッ
プ・レポートメッセージは
グループメンバーシップを
示す

応答する前にランダムな時
間待機する

クエリに応答しないことは
離脱を暗示する
 RFC 1112
IGMP v2: 以下を含むいくつ
かの付加点
 特定メンバーシップクエリ
 グループ離脱メッセージ

クエリに応答する最後のホスト
は明示的なグループ離脱メッ
セージを送信できる

ルータはホストがグループに残
っているのかを見るため特定メ
ンバーシップクエリを送信
RFC 2236

IGMP v3: インターネット草案
として開発中
Network Layer 4-110
マルチキャストルーティング問題
 目標: ローカルマルチキャストグループのメンバー
を持つルータを接続する木(tree)を見つけること



木; ルータ間の全ての道(path)が使われるわけではない
始点基準(source-based): 送信者ごとに違う木を辿って送信
共有木(shared-tree): 全てのグループメンバーが同じ木を使用
Shared tree
Source-based trees
マルチキャスト木作成へのアプローチ
アプローチ:
 始点基準木: 1つの始点につき1つの木
shortest path trees (最短経路木)
 reverse path forwarding (RPF)

 共有木: グループで1つの木を使用
 minimal spanning (最小コスト木、スタイナー)
 center-based trees (中心的アプローチ)
…最初に基本的なアプローチを見た後に、それらアプローチを
適用する特定のプロトコルを扱う
最短経路木
 マルチキャストフォワーディング木: 始点から受信
者までの道から成る木

ダイクストラのアルゴリズム
S: 始点
説明
R1
1
2
R4
R2
3
R3
グループメンバに
接続しているルータ
5
4
R6
グループメンバに
接続していないルータ
R5
6
R7
i
転送に使用される経路、
i はアルゴリズムにより
経路が追加された順序を示す
Reverse Path Forwarding (RPF)
 ルータの持つ始点ホストからのユニキャスト最短
経路情報に頼る
 それぞれのルータはシンプルな転送動作をする:
if (始点ホストから最短経路で送られてきたマルチ
キャストパケットを受け取ったら)
then そのパケットを全出力リンクに転送
else パケットを廃棄
Reverse Path Forwarding: 例
S: 始点
説明
R1
R4
グループメンバに
接続しているルータ
R2
R5
R3
R6
R7
グループメンバに
接続していないルータ
パケットは転送される
パケットは転送されない
• 結果は始点固有のリバースSPT(Shared Pass Tree・共有木)
– 非対称のリンク郡とでは悪い選択にもなり得る
Reverse Path Forwarding: プルーニング
 フォワーディング木はマルチキャストグループメンバに繋が
っていない部分木(subtree)を含む
 部分木にパケットを転送する必要はない
 “プルーン(prune)”メッセージは下流にグループメンバを
持たないルータによって上流ルータに送られる
説明
S: 始点
R1
グループメンバに
接続しているルータ
R4
R2
P
R5
R3
R6
P
R7
P
グループメンバに
接続していないルータ
プルーンメッセージ
マルチキャストフォワーディング
によるリンク
共有木: スタイナー木
 スタイナー木; グループメンバに接続しているル
ータを繋ぐ最小コスト木
 この問題はNP完全
 優れた近似解法が存在
 しかし実際には使用されていない:
コンピュータ的・計算的に複雑
 ネットワークの全体に関する情報が必要
 融通の利かない点: ルータを加えたり切り離したりす
るたびに再計算しなければならない

中心基準木(Center-based trees)
 1つの情報伝達の木が全ルータで共有される
 1つのルータが木の“中心”として識別される
 参加するには

エッジ(端)ルータはユニキャストの参加メッセージを
中心ルータ宛に送信する
参加メッセージは中間にあるルータによって“処理”さ
れて中心ルータへ向けて転送される
 参加メッセージはその木に属する枝(ルータ)にぶつか
るか中心ルータに到着する
 参加メッセージが通った道はその木の新しい枝となる

中心基準木: 例
R6が中心として選ばれたものとする:
説明
R1
R4
3
R2
グループメンバに
接続しているルータ
2
R5
R3
1
R6
R7
1
グループメンバに
接続していないルータ
参加メッセージが作成した
道順
インターネットマルチキャストルーティング: DVMRP
 DVMRP: 距離ベクトルマルチキャストルーティン
グプロトコル、RFC1075
 氾濫(flood)とプルーン: リバースパスフォワー
ディング、始点基準木
DVMRPルータ間の通信により作られたDVMRP自身
のルーティングテーブルに基づくRPF木
 no assumptions about underlying unicast
 RPFを通して至る所へあふれるマルチキャストグルー
プへの最初のパケット
 routers not wanting group: send upstream prune
msgs

DVMRP: 続き…
 soft
state: DVMRP router periodically (1 min.)
“forgets” branches are pruned:
mcast data again flows down unpruned branch
 downstream router: reprune or else continue to
receive data

 routers can quickly regraft to tree

following IGMP join at leaf
 odds and ends
 commonly implemented in commercial routers
 Mbone routing done using DVMRP
Tunneling
Q: How to connect “islands” of multicast
routers in a “sea” of unicast routers?
physical topology
logical topology
 mcast datagram encapsulated inside “normal” (non-multicast-
addressed) datagram
 normal IP datagram sent thru “tunnel” via regular IP unicast to
receiving mcast router
 receiving mcast router unencapsulates to get mcast datagram
PIM: Protocol Independent Multicast
 not dependent on any specific underlying unicast
routing algorithm (works with all)
 two different multicast distribution scenarios :
Dense:
Sparse:
 group members
 # networks with group
densely packed, in
“close” proximity.
 bandwidth more
plentiful
members small wrt #
interconnected networks
 group members “widely
dispersed”
 bandwidth not plentiful
Consequences of Sparse-Dense Dichotomy:
Dense
 group membership by
Sparse:
 no membership until
routers assumed until
routers explicitly join
routers explicitly prune  receiver- driven
 data-driven construction
construction of mcast
on mcast tree (e.g., RPF)
tree (e.g., center-based)
 bandwidth and non bandwidth and non-groupgroup-router processing
router processing
profligate
conservative
PIM- Dense Mode
flood-and-prune RPF, similar to DVMRP but
 underlying unicast protocol provides RPF info
for incoming datagram
 less complicated (less efficient) downstream
flood than DVMRP reduces reliance on
underlying routing algorithm
 has protocol mechanism for router to detect it
is a leaf-node router
PIM - Sparse Mode
 center-based approach
 router sends
join msg
to rendezvous point
(RP)

router can switch to
source-specific tree
increased performance:
less concentration,
shorter paths
R4
join
intermediate routers
update state and
forward join
 after joining via RP,

R1
R2
R3
join
R5
join
R6
all data multicast
from rendezvous
point
R7
rendezvous
point
PIM - Sparse Mode
sender(s):
 unicast data to RP,
which distributes down
RP-rooted tree
 RP can extend mcast
tree upstream to
source
 RP can send stop msg
if no attached
receivers

“no one is listening!”
R1
R4
join
R2
R3
join
R5
join
R6
all data multicast
from rendezvous
point
R7
rendezvous
point
Chapter 4 roadmap
4.1 Introduction and Network Service Models
4.2 Routing Principles
4.3 Hierarchical Routing
4.4 The Internet (IP) Protocol
4.5 Routing in the Internet
4.6 What’s Inside a Router?
4.7 IPv6
4.8 Multicast Routing
4.9 Mobility
Network Layer 4-128
Chapter 4 内容
4.1 イントロダクションとネットワークサービスモデル
4.2 経路制御の原理
4.3 階層経路制御
4.4 The Internet (IP) プロトコル
4.5 インターネットにおけるルーティング
4.6 ルータの内部構造
4.7 IPv6
4.8 マルチキャストルーティング
4.9 モビリティ
Network Layer 4-129
What is mobility?
 spectrum of mobility, from the
network perspective:
no mobility
mobile user, using
same access point
high mobility
mobile user,
connecting/
disconnecting
from network
using DHCP.
mobile user, passing
through multiple
access point while
maintaining ongoing
connections (like cell
phone)
Network Layer 4-130
Mobility: Vocabulary
home network: permanent
“home” of mobile
(e.g., 128.119.40/24)
Permanent address:
address in home
network, can always be
used to reach mobile
e.g., 128.119.40.186
home agent: entity that will
perform mobility functions on
behalf of mobile, when mobile
is remote
wide area
network
correspondent
Network Layer 4-131
Mobility: more vocabulary
Permanent address: remains
constant (e.g., 128.119.40.186)
visited network: network
in which mobile currently
resides (e.g., 79.129.13/24)
Care-of-address: address
in visited network.
(e.g., 79,129.13.2)
wide area
network
correspondent: wants
to communicate with
mobile
home agent: entity in
visited network that
performs mobility
functions on behalf
of mobile.
Network Layer 4-132
How do you contact a mobile friend:
Consider friend frequently changing
addresses, how do you find her?
I wonder where
Alice moved to?
 search all phone
books?
 call her parents?
 expect her to let you
know where he/she is?
Network Layer 4-133
Mobility: approaches

Let routing handle it: routers advertise permanent

Let end-systems handle it:
 indirect routing: communication from
address of mobile-nodes-in-residence via usual
routing table exchange.
 routing tables indicate where each mobile located
 no changes to end-systems
correspondent to mobile goes through home
agent, then forwarded to remote
 direct routing: correspondent gets foreign
address of mobile, sends directly to mobile
Network Layer 4-134
Mobility: approaches

Let routing handle it: routers advertise permanent

let end-systems handle it:
 indirect routing: communication from
not
address of mobile-nodes-in-residence
via usual
scalable
routing table exchange.
to millions of
 routing tables indicate
mobiles where each mobile located
 no changes to end-systems
correspondent to mobile goes through home
agent, then forwarded to remote
 direct routing: correspondent gets foreign
address of mobile, sends directly to mobile
Network Layer 4-135
Mobility: registration
visited network
home network
2
1
wide area
network
foreign agent contacts home
agent home: “this mobile is
resident in my network”
mobile contacts
foreign agent on
entering visited
network
End result:
 Foreign agent knows about mobile
 Home agent knows location of mobile
Network Layer 4-136
Mobility via Indirect Routing
foreign agent
receives packets,
forwards to mobile
home agent intercepts
packets, forwards to
foreign agent
home
network
visited
network
3
wide area
network
correspondent
addresses packets
using home address
of mobile
1
2
4
mobile replies
directly to
correspondent
Network Layer 4-137
Indirect Routing: comments
 Mobile uses two addresses:
permanent address: used by correspondent (hence
mobile location is transparent to correspondent)
 care-of-address: used by home agent to forward
datagrams to mobile
 foreign agent functions may be done by mobile itself
 triangle routing: correspondent-home-networkmobile
 inefficient when
correspondent, mobile
are in same network

Network Layer 4-138
Forwarding datagrams to remote mobile
foreign-agent-to-mobile packet
packet sent by home agent to foreign
agent: a packet within a packet
dest: 79.129.13.2
dest: 128.119.40.186
dest: 128.119.40.186
Permanent address:
128.119.40.186
dest: 128.119.40.186
Care-of address:
79.129.13.2
packet sent by
correspondent
Network Layer 4-139
Indirect Routing: moving between networks
 suppose mobile user moves to another
network
registers with new foreign agent
 new foreign agent registers with home agent
 home agent update care-of-address for mobile
 packets continue to be forwarded to mobile (but
with new care-of-address)

 Mobility, changing foreign networks
transparent: on going connections can be
maintained!
Network Layer 4-140
Mobility via Direct Routing
correspondent forwards
to foreign agent
foreign agent
receives packets,
forwards to mobile
home
network
4
wide area
network
2
correspondent
requests, receives
foreign address of
mobile
visited
network
1
3
4
mobile replies
directly to
correspondent
Network Layer 4-141
Mobility via Direct Routing: comments
 overcome triangle routing problem
 non-transparent to correspondent:
correspondent must get care-of-address
from home agent

What happens if mobile changes networks?
Network Layer 4-142
Mobile IP
 RFC 3220
 has many features we’ve seen:
 home agents, foreign agents, foreign-agent
registration, care-of-addresses, encapsulation
(packet-within-a-packet)
 three components to standard:
 agent discovery
 registration with home agent
 indirect routing of datagrams
Network Layer 4-143
Mobile IP: agent discovery
 agent advertisement: foreign/home agents advertise
service by broadcasting ICMP messages (typefield = 9)
0
type = 9
24
checksum
=9
code = 0
=9
H,F bits: home
and/or foreign agent
R bit: registration
required
16
8
router address
type = 16
length
registration lifetime
standard
ICMP fields
sequence #
RBHFMGV
reserved
bits
0 or more care-ofaddresses
mobility agent
advertisement
extension
Network Layer 4-144
Mobile IP: registration example
home agent
HA: 128.119.40.7
foreign agent
COA: 79.129.13.2
visited network: 79.129.13/24
ICMP agent adv.
COA: 79.129.13.2
….
registration req.
COA: 79.129.13.2
HA: 128.119.40.7
MA: 128.119.40.186
Lifetime: 9999
identification: 714
encapsulation format
….
Mobile agent
MA: 128.119.40.186
registration req.
COA: 79.129.13.2
HA: 128.119.40.7
MA: 128.119.40.186
Lifetime: 9999
identification:714
….
registration reply
time
HA: 128.119.40.7
MA: 128.119.40.186
Lifetime: 4999
Identification: 714
encapsulation format
….
registration reply
HA: 128.119.40.7
MA: 128.119.40.186
Lifetime: 4999
Identification: 714
….
Network Layer 4-145
Network Layer: summary
What we’ve covered:
 network layer services
 routing principles: link state and
distance vector
 hierarchical routing
 IP
 Internet routing protocols RIP,
OSPF, BGP
 what’s inside a router?
 IPv6
 mobility
Next stop:
the Data
link layer!
Network Layer 4-146