Chapter 4 Network Layer A note on the use of these ppt slides: We’re making these slides freely available to all (faculty, students, readers). They’re in PowerPoint form so you can add, modify, and delete slides (including this one) and slide content to suit your needs. They obviously represent a lot of work on our part. In return for use, we only ask the following: If you use these slides (e.g., in a class) in substantially unaltered form, that you mention their source (after all, we’d like people to use our book!) If you post any slides in substantially unaltered form on a www site, that you note that they are adapted from (or perhaps identical to) our slides, and note our copyright of this material. Computer Networking: A Top Down Approach Featuring the Internet, 2nd edition. Jim Kurose, Keith Ross Addison-Wesley, July 2002. Thanks and enjoy! JFK/KWR All material copyright 1996-2002 J.F Kurose and K.W. Ross, All Rights Reserved Network Layer 4-1 Chapter 4: Network Layer 目標: 概要: ネットワーク層サービスの背 ネットワーク層サービス 後にある原理の理解: 経路制御(パス選択) 大規模化 ルータ動作 最近の話題: IPv6, モビリ ティ インターネットにおける事例 と実装 経路制御の原理: パス選択 階層ルーティング IP インターネット経路制御プロトコル intra-domain inter-domain ルータの内部構造 IPv6 モビリティ Network Layer 4-2 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-3 ネットワーク層の機能 始点ホストから終点ホストへのパ ケット転送(プロセス間ではない) ネットワーク層機能は,全てのホ スト,ルータにある 3つの重要な機能: 経路決定: 送信ホスト・受信ホス ト間の経路.経路制御アルゴリズ ム フォワーディング: ルータ入力ポ ートから適切な出力ポートへの交 換 呼設定: アーキテクチャによって は,データ転送前にパスに沿った ルータ呼設定が必要 application transport network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical application transport network data link physical Network Layer 4-4 ネットワークサービスモデル Q: 送信ホストから受信ホ ストまでパケットがとお る“チャネル”のための サービスモデルは? 帯域保証か? パケット間の同期保証か( ジッタなし)? ロスフリーか? 順序保証か? 送信ホストへの輻輳通知 ありか? ネットワーク層によって提供され るサービスの抽象化において最 も重要なものは: ? ? ? 仮想回線(バーチャルサーキット) か データグラムか? Network Layer 4-5 仮想回線(VC) “送受信間パスは電話回線のように振舞う” 性能指向 送受信間パスにそったネットワークアクション データ転送の前後に呼設定と開放 パケットはVC識別子を含む(終点ホストIDではない) 送受信パス上のルータは経由するコネクションの状態を保持 エンドシステム間のトランスポート層コネクション リンク,ルータ資源(帯域,バッファ)の各VCへの割当 専用回線の性能を得るために Network Layer 4-6 仮想回線:シグナリングプロトコル VCの設定,維持,開放に使用 ATM, frame-relay, X.25 で使用 今日のインターネットでは用いられていない application transport 5. Data flow begins network 4. Call connected data link 1. Initiate call physical 6. Receive data application 3. Accept call 2. incoming call transport network data link physical Network Layer 4-7 データグラムネットワーク:インターネットモデル ネットワーク層における呼設定なし ルータ: エンド間コネクションに関する状態保持せず ネットワーク層レベルでのコネクションの概念なし 終点ホストアドレスにもとづくパケットフォワーディング 送受信ペア間のパケットは異なるパスを通りうる application transport network data link 1. Send data physical application transport network 2. Receive data data link physical Network Layer 4-8 ネットワーク層におけるサービスモデル :ATMネットワーク Network Architecture Internet Service Model Guarantees ? Congestion Bandwidth Loss Order Timing feedback best effort none ATM CBR ATM VBR ATM ABR ATM UBR constant rate guaranteed rate guaranteed minimum none no no no yes yes yes yes yes yes no yes no no (inferred via loss) no congestion no congestion yes no yes no no インターネットモデルへの拡張: Intserv, Diffserv 6章 Network Layer 4-9 データグラムかVCか: なぜ? インターネット コンピュータ間のデータ交換 “エラスティック(伸縮)”サー ビス,厳密なタイミング保証 の必要なし “賢い”エンドシステム(コンピュー タ) 適応性があり,制御を実行で き,誤り回復を実行できる ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性 “賢くない(dumb)”エンドシステム 電話 ネットワーク内は複雑 ネットワーク内は簡単化,“エ ッジ”は複雑 リンクの多様性 多様な性質 一様なサービスは困難 Network Layer 4-10 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 Link state routing Distance vector routing 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-11 経路制御(ルーティング) ルーティングプロトコル 目標: 送受信間の“良好な”パス (ルータのつながり)の決定 5 2 A 経路制御アルゴリズムのた めのグラフによる抽象化: B 2 1 D 3 C 3 1 5 F 1 E 2 グラフのノードはルータを 表す グラフのエッジは物理リン クを表す “良好な”パス: 通常は最小コストパスのこと 他の定義も可能 リンクコスト:遅延,費用, 輻輳レベル Network Layer 4-12 経路制御アルゴリズムの分類 グローバルまたは分散情報? 静的または動的? グローバル: 静的: 全ルータは完全なトポロジ,リン クコスト情報をもつ “リンクステート”アルゴリズム 分散型: ルータは,隣接ルータと隣接ルー タへのリンクコスト情報をもつ 隣接ノードとの情報交換と計算 の繰り返し処理 “距離ベクトル”アルゴリズ 経路が時間的にゆっくり 変化 動的: 経路がすばやく変化 周期的に更新 リンクコストの変化に 応じて更新 Network Layer 4-13 リンクステート経路制御アルゴリズム Dijkstra アルゴリズム 全ノードはネットワークトポロジ とリンクコストを知っている “リンクステートブロードキ ャスト”によって実現 全ノードは同じ情報をもつ あるノード(“ソース”)から他の 全ノードへの最小コストパスを 計算 経路表を得る 反復:k 反復後,k 終点まで の最小コストを得る 記号: c(i,j): ノード i から j までのリ ンクコスト.隣接ノードでなけれ ばコストは無限大 D(v): ソースから終点 V まで の現在のパスコスト p(v): ソースから v にいたる パス上で v の直前のノード,す なわちその次ノードは v N: 最小コストパスが既知とな ったノードの集合 Network Layer 4-14 Dijsktra アルゴリズム 1 Initialization: 2 N = {A} 3 for all nodes v 4 if v adjacent to A 5 then D(v) = c(A,v) 6 else D(v) = infinity 7 8 Loop 9 find w not in N such that D(w) is a minimum 10 add w to N 11 update D(v) for all v adjacent to w and not in N: 12 D(v) = min( D(v), D(w) + c(w,v) ) 13 /* new cost to v is either old cost to v or known 14 shortest path cost to w plus cost from w to v */ 15 until all nodes in N Network Layer 4-15 Dijkstra アルゴリズム: 例 Step 0 1 2 3 4 5 start N A AD ADE ADEB ADEBC ADEBCF D(B),p(B) D(C),p(C) D(D),p(D) D(E),p(E) D(F),p(F) 2,A 1,A 5,A infinity infinity 2,A 4,D 2,D infinity 2,A 3,E 4,E 3,E 4,E 4,E 5 2 A B 2 1 D 3 C 3 1 5 F 1 E 2 Network Layer 4-16 Dijkstra アルゴリズム,ディスカッション アルゴリズムの複雑さ: n ノード 反復ごとに N に含まれない全ノード w をチェックする必要あり n*(n+1)/2 比較: O(n**2) より効果的な実装が可能: O(nlogn) 発振の可能性: 例,リンクコスト = 運ばれるトラヒック量 D 1 1 0 A 0 0 C e 1+e B e initially 2+e D 0 1 A 1+e 1 C 0 B 0 … recompute routing 0 D 1 A 0 0 2+e B C 1+e … recompute 2+e D 0 A 1+e 1 C 0 B e … recompute Network Layer 4-17 距離ベクトル経路制御アルゴリズム 反復: ノードが情報交換しなくな るまで繰り返し 自律終了: 終了のための “シグナル”はない 非同期: ノードは,ロックステップで 距離テーブルデータ構造 各ノードが自分用のものをもつ 行:とりうる終点ホストごと 列:ノードにいたる隣接ノードごと 例:ノード X 内,隣接ノード Z を経た 終点ノード Y: は,情報交換の必要/繰り 返しなし 分散: 各ノードは,直接の隣接ノ ードとのみ通信 次ホップとして Z を選ん = だ場合のノード X から Y X D (Y,Z) への距離 = c(X,Z) + min {DZ(Y,w)} w Network Layer 4-18 距離テーブル:例 7 A B 1 C E cost to destination via D () A B D A 1 14 5 B 7 8 5 C 6 9 4 D 4 11 2 2 8 1 E 2 D E D (C,D) = c(E,D) + min {DD(C,w)} = 2+2 = 4 w E D (A,D) = c(E,D) + min {DD(A,w)} E w = 2+3 = 5 loop! D (A,B) = c(E,B) + min {D B(A,w)} = 8+6 = 14 w loop! Network Layer 4-19 距離テーブルによる経路表の構築 E cost to destination via Outgoing link D () A B D A 1 14 5 A A,1 B 7 8 5 B D,5 C 6 9 4 C D,4 D 4 11 2 D D,4 Distance table to use, cost Routing table Network Layer 4-20 距離ベクトルルーティング:概要 反復,非同期: 各局所反復は, 各ノードの動作: 以下の原因で発生: ローカルリンクコストの変化 隣接ホストからのメッセージ受 信:隣接ホストからの最小コス トパスの変化を知る 分散: (隣接ノードからのメッセー ジのローカルリンクコスト の変化)を待つ 各ノードは,任意の終点ホスト への最小コストパスが変化した 場合にのみ,隣接ノードに通知 必要なら隣接ノードはその隣 接ノードに通知… 距離テーブルの再計算 任意の終点ホストへの最小コ ストパスが変化すると,隣接ノ ードに通知 Network Layer 4-21 距離ベクトルアルゴリズム: 全ノード X において: 1 Initialization: (初期化) 2 for (全ての隣接するノードvに対して): 3 D X(*,v) = ∞ /* *演算子は“全ての列に対して”を意味する。 */ 4 D X(v,v) = c(X,v) 5 for (全ての終点ノードyに対して) 6 各隣接ノードに対して min DX(y,w) を送付 w /* w は X の全隣接ノードにわたる。 */ Network Layer 4-22 距離ベクトルアルゴリズム(つづき): 8 loop (ループ) 9 wait (隣接ノードVに接続するリンクのコストが変化するか 10 隣接ノードVから更新情報を受信するまで) 11 12 if (c(X,V) がdだけ変化した場合) 13 /* 隣接ノードVを経由する全ての終点に至る経路のコストをdだけ変更する */ 14 /* dは正の数もしくは負の数を取り得る */ 15 for (全ての終点Yに対して : DX (y,V) = DX(y,V) + d ) 16 17 else if (終点Yに関してVから更新情報を受信した場合) 18 /* VからYに至る最短経路が変化した。 */ 19 /* Vはmin DV(Y,w)に関して新しい値を送付する。 */ w 20 /* 新しく受信した値を “newval“ と記する。 */ 21 終点Yに関する最小コストを更新 : DX (Y,V) = c(X,V) + newval 22 23 if (任意の終点Yについてmin DX (Y,w)が変化した場合 w 24 新しいmin DX(Y,w)の値を全隣接ノードに送付 w 25 Network Layer 4-23 26 forever (ループ終端、永久に続ける) 距離ベクトルアルゴリズム:例 X 2 Y 7 1 Z Network Layer 4-24 距離ベクトルアルゴリズム:例 X 2 Y 7 1 Z X Z X Y D (Y,Z) = c(X,Z) + minw{D (Y,w)} = 7+1 = 8 D (Z,Y) = c(X,Y) + minw {D (Z,w)} = 2+1 = 3 Network Layer 4-25 距離ベクトル:リンクコストの変化 リンクコストの変化: ノードがローカルリンクコストの変化を検出 距離テーブルの更新(15行目) 最小コストパスのコストが変化した場合,隣 接ノードに通知(23,24行目) “良いニ ュースは 速く伝わ る” 1 X 4 Y 1 50 Z algorithm terminates Network Layer 4-26 距離ベクトル:リンクコストの変化 リンクコストの変化: 良いニュースは速く伝わる 悪いニュースはゆっくり伝わる - “count to infinity” 問題! 60 X 4 Y 1 50 Z algorithm continues on! Network Layer 4-27 距離ベクトル: poisoned reverse Xに到達するのにZがYを経由するのなら : ZはYに,ZからXへの距離は無限大であると伝 える(これによりYはZを介してXにいかない) この方法によってcount to infinity問題を完全 に解決できるだろうか? 60 X 4 Y 50 1 Z algorithm terminates Network Layer 4-28 リンクステート型と距離ベクトル型の比較 メッセージ複雑度 ロバスト性: ルータがおかしく なったら何がおこるか? LS: n ノード, E リンクでは, O(nE) メッセージが送信される LS: DV: 隣接ノード間でのみ交換され る 収束時間が変動する 収束速度 LS: O(n2) アルゴリズムで,O(nE) メッセージが必要 発振の可能性 DV: 収束時間は変動 経路がループしているかもしれ ない count-to-infinity 問題 ノードが間違ったリンクコスト を広告する可能性がある 各ノードは自身のテーブルを 計算する DV: DV ノードは,誤ったパスコス トを広告する可能性がある 各ノードのテーブルは他のノ ードに利用される • エラーがネットワークを介し て伝播する Network Layer 4-29 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-30 階層ルーティング これまでの議論は理想化されていた 全てのルータは同一 ネットワークは“フラット” … でも実際は違う スケール: 2億もの終点ノー ド: 経路表に全終点ノードを記述 することは無理! 経路表交換でリンクがいっぱ いになる! 管理の自律性 インターネット = ネットワークの ネットワーク ネットワーク管理者は,自身のネ ットワーク内の経路制御を自分 で管理したいかもしれない Network Layer 4-31 階層ルーティング ルータ群をリージョン“自律シ ステム(AS: Autonomous System)”に集約する 同一 AS 内のルータは同一の 経路制御アルゴリズムを実行 “intra-AS” ルーティングプロ トコル 異なるAS内のルータは,異な るintra-ASルーティングプロ トコルを実行するかもしれない ゲートウェイルータ AS 内の特別なルータ AS 内の他のルータとは, intra-AS ルーティングプロ トコルを実行 さらに,AS外の終点に対す るルーティングもおこなう 他のゲートウェイルータ と,inter-AS ルーティ ング プロトコルを実行 Network Layer 4-32 Intra-AS と Inter-AS ルーティング C.b a C ゲートウェイ: B.a A.a b A.c d A a b c a c B b •ゲートウェイ間では inter-AS ルーティ ングを実行 •AS 内の他のルー タとは intra-AS ル ーティングを実行 ネットワーク層 ゲートウェイ A.c におけ る inter-AS, intra-AS ルーティング リンク層 物理層 Network Layer 4-33 Intra-AS と Inter-AS ルーティング C.b a Host h1 C b A.a Inter-AS routing between A and B A.c a d c b A Intra-AS routing within AS A B.a a c B Host h2 b Intra-AS routing within AS B 特定の inter-AS と intra-AS インターネットルーティ ングプロトコルを紹介 Network Layer 4-34 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 4.6 4.7 4.8 4.9 4.4.1 IPv4 アドレッシング 4.4.2 始点ホストから終点ホストへのデータグラムの流れ 4.4.3 Datagram フォーマット 4.4.4 IP フラグメンテーション 4.4.5 ICMP: Internet Control Message Protocol 4.4.6 DHCP: Dynamic Host Configuration Protocol 4.4.7 NAT: Network Address Translation インターネットにおけるルーティング ルータの内部構造 IPv6 マルチキャストルーティング モビリティ Network Layer 4-35 インターネットのネットワーク層 ホスト,ルータのネットワーク層機能: Transport layer: TCP, UDP Network layer IP protocol •addressing conventions •datagram format •packet handling conventions Routing protocols •path selection •RIP, OSPF, BGP forwarding table ICMP protocol •error reporting •router “signaling” Link layer physical layer Network Layer 4-36 IP アドレッシング: はじめに IP アドレス: ホスト,ル 223.1.1.1 ータのインタフェースの ための32ビット識別子 インタフェース: ホスト/ ルータと物理リンクを接 続 223.1.2.1 223.1.1.2 223.1.1.4 223.1.1.3 ルータは,通常,複数のイ ンタフェースをもつ ホストは,複数のインター フェースを持つ場合がる 各インタフェースには IP アドレスが割り振られる 223.1.2.9 223.1.3.27 223.1.2.2 223.1.3.2 223.1.3.1 223.1.1.1 = 11011111 00000001 00000001 00000001 223 1 1 1 Network Layer 4-37 IP アドレッシング IP アドレス: ネットワーク部(上位ビット) ホスト部(下位ビット) 223.1.1.1 223.1.2.1 223.1.1.2 223.1.1.4 223.1.2.9 ネットワークとは何か? (IPアドレスから見た場合) IPアドレスが同じネットワー ク部をもつデバイスインタフ ェース群 223.1.1.3 223.1.3.27 223.1.2.2 LAN 223.1.3.1 223.1.3.2 ルータが介在することなく, 互いに物理的に到達可能 3つのIPネットワークからなるネットワーク (223で始まる24ビットネットワークアドレ スをもつ) Network Layer 4-38 IP アドレッシング ネットワークをどのようには っけんするか? 223.1.1.2 223.1.1.1 223.1.1.3 ルータ,ホストからインタ フェースを切り離す 223.1.1.4 223.1.9.2 223.1.7.0 分離されたネットワーク の“島”が出来上がる 223.1.9.1 223.1.7.1 223.1.8.1 223.1.8.0 223.1.2.6 6つのネットワークが相 223.1.2.1 互接続されたシステム 223.1.3.27 223.1.2.2 223.1.3.1 223.1.3.2 Network Layer 4-39 IP アドレス ネットワークの概念を得たところで,IPアドレスについて再考しよう: “クラス型”アドレッシング class A 0 network B 10 C 110 D 1110 1.0.0.0 to 127.255.255.255 host network 128.0.0.0 to 191.255.255.255 host network multicast address host 192.0.0.0 to 223.255.255.255 224.0.0.0 to 239.255.255.255 32 bits Network Layer 4-40 IP アドレッシング: CIDR クラス型アドレッシング: アドレス空間の利用効率が悪い,アドレス空間の枯渇 例:たとえネットワークに2千のホストしかなくても,クラスBでは6万5 千のアドレスが割り当てられる CIDR: Classless InterDomain Routing 任意の長さのネットワーク部 アドレスフォーマット: a.b.c.d/x,ここで,x はネットワーク部のビット長 network part host part 11001000 00010111 00010000 00000000 200.23.16.0/23 Network Layer 4-41 IP アドレス:どうやって得るか? Q: ホストは IP アドレスをどうやって得るのか? システム管理者がファイル内に格納 Wintel: control-panel->network->configuration>tcp/ip->properties UNIX: /etc/rc.config (異なる場合がある) DHCP: Dynamic Host Configuration Protocol: サーバ から動的にアドレスを入手 “plug-and-play” (もっと簡単にいうと) Network Layer 4-42 IP アドレス:どうやって得るか? Q: ネットワークは,IPアドレスのネットワーク部をどう やって得るのか? A: プロバイダのISPアドレス空間の一部が割り当て られる ISP's block 11001000 00010111 00010000 00000000 200.23.16.0/20 Organization 0 Organization 1 Organization 2 ... 11001000 00010111 00010000 00000000 11001000 00010111 00010010 00000000 11001000 00010111 00010100 00000000 ….. …. 200.23.16.0/23 200.23.18.0/23 200.23.20.0/23 …. Organization 7 11001000 00010111 00011110 00000000 200.23.30.0/23 Network Layer 4-43 階層アドレッシング:ルート集約 階層アドレッシングは,効率的な経路情報広告を可能にする Organization 0 200.23.16.0/23 Organization 1 “200.23.16.0/20で始 まるアドレスを持つもの はこっちに送ってくれ” 200.23.18.0/23 Organization 2 200.23.20.0/23 Organization 7 . . . . . . Fly-By-Night-ISP Internet 200.23.30.0/23 ISPs-R-Us “199.31.0.0/16で始ま るアドレスを持つものは こっちに送ってくれ” Network Layer 4-44 階層アドレッシング:より詳しい経路情報 ISPs-R-Us が Organization 1 への経路を持つ場合 Organization 0 200.23.16.0/23 Organization 2 200.23.20.0/23 Organization 7 . . . . . . Fly-By-Night-ISP “200.23.16.0/20で始 まるアドレスを持つもの はこっちに送ってくれ” Internet 200.23.30.0/23 ISPs-R-Us Organization 1 200.23.18.0/23 “199.31.0.0/16あるいは 200.23.18.0/23で始まる アドレスを持つものはこっ ちに送ってくれ” Network Layer 4-45 IP アドレッシング:最後に… Q: ISPはアドレスブロックをどうやって得るのか? A: ICANN: Internet Corporation for Assigned Names and Numbers アドレス割当 DNSの管理 ドメイン名の割当,紛争の解決 Network Layer 4-46 データグラムの始点・終点ホスト間の配送 forwarding table in A Dest. Net. next router Nhops 223.1.1 223.1.2 223.1.3 IP datagram: misc source dest fields IP addr IP addr data A 始点から終点までの間,デー ある 223.1.1.1 223.1.2.1 タグラムは不変 ここではアドレス部に興味が 223.1.1.4 223.1.1.4 1 2 2 B 223.1.1.2 223.1.1.4 223.1.2.9 223.1.2.2 223.1.1.3 223.1.3.1 223.1.3.27 E 223.1.3.2 Network Layer 4-47 データグラムの始点・終点ホスト間の配送 forwarding table in A misc data fields 223.1.1.1 223.1.1.3 Dest. Net. next router Nhops 223.1.1 223.1.2 223.1.3 A から B に IPデータグラムを 送信する場合: フォワーディングテーブル内でBの ネットワークアドレスを検索 BがAと同じネットワークであること を発見 リンク層は,リンク層フレームにより データグラムをBに直接送信 BとAは直接接続されている A 223.1.1.4 223.1.1.4 1 2 2 223.1.1.1 223.1.2.1 B 223.1.1.2 223.1.1.4 223.1.2.9 223.1.2.2 223.1.1.3 223.1.3.1 223.1.3.27 E 223.1.3.2 Network Layer 4-48 データグラムの始点・終点ホスト間の配送 forwarding table in A misc data fields 223.1.1.1 223.1.2.2 Dest. Net. next router Nhops 223.1.1 223.1.2 223.1.3 AからEへの転送: フォワーディングテーブルでEのネ ットワークアドレスを検索 Eは違うネットワーク上にある AとEは直接つながっていない 経路表:Eへの次ホップルータは, 223.1.1.4 リンク層は,リンク層フレームによ りデータグラムをルータ223.1.1.4 に送信 データグラムが23.1.1.4に到達 以下繰り返し… A 223.1.1.4 223.1.1.4 1 2 2 223.1.1.1 223.1.2.1 B 223.1.1.2 223.1.1.4 223.1.2.9 223.1.2.2 223.1.1.3 223.1.3.1 223.1.3.27 E 223.1.3.2 Network Layer 4-49 データグラムの始点・終点ホスト間の配送 misc data fields 223.1.1.1 223.1.2.2 223.1.4に到着,223.1.2.2へ ルータのフォワーディングテーブ forwarding table in router Dest. Net router Nhops interface 223.1.1 223.1.2 223.1.3 ルで,Eのネットワークアドレスを 検索 E は,ルータインタフェース 223.1.2.9と同じネットアドレス A ルータとEは直接接続 リンク層はインタフェース223.1.2.9 を 介し,リンク層フレームによりデー タグラムを223.1.2.2に送信 データグラムが223.1.2.2に到着 ! (万歳!) B - 1 1 1 223.1.1.4 223.1.2.9 223.1.3.27 223.1.1.1 223.1.2.1 223.1.1.2 223.1.1.4 223.1.2.9 223.1.2.2 223.1.1.3 223.1.3.1 223.1.3.27 E 223.1.3.2 Network Layer 4-50 IP データグラムフォーマット IP protocol version number header length (bytes) “type” of data max number remaining hops (decremented at each router) upper layer protocol to deliver payload to TCPのオーバヘッドは どのくらいか? 20 bytes of TCP 20 bytes of IP = 40 bytes + app layer overhead 32 bits head. type of length ver len service fragment 16-bit identifier flgs offset upper time to Internet layer live checksum total datagram length (bytes) for fragmentation/ reassembly 32 bit source IP address 32 bit destination IP address Options (if any) data (variable length, typically a TCP or UDP segment) E.g. timestamp, record route taken, specify list of routers to visit. Network Layer 4-51 IP フラグメンテーションとリアッセンブリ ネットワークリンクには最大転送 サイズ(MTU: max.transfer size)がある – 最大限可能なリン クレベルフレームのサイズ fragmentation: in: one large datagram out: 3 smaller datagrams 種類の異なるリンクは,異なる MTU を持つ ネットワーク内で大きな IP データ グラムを分割(フラグメント)する ひとつのデータグラムが複数 のデータグラムに 最終的な終点ホストにてのみ 再構築(リアッセンブル)され る 関連するフラグメントを識別, 並べるためにIPヘッダのフィ ールドが利用される reassembly Network Layer 4-52 IP フラグメンテーションとリアッセンブリ 例 4000 バイトデータグ ラム MTU = 1500 bytes length ID fragflag offset =4000 =x =0 =0 ひとつの大きなデータグラムがいくつかの 小さなデータグラムになる length ID fragflag offset =1500 =x =1 =0 length ID fragflag offset =1500 =x =1 =1480 length ID fragflag offset =1040 =x =0 =2960 Network Layer 4-53 ICMP: Internet Control Message Protocol ホスト,ルータ,ゲートウェイがネッ トワークレベル情報を通信するた めに利用 エラー報告:不達ホスト,ネット ワーク,ポート,プロトコル エコー要求/応答 (ping で利 用される) IP “より上”のネットワーク層: ICMP メッセージは,IPデータ グラムで運ばれる ICMPメッセージ: タイプ,コード+ エラーを起こしたIPデータグラム の最初の8バイト Type 0 3 3 3 3 3 3 4 Code 0 0 1 2 3 6 7 0 8 9 10 11 12 0 0 0 0 0 description echo reply (ping) dest. network unreachable dest host unreachable dest protocol unreachable dest port unreachable dest network unknown dest host unknown source quench (congestion control - not used) echo request (ping) route advertisement router discovery TTL expired bad IP header Network Layer 4-54 DHCP: Dynamic Host Configuration Protocol 目標: ホストがネットワークに接続した際にネットワークサーバか ら動的にIPアドレスを入手することを可能にする. 使用中のアドレスのリースを更新できる(使用中の場合のみアドレスを保 持できる) アドレスの再利用を可能にする モバイルユーザがネットワークを利用することをサポート DHCP 概要: ホストは “DHCP discover” メッセージをブロードキャスト DHCP サーバは “DHCP offer” メッセージで応答 ホストは IP アドレスを要求: “DHCP request” メッセージ DHCP サーバはアドレスを送信: “DHCP ack” メッセージ Network Layer 4-55 DHCP クライアント・サーバ シナリオ A B 223.1.2.1 DHCP server 223.1.1.1 223.1.1.2 223.1.1.4 223.1.2.9 223.1.2.2 223.1.1.3 223.1.3.1 223.1.3.27 223.1.3.2 E arriving DHCP client needs address in this network Network Layer 4-56 DHCP クライアント・サーバ シナリオ DHCP server: 223.1.2.5 DHCP discover arriving client src : 0.0.0.0, 68 dest.: 255.255.255.255,67 yiaddr: 0.0.0.0 transaction ID: 654 DHCP offer src: 223.1.2.5, 67 dest: 255.255.255.255, 68 yiaddrr: 223.1.2.4 transaction ID: 654 Lifetime: 3600 secs DHCP request time src: 0.0.0.0, 68 dest:: 255.255.255.255, 67 yiaddrr: 223.1.2.4 transaction ID: 655 Lifetime: 3600 secs DHCP ACK src: 223.1.2.5, 67 dest: 255.255.255.255, 68 yiaddrr: 223.1.2.4 transaction ID: 655 Lifetime: 3600 secs Network Layer 4-57 NAT: Network Address Translation rest of Internet local network (e.g., home network) 10.0.0/24 10.0.0.4 10.0.0.1 10.0.0.2 138.76.29.7 10.0.0.3 ローカルネットワークから外に向かう全 てのデータグラムは,同じ送信 NAT IP アドレス(138.76.29.7)を持つが,そのソ ースポート番号は異なる このネットワーク内に終点または始 点をもつデータグラムは,(通常) 10.0.0/24 アドレスを,始点,終点に もつ Network Layer 4-58 NAT: Network Address Translation モチベーション: ローカルネットワークは,外部に接続されてい る限りにおいては,ひとつのIPアドレスのみを使う: ISPからある範囲のアドレスを割当ててもらう必要がない: - たった一つのIPアドレスが全デバイスで利用される ローカルネットワーク内のデバイスのアドレスを外部に通知 することなく変更できる ローカルネットワーク内のデバイスのアドレスを変えることな く ISP を乗り換えることができる ローカルネットワーク内のデバイスは,外部から陽にはアク セスできない,外部から見えない(安全性が増す) Network Layer 4-59 NAT: Network Address Translation 実装: NAT ルータは次のことができなければならない: 外向データグラム: 外向きデータグラムの(始点 IP アドレス, 各(始点 IP アドレス,ポート番号)-(NAT IP アドレス,新規 ポート番号)変換対を(NAT変換テーブル内で)記憶 ポート番号)を(NAT IPアドレス,新規ポート番号)に置換 . . . 外部のリモートクライアント/サーバは,終点アドレスと して(NAT IPアドレス,新規ポート番号)を使って応答 到着データグラム:incoming datagrams: replace 終点に( NAT IP アドレス,新規ポート番号)をもつ到着データグラム の終点をNAT変換テーブルに保持された(始点 IP アドレス, ポート番号)に変換 Network Layer 4-60 NAT: Network Address Translation 2: NAT router changes datagram source addr from 10.0.0.1, 3345 to 138.76.29.7, 5001, updates table 2 NAT translation table WAN side addr LAN side addr 1: host 10.0.0.1 sends datagram to 128.119.40, 80 138.76.29.7, 5001 10.0.0.1, 3345 …… …… S: 10.0.0.1, 3345 D: 128.119.40.186, 80 S: 138.76.29.7, 5001 D: 128.119.40.186, 80 138.76.29.7 S: 128.119.40.186, 80 D: 138.76.29.7, 5001 3: Reply arrives dest. address: 138.76.29.7, 5001 3 1 10.0.0.4 S: 128.119.40.186, 80 D: 10.0.0.1, 3345 10.0.0.1 10.0.0.2 4 10.0.0.3 4: NAT router changes datagram dest addr from 138.76.29.7, 5001 to 10.0.0.1, 3345 Network Layer 4-61 NAT: Network Address Translation 16ビットポート番号フィールド: 60,000 の同時コネクション NAT の論点: ルータは3層までをサポートすべき エンド間という趣旨に違反 • NAT の存在をアプリケーション設計者(例えば,P2Pアプリケ ーション)が考慮しなければならない アドレス不足は,IPv6によって解決されるべきだ Network Layer 4-62 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.5.1 Intra-AS ルーティング: RIP と OSPF 4.5.2 Inter-AS ルーティング: BGP 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-63 インターネットにおける経路制 インターネットは,相互に接続された自律システム( AS: Autonomous Systems)からなる: Stub AS: 小企業: 他のASに対して1接続 Multihomed AS: 大企業(非中継): 他のASに対して複 数接続 Transit AS: プロバイダ,多くの AS が接続 2レベル経路制御: Intra-AS: 管理者は,ネットワーク内の経路制御の選 択に関して責任がある Inter-AS: inter-AS 経路制御については唯一の標準 がある: BGP Network Layer 4-64 インターネット AS 階層 Intra-AS border (exterior gateway) routers Inter-AS interior (gateway) routers Network Layer 4-65 Intra-AS 経路制御 Interior Gateway Protocols (IGP) として知られている 最も一般的な Intra-AS 経路制御プロトコル: RIP: Routing Information Protocol OSPF: Open Shortest Path First IGRP: Interior Gateway Routing Protocol (Cisco 独自方式) Network Layer 4-66 RIP ( Routing Information Protocol) 距離ベクトルアルゴリズム 1982年のBSD-UNIX ディストリビューションに含まれた 距離メトリック: ホップ数(最大15ホップ) その理由はなぜか? 距離ベクトル: 隣接ノード間と30秒ごとにResponse Message (広告:advertisementとも呼ばれる)を介して交換 各広告:AS内の最大25終点ネットワークのリスト Network Layer 4-67 RIP: 例 z w A x D B y C Destination Network w y z x …. Routing table in D Next Router Num. of hops to dest. …. .... A B B -- 2 2 7 1 Network Layer 4-68 RIP: 例 Dest w x z …. Next C … w hops 4 ... A AからDへの広告 z x Destination Network w y z x …. D B C y Next Router Num. of hops to dest. …. .... A B B A -- Routing table in D 2 2 7 5 1 Network Layer 4-69 RIP: リンク故障と復旧 180秒間広告を受信しなかった場合→隣接ノード/リンクが死 んだと判定 隣接ノードを介した経路を無効化 新しい広告を隣接ノードに送信 隣接ノードは,(テーブルが変更されたら)順番に新しい広 告を送信 リンク故障情報が全ネットワークにすばやく伝播 ピンポンループを防ぐためにポイズンリバースを使用 (無限距離 = 16 ホップ) Network Layer 4-70 RIP テーブル処理 RIP 経路テーブルは route-d (デーモン)とよばれるア プリケーションレベルプロセスによって管理される 広告は UDP パケットによって送信され,定期的に繰り返 される routed routed Transprt (UDP) network (IP) link physical Transprt (UDP) forwarding table forwarding table network (IP) link physical Network Layer 4-71 RIP テーブルの例 Router: giroflee.eurocom.fr Destination -------------------127.0.0.1 192.168.2. 193.55.114. 192.168.3. 224.0.0.0 default Gateway Flags Ref Use Interface -------------------- ----- ----- ------ --------127.0.0.1 UH 0 26492 lo0 192.168.2.5 U 2 13 fa0 193.55.114.6 U 3 58503 le0 192.168.3.5 U 2 25 qaa0 193.55.114.6 U 3 0 le0 193.55.114.129 UG 0 143454 3つのクラス C ネットワーク(LAN)が接続 ルータのみが接続された LAN への経路を知っている その他へはデフォルトルータを使用 マルチキャストアドレス(224.0.0.0)への経路 ループバックインタフェース(デバッグ用) Network Layer 4-72 OSPF (Open Shortest Path First) “open”: パブリックに利用可能 リンクステートアルゴリズムを使用 LS パケットの配布 各ノードにおけるトポロジマップ Dijkstraアルゴリズムを使った経路計算 OSPF 広告は,隣接ノードあたり一つのエントリを運ぶ 広告は,(フラッディングをもちいて)AS全体へ配信される (TCPやUDPというより)IPを介して直接 ISPF メッセージによって運 ばれる Network Layer 4-73 OSPF の(RIPにはない)優れた特徴 セキュリティ: 全ての OSPF メッセージは(悪意のある侵入を 防ぐため)認証される 複数の同一コストパス許される(RIPでは一つのパスのみ) 各リンクごとに,異なるTOS(例えば,衛星リンクコストをベス トエフォートに対して低く,リアルタイムに対して高く設定)に 対して複数のコストメトリックを使用可能 ユニ,マルチキャストサポートの統合: マルチキャストOSPF (MOSPF) は,OSPFと同じトポロジ データベースを使用 大きなドメインでは階層OSPF を使用 Network Layer 4-74 階層 OSPF Network Layer 4-75 階層 OSPF 2レベル階層: ローカルエリア,バックボーン リンクステート広告はエリア内のみ 各ノードはエリア内の詳細なトポロジ情報を有する;他の エリアのネットワークへの方向(最短パス)のみを知る エリア境界ルータ: 自身のエリア内のネットワークへの距離 を“要約”し,他のエリア境界ルータに広告する バックボーンルータ: バックボーンに制限された OSPFルー ティングを実行 バウンダリルータ: 他の AS へ接続 Network Layer 4-76 インターネット inter-AS ルーティング: BGP R4 R5 R3 AS1 BGP AS2 (RIP intra-AS routing) BGP R1 R2 (OSPF intra-AS routing) AS3 (OSPF intra-AS routing) Figure 4.5.2-new2: BGP use for inter-domain routing Network Layer 4-77 インターネット inter-AS ルーティング: BGP BGP (Border Gateway Protocol): デファクトスタンダード パスベクトル プロトコル: 距離ベクトルプロトコルに類似 各 Border Gateway は,隣接ゲートウェイ(ピア)に目 的ネットワークへの全パス(すなわち,ASの系列)をブロ ードキャストする BGP は,個々のホストではなくネットワーク (AS)への経 路を決定する 例,ゲートウェイ X は,Z へのパスを送信: Path (X,Z) = X,Y1,Y2,Y3,…,Z Network Layer 4-78 インターネット inter-AS ルーティング: BGP 仮定: ゲートウェイ X がピアゲートウェイ W にパスを送信 W が X によって提供されたパスを選択するかどうかは任意 コスト,ポリシー(競合する AS を介したくない),ループ防 止,などの理由から W が X から提供されパスを選択した場合: Path (W,Z) = w, Path (X,Z) 注意: X は,ピアへのルート広告を制御することで,流入トラ ヒックを制御できる: 例,Z へのトラヒックを通したくない → Z への経路を広告 しない Network Layer 4-79 BGP: 誰が自分を経由するかを制御 legend: B W provider network X A customer network: C Y Figure 4.5-BGPnew: a simple BGP scenario A,B,C : プロバイダネットワーク X,W,Y: プロバイダ利用者 X はデュアルホーム: 二つのネットワークに接続 X は,Xを介した B から C への経路を望まない X は,B に C への経路を広告しない Network Layer 4-80 BGP: 誰が自分を経由するかを制御 legend: B W provider network X A customer network: C Y A は B にパス AW を広告 Figure 4.5-BGPnew: a simple BGP scenario B は X にパス BAW を広告 B は C にパス BAW を広告すべきか? とんでもない!W も C も B の顧客ではないため,B は CBAW と経 由させてもいかなる収入もない B は,C が A を介した w への経路を利用するよう強制したい B は,自分の顧客への/からの経路のみを望む! Network Layer 4-81 BGP オペレーション Q: BGP ルータは何をするのか? 隣接ゲートウェイからのルート広告を受信,フィルタリング 経路選択 終点 X への経路を向けるために,いくつかの広告され たパスのうちどれを選択するだろうか? ルート広告を隣接ゲートウェイに送信 Network Layer 4-82 BGP メッセージ BGP メッセージは TCP を介して交換される BGP メッセージ: OPEN: ピアに TCP コネクションをオープンし,送信ピアを 認証する UPDATE: 新しいパスを広告する(あるいは古いパスを破 棄する) KEEPALIVE: UPDATE がなくてもコネクションを維持す る; また,OPEN 要求に ACK を返す NOTIFICATION: 直前のメッセージにエラーを返す;ま た,コネクションをクローズするのにも利用される Network Layer 4-83 なぜ Intra- と Inter-AS ルーティングは異なるのか? ポリシー: Inter-AS: 管理者は,自身のネットワークをどのくらいのトラ ヒックが経由するのか,誰が経由するのかを制御したい Intra-AS: 一元管理だから,ポリシー決定の必要はない スケール: 階層ルーティングは,テーブルサイズを節約し,更新トラヒッ クを削減する 性能: Intra-AS: 性能に重点をおくことが可能 Inter-AS: 性能よりポリシーが重要 Network Layer 4-84 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-85 ルータアーキテクチャの概要 二つの主要機能: 経路制御アルゴリズム/プロトコルの実行 (RIP, OSPF, BGP) 入力リンクから出力リンクへのデータグラムの交換 Network Layer 4-86 入力ポート機能 物理層: ビットレベルの受信 データリンク層: e.g., Ethernet 5章参照 分散入力ポート処理: データグラムの宛先にもとづき,入力ポート 内の経路制御表を使って出力ポートをルッ クアップ 目標:ラインスピードでの入力ポート処理 待つ行列:交換基盤への転送レート以上の 速度でデータグラムが到着した場合 Network Layer 4-87 入力ポート待ち行列 交換基盤速度が入力ポート速度の合計より低い場合 ⇒入力ポートで待ち行列が形成される可能性 ヘッドオブライン(HOL) ブロッキング: 待ち行列の先頭デー タグラムが,競合しないポートを目指す,背後のデータグラ ムをブロック 待ち行列遅延や入力ポートキューでのバッファオーバフロ ーによる廃棄 Network Layer 4-88 3種類の交換基盤 Network Layer 4-89 メモリ型交換基盤 第一世代ルータ: パケットはシステムの(単一)CPUによりコピーされる 速度はメモリ帯域によって制限(データグラムあたり2度バ スを通過) Input Port Memory Output Port System Bus 現在のルータ: 入力ポートプロセッサがルックアップとメモリへのコピーを 実行(共有メモリアーキテクチャ) Cisco Catalyst 8500 Network Layer 4-90 バス型交換基盤 共有バスを介して入力ポートメモリから 出力ポートメモリへデータグラム転送 バス競合: 交換速度はバス帯域によっ て制限 1 Gbps bus, Cisco 1900: アクセスルー タ,エンタープライズルータでは十分な 交換速度(非広域・バックボーンルータ) Network Layer 4-91 内部接続網(クロスバスイッチ)型交換基盤 バス帯域制約の解決 バンヤンネットワーク,他がマルチプロセッサに おけるプロセッサ接続に利用 先端設計: データグラムを固定長セルに分割し, 交換基盤を介してセルを転送 Cisco 12000: 最大 60 Gbps の交換能力 Network Layer 4-92 出力ポート データグラムが出力リンク速度を超えて交換基 盤から到着した場合にバッファリングが発生 スケジューリング規律により伝送するデータグラ ムを選択(FIFOとは限らない) Network Layer 4-93 出力ポート待ち行列 出力リンク速度を超えて交換基盤からデータグラムが到 着した場合に待ち行列が形成される 待ち行列遅延や出力ポートバッファあふれによる廃棄! Network Layer 4-94 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-95 IPv6 当初の動機: 32ビットアドレス空間は2008年まで に全て割り当てられる(IPアドレスの枯渇) 付加的な動機: 高速な処理・フォワーディングの助けとなるヘッダフォー マット QoSを容易にする為のヘッダの変更 “anycast” アドレス: 複数の複製(同機能・同IP)サーバ より最適なサーバへの経路を選択 IPv6のパケットフォーマット: 40バイトの固定ヘッダ フラグメンテーションは認められない Network Layer 4-96 IPv6 ヘッダ プライオリティ: フローの中でのパケットの優先順位の識別 フローラベル: パケットの“フロー”の識別 (“フロー”の意味は明確に定義されていない) ネクストヘッダ: 上位プロトコルを識別 Network Layer 4-97 IPv4からのその他の変更点 チェックサム: 各ホップでの処理時間を減らす為 に完全に削除 オプション: 使用可、ただし標準IPヘッダの外で。 ネクストヘッダフィールドで指し示される ICMPv6: 新しいバージョンのICMP 追加されたメッセージタイプ, 例: “Packet Too Big” マルチキャストグループ制御機能 Network Layer 4-98 IPv4からIPv6への移行 全てのルータを一斉にアップグレートするのは不可能 一斉に切り替えを行う日(時間)がない・用意できない ではどうやってIPv4とIPv6のルータが混在する中でネッ トワークを運営するか? 2つの提案されたアプローチ: 二重スタック(デュアルスタック): 二重スタック(v6, v4)の ルータはIPv4、IPv6両方のパケットの送受信が可能 トンネリング: IPv6のパケットはIPv4のルータの間では カプセル化された荷物として運ばれる Network Layer 4-99 2重スタックのアプローチ A B C D E F IPv6 IPv6 IPv4 IPv4 IPv6 IPv6 Flow: X Src: A Dest: F Src:A Dest: F Src:A Dest: F Flow: ?? Src: A Dest: F data data data data B-to-C: IPv4 B-to-C: IPv4 B-to-C: IPv6 A-to-B: IPv6 Network Layer 4-100 トンネリング Logical view: Physical view: A B IPv6 IPv6 A B C IPv6 IPv6 IPv4 Flow: X Src: A Dest: F data A-to-B: IPv6 E F IPv6 IPv6 D E F IPv4 IPv6 IPv6 tunnel Src:B Dest: E Src:B Dest: E Flow: X Src: A Dest: F Flow: X Src: A Dest: F data data B-to-C: IPv6 inside IPv4 B-to-C: IPv6 inside IPv4 Flow: X Src: A Dest: F data E-to-F: IPv6 Network Layer 4-101 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-102 マルチキャスト: 一人の送信者から複数の受信者へ マルチキャスト: 一度の送信操作で複数の受信者にパケッ トを送信すること 類似例: 一人の教員から複数の生徒へ Question: どうやってマルチキャストを実現するか ユニキャストによる マルチキャスト 送信者は全ての受信者に対 しユニキャストでそれぞれパ ケットを送信する ルータは ユニキャストのパケットを 送信する マルチキャスト受信者(赤) 受信者ではない端末 Network Layer 4-103 マルチキャスト: 一人の送信者から複数の受信者へ マルチキャスト: 一度の送信操作で複数の受信者にパケッ トを送信すること 類似例: 一人の教員から複数の生徒へ Question: どうやってマルチキャストを実現するか ネットワークマルチキャスト ルータが必要に応じてパケッ トをコピーし受信者に送信す る マルチキャスト ルータ(赤)がパケットを複製し転送する Network Layer 4-104 マルチキャスト: 一人の送信者から複数の受信者へ マルチキャスト: 一度の送信操作で複数の受信者にパケッ トを送信すること 類似例: 一人の教員から複数の生徒へ Question: どうやってマルチキャストを実現するか アプリケーションレベルの マルチキャスト 受信者がユニキャストでパ ケットを受け取り更にそれを 他の受信者にユニキャスト で送信する Network Layer 4-105 インターネットマルチキャストサービスモデル 128.59.16.12 128.119.40.186 multicast group 226.17.30.197 128.34.108.63 128.34.108.60 マルチキャストグループの概念: 間接アドレス形式の使用 ホストアドレスIPパケットからマルチキャストグループへ ルータはマルチキャストパケットをそのマルチキャストグルー プへ参加しているホストへ送信する Network Layer 4-106 マルチキャストグループ クラスDインターネットアドレスがマルチキャスト用に予約され ている ホストグループ意味論: o 誰でもマルチキャストグループに「参加」することができる o 誰でもマルチキャストグループに送信できる o メンバーのホストはネットワーク層から特定はされない 必要: マルチキャスト宛のパケットをそのマルチキャストグル ープに参加している全てのホストに届けるためのインフラ Network Layer 4-107 マルチキャストグループへの参加: 2つのステップ ローカル: ホストはローカルマルチキャストルータにグループ に参加したいことを知らせる: IGMP (Internet Group Management Protocol) 広域; ローカルルータはマルチキャストパケットフローを受け 取るため他のルータと交信する 沢山のプロトコル (例: DVMRP, MOSPF, PIM) IGMP IGMP wide-area multicast routing IGMP Network Layer 4-108 IGMP: Internet Group Management Protocol ホスト: アプリケーションがマルチキャストグループに参 加する際にIGMPレポートを送る IP_ADD_MEMBERSHIP ソケットオプション ホストはグループ離脱の際、明示的にグループ離脱メ ッセージを送る必要はない ルータ; 一定周期でIGMPクエリを送信する マルチキャストグループに属するホストはクエリに対し 返信しなければならない query report Network Layer 4-109 IGMP IGMP version 1 ルーター : ホストメンバー シップ・クエリメッセージは LAN上から全ホストに対 し送出される host: ホストメンバーシッ プ・レポートメッセージは グループメンバーシップを 示す 応答する前にランダムな時 間待機する クエリに応答しないことは 離脱を暗示する RFC 1112 IGMP v2: 以下を含むいくつ かの付加点 特定メンバーシップクエリ グループ離脱メッセージ クエリに応答する最後のホスト は明示的なグループ離脱メッ セージを送信できる ルータはホストがグループに残 っているのかを見るため特定メ ンバーシップクエリを送信 RFC 2236 IGMP v3: インターネット草案 として開発中 Network Layer 4-110 マルチキャストルーティング問題 目標: ローカルマルチキャストグループのメンバー を持つルータを接続する木(tree)を見つけること 木; ルータ間の全ての道(path)が使われるわけではない 始点基準(source-based): 送信者ごとに違う木を辿って送信 共有木(shared-tree): 全てのグループメンバーが同じ木を使用 Shared tree Source-based trees マルチキャスト木作成へのアプローチ アプローチ: 始点基準木: 1つの始点につき1つの木 shortest path trees (最短経路木) reverse path forwarding (RPF) 共有木: グループで1つの木を使用 minimal spanning (最小コスト木、スタイナー) center-based trees (中心的アプローチ) …最初に基本的なアプローチを見た後に、それらアプローチを 適用する特定のプロトコルを扱う 最短経路木 マルチキャストフォワーディング木: 始点から受信 者までの道から成る木 ダイクストラのアルゴリズム S: 始点 説明 R1 1 2 R4 R2 3 R3 グループメンバに 接続しているルータ 5 4 R6 グループメンバに 接続していないルータ R5 6 R7 i 転送に使用される経路、 i はアルゴリズムにより 経路が追加された順序を示す Reverse Path Forwarding (RPF) ルータの持つ始点ホストからのユニキャスト最短 経路情報に頼る それぞれのルータはシンプルな転送動作をする: if (始点ホストから最短経路で送られてきたマルチ キャストパケットを受け取ったら) then そのパケットを全出力リンクに転送 else パケットを廃棄 Reverse Path Forwarding: 例 S: 始点 説明 R1 R4 グループメンバに 接続しているルータ R2 R5 R3 R6 R7 グループメンバに 接続していないルータ パケットは転送される パケットは転送されない • 結果は始点固有のリバースSPT(Shared Pass Tree・共有木) – 非対称のリンク郡とでは悪い選択にもなり得る Reverse Path Forwarding: プルーニング フォワーディング木はマルチキャストグループメンバに繋が っていない部分木(subtree)を含む 部分木にパケットを転送する必要はない “プルーン(prune)”メッセージは下流にグループメンバを 持たないルータによって上流ルータに送られる 説明 S: 始点 R1 グループメンバに 接続しているルータ R4 R2 P R5 R3 R6 P R7 P グループメンバに 接続していないルータ プルーンメッセージ マルチキャストフォワーディング によるリンク 共有木: スタイナー木 スタイナー木; グループメンバに接続しているル ータを繋ぐ最小コスト木 この問題はNP完全 優れた近似解法が存在 しかし実際には使用されていない: コンピュータ的・計算的に複雑 ネットワークの全体に関する情報が必要 融通の利かない点: ルータを加えたり切り離したりす るたびに再計算しなければならない 中心基準木(Center-based trees) 1つの情報伝達の木が全ルータで共有される 1つのルータが木の“中心”として識別される 参加するには エッジ(端)ルータはユニキャストの参加メッセージを 中心ルータ宛に送信する 参加メッセージは中間にあるルータによって“処理”さ れて中心ルータへ向けて転送される 参加メッセージはその木に属する枝(ルータ)にぶつか るか中心ルータに到着する 参加メッセージが通った道はその木の新しい枝となる 中心基準木: 例 R6が中心として選ばれたものとする: 説明 R1 R4 3 R2 グループメンバに 接続しているルータ 2 R5 R3 1 R6 R7 1 グループメンバに 接続していないルータ 参加メッセージが作成した 道順 インターネットマルチキャストルーティング: DVMRP DVMRP: 距離ベクトルマルチキャストルーティン グプロトコル、RFC1075 氾濫(flood)とプルーン: リバースパスフォワー ディング、始点基準木 DVMRPルータ間の通信により作られたDVMRP自身 のルーティングテーブルに基づくRPF木 no assumptions about underlying unicast RPFを通して至る所へあふれるマルチキャストグルー プへの最初のパケット routers not wanting group: send upstream prune msgs DVMRP: 続き… soft state: DVMRP router periodically (1 min.) “forgets” branches are pruned: mcast data again flows down unpruned branch downstream router: reprune or else continue to receive data routers can quickly regraft to tree following IGMP join at leaf odds and ends commonly implemented in commercial routers Mbone routing done using DVMRP Tunneling Q: How to connect “islands” of multicast routers in a “sea” of unicast routers? physical topology logical topology mcast datagram encapsulated inside “normal” (non-multicast- addressed) datagram normal IP datagram sent thru “tunnel” via regular IP unicast to receiving mcast router receiving mcast router unencapsulates to get mcast datagram PIM: Protocol Independent Multicast not dependent on any specific underlying unicast routing algorithm (works with all) two different multicast distribution scenarios : Dense: Sparse: group members # networks with group densely packed, in “close” proximity. bandwidth more plentiful members small wrt # interconnected networks group members “widely dispersed” bandwidth not plentiful Consequences of Sparse-Dense Dichotomy: Dense group membership by Sparse: no membership until routers assumed until routers explicitly join routers explicitly prune receiver- driven data-driven construction construction of mcast on mcast tree (e.g., RPF) tree (e.g., center-based) bandwidth and non bandwidth and non-groupgroup-router processing router processing profligate conservative PIM- Dense Mode flood-and-prune RPF, similar to DVMRP but underlying unicast protocol provides RPF info for incoming datagram less complicated (less efficient) downstream flood than DVMRP reduces reliance on underlying routing algorithm has protocol mechanism for router to detect it is a leaf-node router PIM - Sparse Mode center-based approach router sends join msg to rendezvous point (RP) router can switch to source-specific tree increased performance: less concentration, shorter paths R4 join intermediate routers update state and forward join after joining via RP, R1 R2 R3 join R5 join R6 all data multicast from rendezvous point R7 rendezvous point PIM - Sparse Mode sender(s): unicast data to RP, which distributes down RP-rooted tree RP can extend mcast tree upstream to source RP can send stop msg if no attached receivers “no one is listening!” R1 R4 join R2 R3 join R5 join R6 all data multicast from rendezvous point R7 rendezvous point Chapter 4 roadmap 4.1 Introduction and Network Service Models 4.2 Routing Principles 4.3 Hierarchical Routing 4.4 The Internet (IP) Protocol 4.5 Routing in the Internet 4.6 What’s Inside a Router? 4.7 IPv6 4.8 Multicast Routing 4.9 Mobility Network Layer 4-128 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-129 What is mobility? spectrum of mobility, from the network perspective: no mobility mobile user, using same access point high mobility mobile user, connecting/ disconnecting from network using DHCP. mobile user, passing through multiple access point while maintaining ongoing connections (like cell phone) Network Layer 4-130 Mobility: Vocabulary home network: permanent “home” of mobile (e.g., 128.119.40/24) Permanent address: address in home network, can always be used to reach mobile e.g., 128.119.40.186 home agent: entity that will perform mobility functions on behalf of mobile, when mobile is remote wide area network correspondent Network Layer 4-131 Mobility: more vocabulary Permanent address: remains constant (e.g., 128.119.40.186) visited network: network in which mobile currently resides (e.g., 79.129.13/24) Care-of-address: address in visited network. (e.g., 79,129.13.2) wide area network correspondent: wants to communicate with mobile home agent: entity in visited network that performs mobility functions on behalf of mobile. Network Layer 4-132 How do you contact a mobile friend: Consider friend frequently changing addresses, how do you find her? I wonder where Alice moved to? search all phone books? call her parents? expect her to let you know where he/she is? Network Layer 4-133 Mobility: approaches Let routing handle it: routers advertise permanent Let end-systems handle it: indirect routing: communication from address of mobile-nodes-in-residence via usual routing table exchange. routing tables indicate where each mobile located no changes to end-systems correspondent to mobile goes through home agent, then forwarded to remote direct routing: correspondent gets foreign address of mobile, sends directly to mobile Network Layer 4-134 Mobility: approaches Let routing handle it: routers advertise permanent let end-systems handle it: indirect routing: communication from not address of mobile-nodes-in-residence via usual scalable routing table exchange. to millions of routing tables indicate mobiles where each mobile located no changes to end-systems correspondent to mobile goes through home agent, then forwarded to remote direct routing: correspondent gets foreign address of mobile, sends directly to mobile Network Layer 4-135 Mobility: registration visited network home network 2 1 wide area network foreign agent contacts home agent home: “this mobile is resident in my network” mobile contacts foreign agent on entering visited network End result: Foreign agent knows about mobile Home agent knows location of mobile Network Layer 4-136 Mobility via Indirect Routing foreign agent receives packets, forwards to mobile home agent intercepts packets, forwards to foreign agent home network visited network 3 wide area network correspondent addresses packets using home address of mobile 1 2 4 mobile replies directly to correspondent Network Layer 4-137 Indirect Routing: comments Mobile uses two addresses: permanent address: used by correspondent (hence mobile location is transparent to correspondent) care-of-address: used by home agent to forward datagrams to mobile foreign agent functions may be done by mobile itself triangle routing: correspondent-home-networkmobile inefficient when correspondent, mobile are in same network Network Layer 4-138 Forwarding datagrams to remote mobile foreign-agent-to-mobile packet packet sent by home agent to foreign agent: a packet within a packet dest: 79.129.13.2 dest: 128.119.40.186 dest: 128.119.40.186 Permanent address: 128.119.40.186 dest: 128.119.40.186 Care-of address: 79.129.13.2 packet sent by correspondent Network Layer 4-139 Indirect Routing: moving between networks suppose mobile user moves to another network registers with new foreign agent new foreign agent registers with home agent home agent update care-of-address for mobile packets continue to be forwarded to mobile (but with new care-of-address) Mobility, changing foreign networks transparent: on going connections can be maintained! Network Layer 4-140 Mobility via Direct Routing correspondent forwards to foreign agent foreign agent receives packets, forwards to mobile home network 4 wide area network 2 correspondent requests, receives foreign address of mobile visited network 1 3 4 mobile replies directly to correspondent Network Layer 4-141 Mobility via Direct Routing: comments overcome triangle routing problem non-transparent to correspondent: correspondent must get care-of-address from home agent What happens if mobile changes networks? Network Layer 4-142 Mobile IP RFC 3220 has many features we’ve seen: home agents, foreign agents, foreign-agent registration, care-of-addresses, encapsulation (packet-within-a-packet) three components to standard: agent discovery registration with home agent indirect routing of datagrams Network Layer 4-143 Mobile IP: agent discovery agent advertisement: foreign/home agents advertise service by broadcasting ICMP messages (typefield = 9) 0 type = 9 24 checksum =9 code = 0 =9 H,F bits: home and/or foreign agent R bit: registration required 16 8 router address type = 16 length registration lifetime standard ICMP fields sequence # RBHFMGV reserved bits 0 or more care-ofaddresses mobility agent advertisement extension Network Layer 4-144 Mobile IP: registration example home agent HA: 128.119.40.7 foreign agent COA: 79.129.13.2 visited network: 79.129.13/24 ICMP agent adv. COA: 79.129.13.2 …. registration req. COA: 79.129.13.2 HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 9999 identification: 714 encapsulation format …. Mobile agent MA: 128.119.40.186 registration req. COA: 79.129.13.2 HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 9999 identification:714 …. registration reply time HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 4999 Identification: 714 encapsulation format …. registration reply HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 4999 Identification: 714 …. Network Layer 4-145 Network Layer: summary What we’ve covered: network layer services routing principles: link state and distance vector hierarchical routing IP Internet routing protocols RIP, OSPF, BGP what’s inside a router? IPv6 mobility Next stop: the Data link layer! Network Layer 4-146
© Copyright 2025 ExpyDoc