PowerQUICC/QorIQ 通信モジュール解説 QorIQプロセッサ・セミナ ~68K/PowerQUICCからの移行ソリューション~ Fumio Anekoji | Senior Technology Staff APR.22.2015 TM External Use Agenda • 通信プロセッサの変遷 • データ・パス・エンジンの変遷 • QUICC Engine (QE Lite /uQE )説明 • QUICC Engine搭載製品 (P1/T1/LS1) • DPAAアーキテクチャ概要 • Layerscape アーキテクチャ概要 • まとめ TM External Use 1 Over 20 Years of Communications Processing Evolution Dual-core processor AIM Alliance MPC8641D with e600 Power cores Started 1991 First silicon 1992 Dual-core with integrated content processing PowerPC® 603e MPC8572E with e500 Power core First PowerQUICC Embedded PowerPC core communications processors MC68302 68000 core Integrated Multiprotocol Processor (IMP) 1989 e500 Power core Includes Communications Processor Module (CPM) 1994 QUICC® PowerQUICC III 1995 1996 1997 MC68360 1998 2002 PowerQUICC II 68K core (CPU32+) QUad Integrated Communication Controller The First Generation Communication Processor Module (CPM) 2003 2004 2006 Security integration with PowerQUICC line 603e Power core PowerQUICC II Pro e300 Power core Power Architecture® Host Processors MPC7xxx e600 core TM External Use 2005 2 QUICC Engine Next-gen CPM / dual/quad RISC engines 2007 GPON processor Integrated DSP + Power core 68k core 通信プロセッサ IMP / QUICC IMP MC68302 QUICC MC68360 QUICC: QUad Integrated Communication Controller IMP: Integrated Multiprotocol Processor TM External Use 3 初代通信プロセッサ、68k プロセッサと 通信モジュールCPMを統合。 Power core 通信プロセッサ PowerQUICC PowerQUICC MPC860 初代PowerQUICC製品 QUICCのCPUコアをPower コアに変更 TM External Use 4 PowerQUICC II MPC8280 高速通信コントローラFCCを追加、 100Mbps Ethernet, 155Mbps ATMを サポート QUICC Engine搭載 通信プロセッサ PowerQUICC PowerQUICC II Pro MPC8360E 初代QUICC Engine(2RISC)搭載製品 Multi Protocol Interworking サポート TM External Use 5 PowerQUICC III MPC8569E 最高性能のQUICC Engine(4RISC)搭載、 究極のPowerQUICC製品(45nm) DPAA搭載 通信プロセッサ QorIQ / QorIQ Layerscape QorIQ P4080 DPAA QorIQ LS2085A DPAA2 w/AIOP 初代DPAA搭載製品、e500mc 8core 、 2系統の10GbE サポート TM External Use 6 初代Layerscape アーキテクチャ製品、 DPAA2/AIOPによるNetwork処理完全 オフロード、仮想化ネットワークに対応 QorIQ Layerscale データ・パス・エンジンの変遷 QorIQ T1, LS1 QUICC Engine QorIQ P1021/12 PowerQUICC III MPC8568/9 PowerQUICC II Pro MPC8360/58 MPC830x DSP MSC815x Multi Protocol DPAA2 (w/AIOP) LS2085A Interworking all-IP DPAA with AIOP C-prog. capability and L2 sw DPAA Interworking QoS Gb-Ethernet ATM/HDLC/TDM P1/P2/P3/ P4/P5/B4/ T1/T2/T4/ LS1 eTSEC CPM TSEC 100M Ethernet/ATM/HDLC/TDM QUICC PowerQUICC I, III, III MSC8101 DSP 10/100/1000M Ethernet PowerQUICC III TM External Use 7 QorIQ QorIQ P1,P2,LS1 PowerQUICC III PowerQUICC II Pro MSC913x 10/100/1000M Ethernet Tx,Rx QoS 10Gb/1Gb Ethernet Q-Mgr/Buffer-Mgr/QoS/Parser SEC, PME QUICC Engine (QE Lite / uQE ) TM External Use 8 CPM と QUICC Engine CPM (Communication Processor Module) QUICC Engine (MPC8280)CPM – 208MHz MPC8260 4 Timers Baud Rate Generators Parallel I/O 128 80 KK I-ROM Timer 32 8 KK I-RAM (MPC8360) 32 K 24 Dual Port RAM IMA µcode 32-bit RISC CP Serial DMAs & Serial DMAs 4 Virtual DMAs I2C SPI SMC2 MCC2 SMC1 MCC1 SCC4 SCC3 SCC2 SCC1 FCC3 FCC2 FCC1 MCC2 MCC1 32-bit RISC and Program ROM/RAM 2 GMII/ RGMII/TBI/RTBI USB • 最大 3ch の ファースト・イーサーネット・コントローラ • OC-3 (155Mbps)ATMコントローラ • OSI レイヤ2 プロトコル・エンジン 8 MII/ RMII SPI 8 TDM Ports SPI/MDIO 2 UTOPIA Ports UCC8 UCC6 UCC4 UCC2 MCC UCC7 UCC5 UPC124 UPC124 Time Slot Assigner Communication Interfaces Serial Interface 3 MII Ports Accelerators MultiUser RAM 32-bit RISC and Program ROM/RAM UCC3 Time Slot Assigner SDMAs Accelerators UCC1 TC-Layer 8 TDM Ports SLAVE I/F Baud Rate Generators Timers 2 UTOPIA/POS (124 MPHY) • 最大 8ch の ファースト・イーサーネット・コントローラ • 最大 2ch の ギガビット・イーサーネット・コントローラ • OC-12 (622Mbps) ATMコントローラ 性能/機能拡張 • OSI レイヤ2 および3 プロトコル・エンジン 互換性の維持 TM External Use 9 QUICC Engine の特徴 TM External Use 10 QE Lite (P1021/12, P1025/16) Key Features • One 32-bit RISC • Four UCCs available-UCC1, UCC3, UCC5, UCC7 • UCC1 supports RMII, MII (10/100 Mbps Ethernet) • UCC5 supports RMII (10/100 Mbps Ethernet) • HDLC and Transparent controllers up to 50 Mbps full-duplex; HDLC bus up to 10 Mbps • ATM SAR up to 155 Mbps (OC-3) full duplex • One UPC (UTOPIA L2) • Up to four TDM ports (TDMA/B/C/D) • UMCC (256ch of HDLC/Transparent per UCC) • One SPI • A bank of 18 external clocks: CLK1, CLK[3-16],CLK[19-21] • Nine supported BRGs: BRG[1-2] and BRG[5-11] • IEEE 1588v2 standard hardware support applies RAM microcode configurations offered for the device SAM : Serial ATM microcode IMA : Inverse multiplexing for ATM 注:製品ごとの詳細情報は、各リファレンスマニュアルをご参照ください。 TM External Use 11 uQE (T1040/42/20/22/24/14, LS1021/20/22) Key Features • One 32-bit RISC • Two UCCs available-UCC1, UCC3 • Ethernet and ATM are not supported. • HDLC and Transparent controllers up to 50 Mbps full-duplex; HDLC bus up to 10 Mbps • Up to Two TDM ports (TDMA/B) • UMCC (256ch of HDLC/Transparent per UCC) • A bank of 5 external clocks CLK[8-12] • Two internal clocks CLK[3,15] • Four supported BRGs: BRG[1-4] 注:製品ごとの詳細情報は、各リファレンスマニュアルをご参照ください。 TM External Use 12 QE Lite / uQE SI Block Diagram Total of 512 routing entries for receive and transmit each. Total of 256 routing entries + 256 shadow routing entries for receive and transmit each. Enabling Connections to the TSA QE Lite only TM External Use 13 QE Lite / uQE Bank of Clocks QE Lite: BRG1,2, 5-11 BRGO1,2, 5-11 CLK1, 3~16,19~21 UCC1,3,5,7 UPC1 TDMA1,B1,C1,D1 uQE: BRG1~4 BRGO1~4 CLK3,8~12,15 UCC1,3 TDMA1,B1 QE Lite only TM External Use 14 CPM/QE 通信チャンネル / インタフェース 比較 Protocol / Interface 68k IMP/QUICC CP/CPM0 PowerQUICC I CPM1 PowerQUICC II,III CPM2 PQ2pro/PQ3 QUICC Engine QorIQ P1 QE Lite QorIQ T1/LS1 uQE Ethernet, HDLC, ATM -- -- FCC1~3 (~100MbE, 155Mbps ATM) SCC1~4 UCC1~8 (~1GbE 622Mbps ATM) UCC1,3,5,7 (~100MbE, 155Mbps ATM) UCC1,3 (HDLC only) HDLC, UART, 10MbE* SCC1~3/ SCC1~4 SCC1~4 UART SMC1,2 SMC1,2 SMC1,2 [UART] [UART] [UART] Multi-Ch HDLC -- / QMC(4ch) QMC(4ch) MCC1,2 (128ch) MCC1/1,2 (256ch) UMCC (256ch) UMCC (256ch) SPI SCP/SPI SPI SPI SPI1,2 SPI1 [SPI] I2 C -- I2 C I2 C [I2C] [I2C] [I2C] TDM TSA (1/2 x TDM) TSA (8 x TDM) TSA (8 x TDM) TSA (8/16 x TDM) TSA (4 x TDM) TSA (2 x TDM) UTOPIA -- UTOPIA UTOPIA UPC1,2 UPC1 -- Ethernet I/F -- / AUI MII MII/RMII MII/RMII/GMII/RMII/ TBI/RTBI, SGMII MII/RMII -- Ethernet MAC Module 10MbE MAC {68EN302} FEC (MII) (10/100MbE) TSEC (~1GMbE) {PQ3} eTSEC (~1GbE) VeTSEC (~1GbE) VeTSEC(~1GbE) DPAA (~10GbE) Ethernet MAC Interface AUI MII MII/GMII/RGMII TBI/RTBI MII/RMII/GMII/ RGMII/RTBI/TBI MII/RMII/GMII/ RGMII/RTBI/TBI SGMII MII/RMII/GMII/ RGMII/RTBI/TBI SGMII/QSGMII/ XFI * : 10MbEは、CPM/SCCのみ [ ]: QE外部のモジュール 注:本表は、各通信モジュールの最大値を掲載しています。 製品ごとの詳細情報は、各リファレンスマニュアルをご参照ください。 TM External Use 15 QUICC Engine 搭載製品 (LS1,T1,P1) TM External Use 16 QorIQ Tシリーズ: 業界随一のスケーラブル・ソリューション Core Network Cloud Networking Wireless スケーラビリティ 性能 統合性 24 Virtual Cores up to 1.8GHz T4240 16 Virtual Cores up to 1.8GHz T4160 8 Virtual Cores up to 1.67GHz Enterprise Campus Line Cards T4080 Eight Virtual Cores up to 1.8GHz Quad-Core up to 1.4GHz Integrated GE Switch Branch Office Industrial Quad-Core up to 1.4GHz - Dual-Core up to 1.4GHz - Integrated GE Switch Dual-Core up to 1.4GHz T1020 Lowest $/W T1022 T1014 uQE uQE T1024 uQE TM 17 T2080 ピン互換ソリューション T1040 uQE T1042 uQE • シングルコア から 8仮想コア • <4W から <20W • 2Gbps から 20Gbps の性能 業界で最もスケーラブルな ピン互換ソリューション uQE External Use T2081 3倍の性能レンジを 1プラットフォームで ARM®ベースのQorIQポートフォリオ スケーラビリティ 性能 ARMv8 (64bit) 統合性 LS1022A LS2085A Cortex-A57 Quad-core 2.0GHz Cortex-A53 Quad-core 1.5GHz ARMv7 (32bit) Cortex-A7 Dual-core 600MHz <2W Cortex-A57 Octal-core 2.0GHz Cortex-A53 Dual-core 1.5GHz Cortex-A7 Dual-core 1GHz, <3W Cortex-A9 Dual-core 1.2GHz LS2045A LS1043A uQE LS1023A uQE ピン互換ソリューション LS1024A LS1020A LS1021A 2014年5月、MACOM社より旧Mindspeed社 Comcerto通信プロセッサ・ファミリを買収 LS1024A = C2000 uQE uQE TM External Use 18 Power & ARM: 市場ニーズに応じたコア戦略 Power – 引き続きコア・ビジネスを牽引 有線/無線ネットワーク市場で#1* 2. WLANベンダの上位10社中9社が使用 3. 30年以上のR&Dリーダーシップ 1. ARMの追加 – マーケット・リーチを拡大 64-bit ARMベースのネットワークSoC 2. Ethernetの採用が増加(車載/民生/産業) 1. 3. フリースケールのネットワークに関する専 門知識を活用 AND フリースケールはPower製品とARM製品の両方に投資 TM External Use 19 *: Source: Gartner, Apr 2014, Market Share: Semiconductor Applications, Worldwide, 2013, “Total Microprocessor Embedded in Wired + Wireless Communications” (excludes DSP) uQE 業界で最も高性能な、GbEスイッチ搭載マルチコア・プロセッサ TM External Use 20 uQE このクラスで初の10GbE搭載、仮想CPEやWLAN AP等の スマートエッジ・アプリケーションに最高のCPU性能を提供 TM External Use 21 QorIQ P1012/16 and P1021/25 Block Diagram QE Lite QUICC Engine (QE Lite) 搭載 P1製品、ATM, Ethernet, TDM をサポート TM External Use 22 LS1023A: 2コア製品 10GbE搭載、仮想CPEやWLAN AP等の スマートエッジ・アプリケーションに最高のCPU性能を提供 QorIQ T1024/14と共通アーキテクチャ TM External Use 23 コア コア周波数 セキュリティ DDR 4 USB 3.0 LCDサポート LS1021A 2 最大1GHz 4レーン SEC 5.4 対応 対応 対応 LS1020A 2 最大1GHz 4レーン SEC 5.4 対応 対応 非対応 LS1022A 2 最大600MHz 1レーン なし 非対応 非対応 TM External Use SerDes 24 非対応 TDM搭載 QorIQ P1製品 (P1020/11,24/15,P1022/13,P1010/14) (小型PKG P1025/16ピン互換) (P1021/12等とピン互換) (低消費電力P1020/11等とピン互換) /15 (シングルコアに最適化) TDMモジュールの主な特徴 • DSP製品で実績のあるTDM モジュール • 最大128 time slots • ワード長切り替え(8 /16 bitモード) • MSB/LSB first 切り替え • A-law/μ-law H/W変換機能(8bitモード) TM External Use 25 QE/(TDM)搭載製品 LS1043/23 LS1021/20 A53,64b A7,32b 1.0 ~ 1.4GHz 1.2 ~1.5GHz 800MHz ~1GHz 256KB BS 256KB BS 1MB shared 256KB 256KB 256KB DDR 64b,DDR3L/4 ~1600MT/s 64b,DDR3L/4 ~1600MT/s QE Type uQE(2UCC) QE Ethernet T1040/20 T1042/22 T1024/14 P1020/11 P1024/15 P1010/14 e5500, 64b e5500, 64b e5500, 64b e500V2,32b e500V2,32b Frequency 1.2 ~ 1.4GHz 1.2 ~ 1.4GHz 533~800MHz 400~533MHz 533~800MHz 400~533MHz 533MHz – 1.0GHz L2 Cache 256KB BS 256kB shared 256KB shared 256KB shared 256KB shared PF Cache NA NA NA NA NA 64b,DDR3L/4 ~1600MT/s 32b,DDR3L/4 ~1600MT/s 32b,DDR3L/4 32b, DDR2/3 ~667MT/s 32/16bDDR3/3L ~800MT/s uQE(2UCC) uQE(2UCC) uQE(2UCC) uQE(2UCC) QELite(4UCC) NA NA No No No No No ~100Mbps x2 NA NA ATM No No No No No ~155Mbps x1 NA NA HDLC,UART Yes Yes Yes Yes Yes Yes NA NA TDM ports 2 2 2 2 2 4 1 1 Other Accelerator DPAA, SEC5, PME2 DPAA, SEC5, PME2 DPAA, SEC5 DPAA, SEC5 VeTSEC x3, SEC5 VeTSEC x 3, SEC3 VeTSEC x 3, SEC3 VeTSEC x3, SEC4 Ether-Ports 4xG+8G L2sw 5xGbE 1x1/10G+3xG 1x1/10G+5xG 3xGbE 3xGbE 3xGbE 3xGbE Interfaces 3xPCIe2, 2xSATA2, USB2 2x DUART 3xPCIe2, 2xSATA2, USB2 2x DUART 3xPCIe2, 2xSATA2, 2xUSB2 w/Φ 2x DUART 3xPCIe2, 1xSATA2, 3xUSB2 2x DUART 2xPCIe2 2xPCIe2 2xUSB2 1x DUART 2xUSB2 1x DUART 2xPCIe2 2xSATA2 USB2 w/PHY 2x DUART 4xI2C, SPI 4xI2C, SPI 4xI2C, SPI 2xI2C, SPI 2xPCIe2, 1xSATA2, USB3 w/PHY 2x DUART 6x LP UART 3xI2C, 2xSPI 2xI2C, SPI 2xI2C, SPI 2xI2C, SPI x8, 5GHz x8, 5GHz x4, 10GHz x4, 10GHz x4, 6GHz x4, 2.5GHz x4, 2.5GHz x4, 10GHz Cores SerDes TM BS: Back Side cache 26 External Use P1021/12 P1025/16 e500V2,32b 32b, DDR2/3 ~667MT/s LP UART: Low Power UART eTSEC / VeTSEC TM External Use 27 eTSEC / VeTSEC VeTSEC (eTSEC V2) ・仮想化対応eTSEC ・キュー/コア分配用にハッシュ回路追加 ・BDリングを2つのグループに分割し、割り込み発生 ・Rx,Txキュー割り込みを独立してコアに割り付け ・メモリマップ変更 TM External Use 28 受信バッファ構造 最大8つの受信バッファ・キュー(リング) デフォルトではキュー0のみ有効(TSEC互換モード) ► RCTRL[FILREN]をセットするとファイラ(Filer)がイネーブルとなり、複数の受信キューへの仕分け可能 ► 使用する受信キューは個別にイネーブル(RQUEUE[EN0,EN1,‥,EN7]) ► 各キューのRxBDテーブルのベースアドレスレジスタ(RBASEn)も要初期化 キュー内の各バッファは対応するRxBD(受信バッファ・ディスクリプタ)で管理される eTSECの受信バッファ、RxBD共へのアクセスはキャッシュ・スヌープ可能 eTSEC RxBD ローカル・メモリ RxBD Table Pointer (RBASEn) RxBDs リングn RxBDテーブル Status & Control Data Length Rx Buffer Pointer リングn 受信バッファ CPM/FCC TM External Use 29 QE/UCC (UEC) 送信バッファ構造 最大8つの送信バッファ・キュー(リング) デフォルトではキュー0のみ有効(TSEC互換モード) ► TCTRL[TXSCHED]=01 or 10でキュー0以外も使用可能 ► 使用する受信キューは個別にイネーブル(TQUEUE[EN0,EN1,‥,EN7]) ► 各キューのTxBDテーブルのベースアドレスレジスタ(TBASEn)も要初期化 キュー内の各バッファは対応するTxBD(受信バッファ・ディスクリプタ)で管理される eTSECの送信バッファ、TxBD共へのアクセスはキャッシュ・スヌープ可能 eTSEC TxBD ローカル・メモリ TxBD Table Pointer (TBASEn) TxBDs リングn TxBDテーブル Status & Control Data Length Tx Buffer Pointer リングn 送信バッファ CPM/FCC TM External Use 30 QE/UCC (UEC) 送信スケジューラ TCTRL[TXSCHED]の設定により、送信スケジューラの動作モードを選択できます。 シングル・ポール・リング・モード優先順位モード • 設定:TCTRL[TXSCHED]=01 (TSEC互換モード) • 送信すべきパケットがあるQueueの •設定:TCTRL[TXSCHED]=00 中で、常に最も高優先(弱番)の •Queue#0のみから送信。 キューから送信 Queue#0 優先順位 高 Queue#0 Queue#1 Queue#1 Queue#2 Queue#2 モディファイド・ウェイテッド・ラウンドロビ ン・モード • 設定:TCTRL[TXSCHED]=10 • キュー#0に送信データが無いときは、キュー#1 ~#7から順に送信 • キュー毎に比重(WT)を設定 Queue#0 常に最優先 Queue#1 WT=1 Queue#2 Queue#7 Queue#3 Queue#3 WT=100 WT=254 Queue#3 WT=50 Queue#6 Queue#6 Queue#6 WT=1 Queue#4 Queue#5 優先順位 Queue#7 TM External Use 31 低 Queue#7 WT=40 WT=0 eTSEC:8つの物理キューのコアへの割り付け TM External Use 32 VeTSEC:8つの物理キューのコアへの割り付け(例) TM External Use 33 ・eTSEC ではひとつの共通レジスタ ブロック(4kB)を全てのコアで使う。 eTSEC eTSEC と VeTSEC のMemory Map ・管理用の別の4kBブロックは全ての コアで共通に使います。 TM External Use 34 Core 0 Core 1 4k Block Group 0 VeTSEC ・VeTSECでは、Ethernet トラフィックを2つのグループに 分けられます。 ・各グループ用の独立した4kBブロック 状態/制御レジスタがあり、各コアに 割りつけることができます。 4k Block 4k Block for MDIO 4k Block Group 1 Core 0 Core 1 DPAA アーキテクチャ概要 TM External Use 35 データパス・アクセラレーション・アーキテクチャ (DPAA) D$ I$ I$ I$ e500mc D$ I$D$e500mc D$ I$D$ I$ e500mc D$ e500mc I$ e500mc D$ D$ I$ e500mc I$ L2$ D$ I$ Core L2$ D$ I$ e500mc Core L2$ D$ I$ e500mc Core L2$ D$ Core I$ L2$ D$ I$ Core L2$ D$ Core I$ D$ I$ Core L2$ L2$ D$ Core I$ D$ D$ D$ I$ I$ D$ I$D$ I$ I$ D$ D$ D$ I$ I$ CoreNet™ Coherency Fabric SEC 4 Queue Manager Frame Manager 1GE 1GE 10GE 1GE 1GE PME 2 Buffer Mgr Frame Manager 1GE 1GE 10GE 1GE 1GE 18 Lanes SERDES TM External Use 36 DPAAキュー/バッファ管理システム TM External Use 37 BDリング vs DPAA DPAAは、従来のBDリ ング方式を置き換える もの: Core • Eth 複数コアがロックレス でキューへ出し入れが 可能 • キューを複数コアで共 有 • バッファ管理とキュー 管理を分離 Core Core Core Queue Manager TM External Use 38 Buffer Manager コア(スレッド)毎に キューへのアクセス用イ ンターフェイスを持つ 他ブロックとの干渉なし Network I/O Eth Eth Eth BDリングはメモリ上 に構築されたデータ ストラクチャ コアはBDリングのポ インタ管理を行う Core FMan(フレーム・マネージャ) To QMan CoreNet Frame Manager (FMan) DMA QMI Policer Keygen Buffer Memory (Distribution) Parser Classifier To BMan BMI 10GE TM External Use 39 GE GE GE GE DPAAのフレーム管理構造 Buffer: 連続領域をs/wによりBManが割振り、決められたサイズの断片をBManが管理。 • Frame: Bufferに保持されたデータ(通常パケット) • − Framesは単一バッファまたは複数バッファに格納される(scatter/gather listsで管理)。 • Frame Descriptor (FD):フレームに対するバッファアドレス又はscatter/gather listによ りフレームを指定する情報 • Frame Queue: − − • Frame DescriptorのFIFOキュー キューの操作はQManが行う Frame Queue Descriptor (FQD): Frame Queuesを管理する FQD FD FD FD FD FD Buffer Buffer FD Ethernet Frame Buffer Buffer PreDest Src Type Data amble addr addr TM External Use 40 CRC 2レベルのキュー WQ1 FQ FQ WQ2 FQ FQ WQ3 FQ FQ WQ4 FQ FQ WQ5 FQ FQ WQ6 FQ FQ WQ7 FQ FQ FD Portal FQ FQ Channel WQ0 フレーム・ディスクリプタ(FD)は、フレーム・ キュー(FQ)に入れられる − FQはFDの順序リスト − QManでの順序制御は、1FQ内で行われる • FQはワーク・キュー (WQ)に入れられる − WQはFQの順序リスト − 1WQ内のFQはすべて同プライオリティ • チャネル: − SoC内各ブロック(コア、アクセラレータ、 Network I/O)は自宛てチャネルを持つ − 1つのチャネルは8つのWQから成り、各WQは 相対プライオリティを持つ − デキュー・スケジューリングはチャネル内WQ プライオリティ、スケジューラ・スキームにて デキュー順が決定 • ポータル: − 各ブロックがQManへアクセスする為のイン ターフェイス − ポータルは、 QManとデータの受け渡しを行う 為のQMan内 “データ・ストラクチャ” FD FQ 順序制御が必要な フレーム(FD)は1つ のFQへ入れる Buffer Buffer • User memory QMan data structures TM External Use 41 QorIQ -- Multi Core and Offload architecture Frame Queue Frame Queue Frame Queue Frame Queue Frame Queue Frame Queue Frame Queue Queue Queue Dedicated Channel Core7 Frame Queue Dedicated Channel Data Path Acceleration Architecture PCD Port1 TM External Use 42 Frame Queue Port2 Port3 Frame Queue Frame Queue Dedicated Channel Frame Manager Port4 Core8 Frame Queue Queue Frame Queue Dedicated Channel Queue Pool Channel Queue Pool Channel Core3 Core4 Core5 Core6 Queue Core1 Core2 Pseudo Real Time Traffic Dedicated Channel Frame Queue Queue General Data Plane Traffic Queue Control Plane Traffic Dedicated Channel Layerscape アーキテクチャ概要 TM External Use 43 Layerscape Architectureの特徴 Layerscapeアーキテクチャは、データパス・アクセラレーション・アーキテクチャ (DPAA) の進化形 • モジュラー型ハードウェア・フレームワーク General-Purpose Processing Layer (GPPL) GPPL: 汎用ソフトウェア処理 − APPL: パケット・オフロード処理 − EPIL: ワイヤレートI/Oスイッチング • CPUコアに依存しない(Core-agnostic) SoCプラットフォーム (Power Architectureコア or ARMコア) • • APPLはGPPLから自立し、C言語による フル・プログラミングが可能 コアの違いを吸収する一貫したソフトウェ アAPI/ライブラリ System Visualization (Debug/Tuning) 各レイヤは個別に拡張可能 System Control • System Interfaces − CPU(s) Accelerated Packet Processing Layer (APPL) Decomp Engine Security Engine Load Balance Engine Pattern Match Engine External Use 44 L2-L7 Switch Engine Packet Buffer Accelerated Packet Processor Express Packet I/O Layer (EPIL) Ethernet Interlaken 100/40/10/1G RapidIO SERDES アプリケーションに最適な組み合わせを可能にするプラットフォーム TM Mem. Cont. Caches PCI-Express QorIQ LS2085A/LS2045A – 特徴 • 高性能コアと広帯域メモリ • 8x ARM Cortex-A57 cores, 2.0GHz, 4MB L2 cache, w/Neon SIMD • 1MB L3 platform cache w/ECC • 2x 64b DDR4 up to 2.4GT/s • ソフトウェア開発を考慮した高性能 データパス設計 • 40Gbps パケット処理性能 • Management complex により機能の 初期化及び管理を提供 • 高速ネットワーク I/O • 8x1/10GbE + 8x1G, MACSec ~4x 1/10GbE • DPAA2 w/AIOP SDN/NFV Switching Data Center Wireless Access QorIQ LS2085A : 8コア QorIQ LS2045A : 4コア TM External Use 20Gbps アクセラレータ性能(暗号化, パターンマッチ, データ圧縮) 45 • 内蔵L2 スイッチ機能 • 4x PCIe Gen3, 1x SR-IOVサポート • 2 x SATA 3.0, 2 x USB 3.0 w/PHY Layerscape I/O 仮想化/ リソース管理 – Layerscape Object 抽象化 KVM Guest Container Std User Space Application Application driver Application Application driver Application driver net stack skt skt skt Management Complex: 抽象化されたH/W機能 “Layerscape Object” を構成する。 driver net stack Host Kernel driver Packet Engine (AIOP) NIC NIC NIC NIC NIC Accelerators BMan QMan L2 Switch Packet Express Buffer WRIOP Network LS ObjectsによるH/W 仮想スイッチと仮想NIC: 上位タスクに対 して、H/Wリソースのカプセル化を行う。 NIC: Network Interface Card TM External Use 46 MAC MAC MAC Network MAC Mgmt Complex-- H/Wリソースから機能を構成する L2 Switchの例 WRIOP IFP L2 Sw Assist QMan port MAC SW portal Addr Learn TLU channel BMan FQ WQ Bpool shaper Cong Note “Mgmt Complex” は個々の H/Wリソースを組合わせ、 抽象化されたH/W機能 “Object”を構成する。 L2 Switch Runtime View – Management Complex and Framework Objects GPPs API API Object discover Initial Object Set API API Object create destroy API API Object Manage Mgmt Complex Boot time TM External Use 47 API API Object use AIOPs API Object use Layerscapeのプログラミング • • • • GPPは汎用OS(Linuxなど)を走らせ、C言語やその他の言語でプログラムします。 フリースケールは、機能と多くのAPIを提供します。 AIOPは、C言語で記述できます。 フリースケールは、実用的なソフトフェアを提供します。 C-Programmable GPP - 汎用OS - API (フリースケール及びOS提供) - ドライバ経由で機能を使用 NIC NIC Cmd Object NIC AIOP アプリケーション AIOP サービスレイヤ Network TM External Use 48 • AIOP は、アクセラレータを内蔵しています。 (テーブ ルルックアップ、オーダリング制御、タイマ、フレーム 処理、統計処理、など) • APIコールによりアクセラレータを簡単にアクセスで きます。 • サービスレイヤはOSの役割をしますが、AIOPのス ケジュラはハードウェアで、汎用OSが走っているわ けではありません。 通信プロセッサ アーキテクチャの進化 CPM QUICC Engine QUICC/PowerQUICC (MC68302/MC68360~MPC8569) DPAA Layerscape QorIQ (P4080~T4240) QorIQ LayreScape (LS2085A~) PA Cores (Linux) PA/ARM Cores (Linux) Application 68k/PA Core Application Network処理 + Networking (RTOS) PA Cores (USDPAA) AIOP (C-prog) SEC SEC,PME,DCE SEC,PME,DCE Multi-RISC cores (uCode) Queue Mgr Queue Mgr Buffer Mgr Buffer Mgr Frame Mgr WRIOP L2 switch Accelerator Engines Queue/Buffer 管理 Frame操作 IO I/F SCC/FCC/UCC DPAA: Data Path Acceleration Architecture USDPAA: User Space DPAA AIOP: Advanced I/O Processor WRIOP :Wire Rate I/O Processor TM External Use 49 GPPL APPL EPIL まとめ • 最新のQorIQ製品においても、レガシー・プロトコル (HDLC, ATM)をサポートしています。 • Power コアに加えARM コアも選択可能。 • シングルコアからマルチコアまでの豊富な製品から選 択可能。 • レガシー製品の互換性を保ちつつ、最新のインタ フェース、仮想化のサポートを備えています。 TM External Use 50 TM www.Freescale.com © 2015 Freescale Semiconductor, Inc. | External Use
© Copyright 2024 ExpyDoc