2005年10月6日 計算機論理設計 (A) (Computer Logic Design (A)) 東京工業大学 大学院理工学研究科 電子物理工学専攻 松澤 昭 2005, 10/06 計算機論理設計 A.Matsuzawa 1 目的・成績評価方法など • 開講学期4学期単位数2-0-0担当教官松澤 昭 教授 :S3棟312号室(内線2508) • 【講義の目的】 計算機のハードウエアの概要を講義する.特に,その中心となるプロセッサの機能 や主 要部分の論理設計について学習する. 【教科書・参考書等】 「論理回路と計算機ハードウェア」 原田豊著 丸善 【関連科目・履修の条件等】 論理回路理論 (A) 【成績評価】 授業出席(宿題提出)、中間試験,期末試験 【担当教官からの一言】 プロセッサの仕組みを理解することは,コンピュータのみならず、情報家電を含む全ての電 子機器の理解や設計上重要である. 【オフィスアワー】 メールでアポイントを取っていただければ、空いている時間をお知らせします。 [email protected]科目一覧へ 2005, 10/06 計算機論理設計 A.Matsuzawa 2 講義予定 • • • • • • • • • • • • 計算機工学(プロセッサ)・集積回路技術と現代の電子機器 データ表示と数値演算 論理回路の基本 順序回路 フリップ・フロップ 加減算回路 乗除算回路 制御回路 命令セットと命令実行 メモリーシステム パイプライン制御 DSP 2005, 10/06 計算機論理設計 A.Matsuzawa 3 講義聴講のポイント • 現在のエレクトロニクスの中心技術であるコン ピュータに用いられる論理回路設計技術を学ぶ。 • 論理回路の基礎、加算減算、乗除算、ALU 命令と制御、メモリー管理などのコンピュータ(プロ セッサー)の動作原理を学ぶ。 • 基本的に教科書を用いるが、解説プリントを配布す る。 2005, 10/06 計算機論理設計 A.Matsuzawa 4 計算機工学(プロセッサ)・集積回路技術 と現代の電子機器 2005, 10/06 計算機論理設計 A.Matsuzawa 5 まずはコンピュータを分解してみよう! 出力装置: CRT コンピュータ本体 出力装置: スピーカー 入力装置: キーボード 2005, 10/06 入力装置: マウス 計算機論理設計 A.Matsuzawa 6 マザーボード 2005, 10/06 計算機論理設計 A.Matsuzawa 7 マザーボードの上には… • 多数のLSI (Large-Scale Integrated Circuit:大規模集積回路,チップ) – プロセッサ(MPU:Micro Processing Unit,マイクロプロ セッサ) – メモリ:SRAM(Static RAM),DRAM(Dynamic RAM), ROM,… – 各種ASIC(Application-Specific IC)論理回路 – アナログ・デジタル混載LSI • その他の電子部品 2005, 10/06 計算機論理設計 A.Matsuzawa 8 パッケージの中身は?: Pentium II Xeon Processor Extended Server Memory Architecture 0.25u P6 Micro-architecture; Dynamic Execution 400 MHz L2 Cache Bus, Large Caches N-Way Multiprocessing System Management Features 2005, 10/06 100 MHz Multi-transaction System Bus 計算機論理設計 A.Matsuzawa 9 パッケージ:Intel MMX Pentium 2005, 10/06 計算機論理設計 A.Matsuzawa 10 Intel Pentium IIIチップ • 0.18 micron 6-layer metal CMOS process technology • 28.1M transistors • 106 mm die size • 3-way superscalar out-oforder execution microarchitecture • 256K Level 2 Cache • 133 MHz IO bus 2005, 10/06 計算機論理設計 A.Matsuzawa 11 マイクロプロセッサー マイクロプロセッサーの処理では命令がメモリーから読み出されALUの論理機能を変える。 次にデータがメモリーから読み出され、ALUで論理処理されて、メモリーに返される。 特徴 課題 2005, 10/06 ・ソフトを変えることで殆ど全ての論理処理が実現できる ・ハードは機能・用途にかかわらず共通である ・クロックに同期して動作し、基本的に1クロックで1処理行う ・メモリーからデータを読み出し、処理し、メモリーに返す ・処理速度を上げるにはクロック周波数を上げる必要がある ・データが負荷容量の大きなバスを通る 計算機論理設計 A.Matsuzawa 12 プロセッサーにおけるデータの流れ プロセッサーはメモリーからデータをレジスタに読み込み演算器(ALU)で加減乗除 などの演算を行い、演算データをメモリーに格納するのが基本動作である。 t1: メモリーの10番地の内容をレジスタAに格納する t2:メモリーの11番地の内容をレジスタBに格納する t3:レジスタAの内容とレジスタBの内容を加算してメモリの20番地に格納する t1 : A ← M [ 10 ] レジスタ t 2 : B ← M [ 11] t 3 : M [ 20 ] ← A + B 演算器の機能 ・加算 ・減算 ・左右のシフト(乗除算に用いられる) など 2005, 10/06 計算機論理設計 A.Matsuzawa 13 コントロールとデータの流れ プログラムカウンターが回ることでメ モリーよりプログラムが命令レジスタ に読み出される。 命令はデコード回路で解読され必要 なブロックを制御する。 特に重要な制御が演算器(ALU)の 機能やレジスタの転送を制御すること である。 デコーダー 制御信号 制御信号 2005, 10/06 データの格納場所を表すオペランド 部は斜線の部分の信号としてメモリの データの格納場所を指示するために アドレスレジスタに送られる。 計算機論理設計 A.Matsuzawa 14 情報メディアの伝送速度とデジタル技術 デジタル映像は何度再生しても画質が劣化しないが、データ量が多く、 データを圧縮しないと電話回線やインターネット・携帯電話で情報を送れない。 1.2Gbps 1Gbps 100Mbps 100Mbps 1/40 30Mbps 原信号 圧縮後 1/25 10Mbps 1/20 1.4Mbps 1/5.5 4Mbps 1.5Mbps 64Kbps 1/4 256Kbps 1Mbps 100Kbps 10Kbps 30Mbps どこでも誰でも、高品質な 音楽、TV、ビデオを楽しめる。 NT TV テ レ ビ HD SC オ デ ビ CD 楽 音 電 話 16Kbps 2005, 10/06 計算機論理設計 A.Matsuzawa 15 デジタル技術を用いた画像の圧縮 DCT (Discrete Cosine Transform) デジタルTV, DVDなどのデジタルAVシステムにおいて画像信号の圧縮に使用される。 画像の空間周波数成分を求めて、人間の目に鈍感な高 空間周波数信号の分解能を減衰させることで情報圧縮 が図れる。 低空間周波数信号:人間の目に敏感 DCT変換 高空間周波数信号 目には鈍感→間引く 入力信号 2005, 10/06 計算機論理設計 A.Matsuzawa 16 DCT演算 DCT (Discrete Cosine Transform)は画像の圧縮・伸張に用いられるマルチ メディアの基本処理だが1画素につき64回もの積和演算が必要である。 7 7 1 u( 2i + 1)π v ( 2 j + 1)π f ( u, v ) = c( u)c( v )∑ ∑ x ( i, j ) cos cos 8 16 16 i=0 j =0 空間周波数 領域での信号 実際の画面 の輝度信号 画像の位置 空間周波数での位置 低周波 i:横方向 U:横方向 u = 0,1, 2,・・・, 7 低周波 c( 0 ) = 1 c( w ) = 2 w≠0 高周波 実際の画面 の輝度信号 2005, 10/06 v = 0,1, 2,・・・, 7 V:縦方向 J:縦方向 空間周波数変換 DCT 高周波 空間周波数 領域での信号 計算機論理設計 A.Matsuzawa 17 1次元DCTのデジタル回路による演算 • 汎用プロセッサ・DSPでのソフトエア処理 加算、減算、積和命令を利用 これからALU, 乗算器, 加算器などを学んでゆく レジスタファイル t0=x0+x7; t1=x1+x6; t2=x2+x5; t3=x3+x4; t4=x0-x7; t5=x1-x6; t6=x2-x5; t7=x3-x4; f0 f2 f4 f6 = t0+ t1+ t2+ t3; = c2*t0+c6*t1+c6*t2-c2*t3; = t0t1t2+ t3; = c6*t0-c2*t1+c2*t2+c6*t3; f1 f3 f5 f7 = = = = 2005, 10/06 c1*t4+c3*t5+c5*t6+c7*t7; c3*t4-c7*t5-c1*t6-c5*t7; c5*t4-c1*t5+c7*t6+c3*t7; c7*t4-c5*t5+c3*t6-c1*t7; 計算機論理設計 A.Matsuzawa ALU X (乗算器) + (加算器) アキュムレータ 18 デジタル画像処理に必要な演算数 今仮に縦1000画素、横2000画素とすると1フレームに200万画素、 RGBを考えると600万画素相当 1秒間に60フレームでは1秒間の画素数は36000万画素。 1画素あたり64回の演算が必要とすると、 GOPS: Giga Operation Per Sec 現在のパソコンでは 6GOPS程度 10年前では200MOPS 20年前では10MOPS 23GOPSの演算 とてつもなく高速なデジタル演算が必要 1000画素 1フレーム 60枚/秒 2005, 10/06 2000画素 計算機論理設計 A.Matsuzawa 19 0.01 2005, 10/06 計算機論理設計 A.Matsuzawa Real time 3D Graphics Video 3D Graphics 1 HDTV Encoder Audio MPEG-1 Encoder MPEG-2 Decoder MPEG-2 Encoder HDTV Decoder MPEG-1 Decoder TV-Conference Sound Voice Recognition 10,000 FAX/Modem Performance (GOPS) メディアプロセッサーの処理能力 メディアプロセッサーは汎用プロセッサーの1桁以上上の処理能力が求められる。 Virtual Reality 1000 100 10 Pentium III 0. 1 20 集積回路技術 2005, 10/06 計算機論理設計 A.Matsuzawa 21 LSIの製造手順 直径 8inch(200mm) マスク 輪切り 厚さ約0.5mm(500μm) シリコン 単結晶 フォトリソグラフィ 等のプロセス 鏡面ウエハ カット 完成品 2005, 10/06 チップ 2章 計算機論理設計 A.Matsuzawa 完成ウエハ 22 MOS トランジスタ 半導体に薄い酸化膜を付け、金属ゲートで挟んでやると容量ができる。 金属ゲートと半導体間に電圧をかけると静電誘導作用で電荷が発生し、 電流が流れる。 電圧が高い場合を[1] 電圧が低い場合を[0]とするとデジタル回路ができる。 ゲート Vds Vgs 酸化膜 (絶縁体) MOSトランジスタ の回路シンボル 金属ゲート N型半導体 ソース n+ 電流 ドレイン n+ ドレイン ドレイン電流 (Ids) ソース Vgs:高い [1] Vgs:低い [0] P型半導体 ドレイン電圧(Vds) 2005, 10/06 計算機論理設計 A.Matsuzawa 23 CMOS論理回路 P型MOSトランジスタとN型MOSトランジスタを用いることで、 定常電流が流れなくても論理電圧が発生するCMOS論理回路が構成される。 NAND ゲート I1 I2 O (1)論理図 VDD ソース・ドレイン P型MOSトランジスタ O I1 Out = I 1 ⋅ I 2 ゲート N型MOSトランジスタ I2 GND (2)トランジスタ回路図 2005, 10/06 計算機論理設計 A.Matsuzawa 24 デジタル加算器 NAND回路を組み合わせることでデジタル加算・減算器ができる。 これにより乗算・除算も可能になりマイコンやデジタル信号処理回路も可能になった。 S = A ⊕ B ⊕ C , EXOR C = A ⋅ B + B ⋅ C + C ⋅ A, 多数決論理 キャリー 2005, 10/06 計算機論理設計 A.Matsuzawa 25 DRAM ダイナミックメモリ 半導体中に微細な容量を形成し これに電圧(電荷)を蓄えることで 情報の記憶に必要なメモリができる。 ワード線 ビット線 STI 0.175μm 256Mbit DRAM ワード線 ビット線 キャパシタ 等価回路 記憶ノード キャパシタ電極 2005, 10/06 計算機論理設計 A.Matsuzawa 26 LSI 製造工程:基本 露光・現像 窒化膜エッチング 熱酸化 ゲート酸化膜 窒化膜 酸化膜 ① ③ CVD 素子間分離酸化膜 熱酸化 (化学気相成長) 多結晶Si膜 ② 2005, 10/06 ④ 計算機論理設計 A.Matsuzawa 27 LSI製造工程:基本 露光・現像 多結晶Si膜エッチング 絶縁膜 ゲート電極形成 ⑤ ⑦ ゲート イオン注入 コンタクト アルミ配線 ソース・ドレイン形成 ゲート ソース ⑥ 2005, 10/06 計算機論理設計 A.Matsuzawa ドレイン ⑧ 28 LSI設計フロー 機能設計 論理合成 論理設計 所望の動作を実現する為の HDLを論理合成ソフト LSIの機能を機能図又は により論理図に変換 HDLで記述し検証 マスク設計 プロセス 論理が正しいことを 論理図をもとに標準セル シミュレーションで ROM/RAM等の部品を 確認 配置・配線 テスト 出来上がったチップの 動作の検証 タイミング図 ck (1kHz) keyck (25Hz) reset_ sw res 0 res 1 re s 機能図によるLSIの機能設計 module KeyScan(CLOCK,RESET,SIN,SCAN,VAL) input CLOCK,RESET input [3:0] SIN; output [3:0] SCAN,VAL; reg clk,rst; 論理図と論理シミュレーション 自動配置配 線 VDD always @(posedge clk or psedge rst) begin if(rst) r_scan <= 4'd0; else case(Init) 1'b1:r_scan <= 4'd8; // Cobstant: r_scan[3:0] 1'b0: case( Scanning ) 1'b1:r_scan <= { r_scan[3] , r_scan[2] , r_scan [1] } 1'b0:r_scan <= r_scan; default: r_scan <= 4'bx; endcase default: r_scan <= 4'bx; endcase end ハードウェア記述言語(HDL) によるLSIの機能設計 2005, 10/06 レチクル(ガラス原板) VSS MN3456 標準セル 1チップ自動レイアウト 計算機論理設計 A.Matsuzawa 29 最初の集積回路 最初の集積回路はトランジスタ4個程度を集積した簡単なものであった。 2005, 10/06 Gordon E. Moore, ISSCC 2003. 計算機論理設計 A.Matsuzawa 30 Intel MPUの歴史 • 4004 (1971年) – 動作周波数:108KHz – バス巾:4ビット – プロセス技術:10um – トランジスタ数:2300 Pentium III (2000年) 動作周波数:1GHz プロセス技術:0.18um トランジスタ数:2800万 世界初のマイコン 2005, 10/06 計算機論理設計 A.Matsuzawa 31 LSI技術の黄金則:スケーリング則 スケーリング則はLSIの黄金則である L W tox Scaling Device/Circuit parameter Scaling Factor Device dimensions L, W, Tox 1/S Doping concentration S Voltage 1/S Field 1 Current 1/S Gate Delay 1/S Power dissipation/device 1/S2 2005, 10/06 S≈ 2 動作電圧も1/Sにする 微細化・低電圧化により、 ・高密度化(低コスト) ・高速化 ・低消費電力 が同時に達成される 計算機論理設計 A.Matsuzawa 32 スケーリング則 縦横均等に縮めても抵抗は変わらないが容量は減る。 したがって応答時間が速くなり動作スピードが上がる。消費電力も下がる。 MOSトランジスタのモデル L τ = RC = ρεL2 R=ρ W 1 → τ C = εLW S2 L W スケーリング (微細化) 消費電力 ∝ 周波数 × 静電エネルギー = fCV 2 L/2 W/2 0.993 R 1 Switch A C Vs R ⎛ ⎛ t ⎞⎞ Vc = Vs ⎜⎜1 − exp ⎜ − ⎟ ⎟⎟ RC ⎝ ⎠⎠ ⎝ Vc yo( x ) 電圧 0.5 0 0 τ=RC Switch B 0 0 2005, 10/06 計算機論理設計 A.Matsuzawa 2 4 x 時間 6 5 33 スケーリング則 微細に作ると、トランジスタ数が増やせるだけでなく 速度が上がり消費電力が下がる。 抵抗は同じ 容量は1/4 時定数は1/4 速度4倍 消費エネルギー 1/8~1/16 スケーリング 2005, 10/06 計算機論理設計 A.Matsuzawa 34 光リソグラフィ 微細加工のためには高度な光リソグラフィー技術が必要である。 レーザ光 マスク 投影レンズ ウェハ レジスト (感光材) 2005, 10/06 計算機論理設計 A.Matsuzawa 35 微細化のトレンド 5.0 g-line i-line KrF 436nm 365nm 248nm ArF EUV 193nm 13.5nm 最小寸法 (um) 2.0 1.0 CMP、スキャン露光、化学増幅型レジスト CMP、スキャン露光、化学増幅型レジスト 0.5 0.2 EB 位相シフトマスク 位相シフトマスク 変形照明 変形照明 薄膜レジスト、高精度マスク 薄膜レジスト、高精度マスク 短波長化、高 NA化、レジ スト高性能化 OPC、低収差レンズ OPC、低収差レンズ 波長以下のパタ-ン 0.1 Design Design for for Manufacturing Manufacturing フローイノベーション(APC) フローイノベーション(APC) ArF→+I 0.05 80 2005, 10/06 85 90 95 年 00 05 計算機論理設計 A.Matsuzawa 10 15 36 現在のSoC用トランジスタ 現在のSoCの量産プロセスである0.13umルールのトランジスタ 原子レベルの制御が求められる。 CoSi2 SiN ゲート 格 子 7 個 に 相 当 2nm ゲート酸化膜 NSG SiN Oxide 5000倍 拡大 0.1μm 1.0nm トランジスタの断面 Si 基板 ゲート絶縁膜 松下電器 2005, 10/06 計算機論理設計 A.Matsuzawa 37 集積度の推移 ・チップに集積されるトランジスタは数億個レベルになった ・30年間で6桁上昇した 年率60%アップ, 3年で4倍 Gordon E. Moore, ISSCC 2003. 2005, 10/06 計算機論理設計 A.Matsuzawa 38 動作速度の向上 微細化によりプロセッサの動作速度が向上 Operating frequency 1GHz 2 700MHz s/ e m ti rs a e 3y Merced High-end US-3 PC P7 21264 21164 500MHz 400MHz 300MHz 21264 IBM R14000 P6MMX2 PPC604e US-2 R12000 P6 P6 21164 PPC750 Embedded R4400 Pentium MMX R10000 R10000 SA110 P6 V830R R5000 SH4 s US ar SA110 e V832 R4300 2y 21164 NEC(研究) 200MHz 21064 R4400 Pentium 100MHz es m i 2t SH3 V830 R4300 R4200 SH3 SuuperSparc R3900 R3000 V810 SH2 / 1994 1995 1996 1997 1998 1999 2000 2001 2002 (CY) Year 2005, 10/06 計算機論理設計 A.Matsuzawa 39 ゲート消費電力ロードマップ ゲート当たりの消費電力は現在までは確実に減少 10 消費電力 [μW/MHz/G] 3 2入力NAND換算の ゲート消費電力 1 0.3 0.1 標準(VDDスケーリング) 低リーク(前世代VDD) 低リーク(VDD,Vt維持) 0.03 0.01 0.1 2005, 10/06 0.3 プロセス世代 Lg [μm] 1-1-8 計算機論理設計 A.Matsuzawa 1.0 40 デジタル情報家電 2005, 10/06 計算機論理設計 A.Matsuzawa 41 デジタル情報家電の時代 デジカメ、カメラ付携帯電話、DVDレコーダー、デジタルTV、フラットディスプレーなどの デジタル情報家電機器が大成長。これらの機器には1~2個のシステムLSI (SoC)が使 用されている。 2005, 10/06 計算機論理設計 A.Matsuzawa 42 DVD用システムLSI DVDのような複雑なシステムもワンチップSoCで全システムが集積される。 光ディスク 光ヘッド 第1世代 16M SDRAM 赤色 レ-ザ ヘッド アンプ ドライバ アナログ フロント エンド プリ アンプ サ-ボ DSP サ-ボDSP 2005, 10/06 第3世代 受光素子 赤色レ-ザ ユニット リ-ド チャネル 第2世代 4M DRAM ECC ワンチップ AV ワンチップ MPEG2 ビデオ コピ- ガ-ド 復調 訂正 CD DEM シスコン MCU 第4世代 ビデオ出力 AC-3出力 AC-3 オ-ディオ ステレオ出力 操作・表示 シスコンMCU 計算機論理設計 A.Matsuzawa 43 アナ・デジ混載SoC:DVDの完全ワンチップ化 高性能アナログを含むDVDの全機能を0.13um技術を用いてワンチップに集積した。 0.13um, Cu 6Layer, 24MTr Okamoto, et al., ISSCC 2003 2005, 10/06 計算機論理設計 A.Matsuzawa 44 システムLSIによる部品削減効果 ・VLSIの進展により従来3チップ必要だったものが1チップに集積可能になった。 ・このためケース内部のボードは驚くほど簡単になっている。 ・これが性能向上とコストダウンに寄与している。 2000年モデル 2005, 10/06 2003年モデル 計算機論理設計 A.Matsuzawa 45 Cost occupation (%) デジタル情報家電用機器のコスト構成 機器のデジタル化によりコスト構成はPCと殆ど同じになった。 半導体投入比率は倍増している。 機器=半導体の時代になった。 Analog base PC Digital base 100 5% 10% Labor cost 15% 10% Software & patent 10% 30% 5% 80 60 40 5% 40% 40% 30% Components 倍増 30% PCと同等 55% 40% 20 50% Semiconductor 25% 0 WideTV 2005, 10/06 Internet TV Digital TV 計算機論理設計 A.Matsuzawa PC 46 デジタルTVシステム デジタルTVは、画像伸張・デジタル通信・番組情報処理・ネットワーク機 能・グラフィックス機能など多くの機能を集積した複雑なシステムである。 16M SDRAM 16M SDRAM QPSK 復調 8PSK Satellite 復調 VSB 誤り訂正 復調 QAM 誤り訂正 DEC 誤り訂正 FEC Tuner Broadcast TS decoder Demultiplex Descramble 1394 CA Analog/Digital Mix signal CATV IC Card IR control MPEG2 Video Decoder 2D Graphics MODEM System control OSD Teletext Video CRT MacroVision AC-3 MPEG R Audio Decoder D/A L Audio Media Core Processor * 32-bit MCU 120MIPS 2005, 10/06 NTSC/ PAL Enc. IEEE1394 AFE MODEM AFE PC Telephone line SoC for STB (MN2WS0002) 16M SDRAM Mask ROM 計算機論理設計 A.Matsuzawa Flash memory * MCP, 5GOPS 47 One-chip System LSI for DTV 2000年あたりのLSI Setup RAM Setup &VLD Setup ROM Stream Buff Media IDCT Core Processor MC Video Decoder 2005, 10/06 SDRAM I/F Audio I/F etc. XT 32bit MCU CPU Core 0.25μm 4AL CMOS 10M transistors 5 BOPS (81MHz) : Multimedia processor BCU BCIF Host I/F dTLB IOP JTAG Instruction ROM Data Cache DAC Audio PLL System RAM Periph iTLB Instruction Cache Transport Decoder Demux/ DSC DMA 計算機論理設計 A.Matsuzawa 121.5MIPS (121.5MHz) :32b MCU 2.6W 48 デジタルTVの信号処理 Bit stream Whole system control Stream analysis Video decode Header analysis VLD IQ IDCT MC Parallel processing Subpicture decode Audio decode Header analysis Header/data analysis IFFT Run length control Size conversion Alpha blend Trick-play control Down mix Video output processing Video out 2005, 10/06 AV sync. 計算機論理設計 A.Matsuzawa Audio out 49 Address to several formats Program control is a key for system LSI Previous Japan USA Europe Current Japan USA Europe Address by program Develop in each 2005, 10/06 計算機論理設計 A.Matsuzawa 50 電話の世代進化 ~モビリティと高速・大容量伝送の両立~ 1980 年 大 第1世代 第2世代 アナログ 携帯電話 デジタル 携帯電話 第4世代 IMT-2000 FPLMTS2 (W-CDMA) 高速・大容量 シームレス 世界統一 マルチメディア対応 固 定 PDC W-CDMA の 展 開 MMAC PHS AWA マルチメディア対応 (~12Mbps) 5~40GHz 固定網 1k 2005, 10/06 第3世代 歩 行 コードレス 電話 小 2010 年 10 k : Personal Digital Cellular : Wideband-Code Division Multiple Access 術 モ ビ リ テ ィ 2000 年 技 高 速 1990 年 100 k 情報伝送量(bps) 固定系として発展 1M AWA : ATM Wireless Access MMAC : Mobile Multimedia Access 計算機論理設計 A.Matsuzawa 10 M FPLMTS : Future Public Land Mobile Telecommunication Systems 51 携帯電話の進歩 Mobile phones evolve to information terminals 400 Very high speed operation is needed . WinCE 200 Internet Terminal 100 Visual Phone Smart Phone Basic Terminal Voice Terminal 2005, 10/06 EPOC/Java Communicator iTRON Performance (MIPS) Aggressive low power technology will be vital. 1997 Voice/Text Terminal Operating System Image Terminal 2000 計算機論理設計 A.Matsuzawa 2003 52 携帯電話による動画像の伝送 携帯電話では信号帯域が狭いため、動画像の伝送には高度な画像圧縮技術が必要となる。 背景動画(矩形形状) MPEG4による画像圧縮技術 オブジェクト1圧縮 オブジェクト1圧縮 動画(任意形状) 携帯電話回線:10—384Kbpsに対応 多 多 重 重 オブジェクト2圧縮 オブジェクト2圧縮 キャラクタ(任意形状) オブジェクト3圧縮 オブジェクト3圧縮 従来技術:MPEG2では 2-30Mbps必要 オブジェクト1、オブジェクト2、 オブジェクト3の圧縮された情報 及び合成情報の多重化情報 MPEG-4マルチコーデックLSI 合成動画 オブジェクト1伸張 オブジェクト1伸張 分 分 離 離 オブジェクト2伸張 オブジェクト2伸張 合 合 成 成 オブジェクト3伸張 オブジェクト3伸張 2005, 10/06 計算機論理設計 A.Matsuzawa 53 ローパワー処理用SoC 携帯型デジタル情報家電機器には超低電力・低リークのSoCが求められる。 MPEG4 Codec 0.18um e-DRAM 31M Tr 90 mW@54MHz MPEG4 Decoder T. Hashimoto, et al., “A 90mW MPEG4 Video Codec LSI with the Capability for Core Profile,” ISSCC, Dig. of Tech. Papers, pp. 140-141, 2001. 15fps (Core@L1 decode) 30 fps (Simple@L3 decode) 2005, 10/06 0.18um CMOS 11M Tr 11 mW@27/54MHz M. Ohashi, et al., “A 27MHz 11.1 mW MPEG4 Video Decoder LSI for Mobile Application,” ISSCC, Dig. of Tech. Papers, pp. 366-367, 2002. 15fps (Core@L1 decode) 計算機論理設計 A.Matsuzawa 54 低電力化技術 低電力化のためには素子の微細化・低電圧化の他にクロックあたりの処理能力を 上げるために並列処理技術、専用ハードウエア処理回路・クロックゲートなどのシ ステム・アーキテクチャ・回路技術が総動員される。 1.5 GOPS: Simple@L1 12 GOPS: Simple@L3 6 GOPS: Core@L1 ブロック図 VCE (Video Codec Engines) ME LM VLC DCT LM IDCT VLD PNR LM PAD LM ハードウエア処理の効果 CAD COMP LM CAD Programmable DSP DSP Core Inst. Mem Data Mem HW Engine PAD HIF (Host I/F) COMP 6.8% 63% Kcycles 0 5 40 WITH the EnginesWITHOUT the Engines DRAM (16Mb) 24% 0 2005, 10/06 6.1% 26.5% Core@L1 Decoding Video Input Software Texture Decoding MIF (Memory I/F) DRAM Main Sub Graph. DRAM (2Mb) (2Mb) Filter T. Hashimoto, et al., “A 90mW MPEG4 Video Codec LSI with the Capability for Core Profile,” ISSCC, Dig. of Tech. Papers, pp. 140-141, 2001. Mcycles 100 200 Video Output 計算機論理設計 A.Matsuzawa 55 LSIアーキテクチャと消費電力 LSIの構成の違いにより同一の処理能力でも消費電力は3桁違う。 汎用プロセッサーが最も電力を消費する。 DSP MPU Dedicated LSI 2 16 96 0.9 0.8 2.4 Pd (mW) 7000 110 12 Pd (mW)/GOPS 7800 138 5 Parallelism GOPS 3 order’s difference Courtesy, Prof. Brodersen, UCB 2005, 10/06 計算機論理設計 A.Matsuzawa 56 マルチコアプロセッサへの転換 本年よりマルチコアプロセッサー開発が本格化した。 汎用性の喪失と並列処理を含んだソフト開発が課題である。 2005, 10/06 計算機論理設計 A.Matsuzawa 57 携帯電話システム 現代の携帯電話は画像処理回路やデジカメ機能まで集積している。 P900iの主回路基板と半導体パッケージ miniSDカード制御モジュール部 主基板実装部 積層 送受信制御部 アンテナスイッチ ディプレクサ ローノイズアンプ パワーアンプ 水晶発振子、フィルターなど 資料提供: SemiConsult 液晶実装部 イン・カメラ スピーカー モジュール 画像処理、SDRAM, MPEG4など 裏面液晶装置 積層 UIMカード・IrDAモジュール部 LCD/バックライト モジュール アウト・カメラ モジュール (AF機能内蔵) 積層 CCD制御部 中間周波数制御・電源部 ADC/DAC 電源IC、フィルターなど 通信・画像制御部 C-CPU、A-CPU DSP、SRAM、 Flashメモリなど 2005, 10/06 多層FPC基板と FPCケーブル 計算機論理設計 A.Matsuzawa 58 携帯電話用多チップパッケージの事例 限られた容積でのチップ集積では複数チップをスタックにしたSiP (System In Package)技術も用いられている。 パッケージスタックドCSP チップスタックドCSP フラッシュメモリ、 SRAM、 疑似SRAM SDRAMなどを積層し樹脂封止 100μmT フリップチップとワイヤボンドによるチップを 積層し、樹脂封止め 130μmT 100μmT 230μmT Spacer Si 100 μmT Au-Stud フリップチップ 100μmT 資料提供: SemiConsult 100μmT パッケージスタックドCSP チップスタックドCSP ベースバンドICとメモリチップの積層 ワイヤリングの自由度確保、熱特性向上のため、 250μmT 小型チップに大型チップヲ搭載し樹脂封止 Spacer Si 80μmT 液晶コントローラ(フリップCSP)上にインターポーザ 基板を介して汎用SDRAMを積層 LCDコントロー ラ インターポザ SDRAM 90μmT 120μmT Au wire 2005, 10/06 計算機論理設計 A.Matsuzawa 59 ユビキタスネット:RF-TAG 微細化一辺倒ではなく、VLSI技術を用いて新たな機能や新たな市場を作り出そう という試みが始まった。 このような「ゴマ粒チップ」が全ての物に入りネットワークを形成しようとしている 0.4mm角, 厚さ0.1mmの小さなチップでは あるが、2.4GHzの電波を用いてデータ通 信が可能。動作電力も電波を整流して作り 出す。お札に入れることも可能。 RF-TAGチップ リーダー・ライター アンテナ アンテナ アンテナ RF RF・アナログ RF・アナログ 回路 回路 整流 整流 電源回路 電源回路 データ MCU MCU クロック メモリ メモリ 日経エレクトロニクス 2002. 2. 25, pp. 132 2005, 10/06 計算機論理設計 A.Matsuzawa 60 まとめ • • • • 現在の電子機器は計算機技術(デジタル技術)を用いている 計算機はプロセッサとメモリ、ソフトウエアなどから構成される プロセッサにより電子機器はソフトウエアで制御できる 集積回路の技術の進歩により、殆どの電子機器がデジタル技 術を使えるようになった – パソコン デジタル情報家電(DVD, DTV, D-Camera) 携帯電話など • この授業では現代の電子機器の基礎である、論理回路、加算 減算、乗除算、ALU、命令と制御、メモリー管理などのコン ピュータ(プロセッサー)の動作原理を学ぶ。 2005, 10/06 計算機論理設計 A.Matsuzawa 61
© Copyright 2024 ExpyDoc