NUMAの構成

LSI設計の基本
ディジタル回路
天野英晴
ASIC (Appplication Specific IC)


機能目的型のIC
実装方法




ゲートアレイ
セルベースド
フルカスタム
CPU、メモリ、I/O、専用ハードウェアを実装した
システムLSI(SoC: System on-a Chip)


携帯電話、情報家電、ネットワーク制御等様々な分野
で用いられる。
日本の半導体産業の主力製品(フラッシュを除き)
初期のゲートアレイの構造
…
…
…
…
…
…
…
I/O Pad
ゲート領域
配線領域
SOF(Sea Of Gates)
…
…
…
…
…
…
…
…
…
…
I/O Pad
ゲート領域
配線領域
SOGの例(FPU:Rohm 0.6μ)
Embedded Array

ASICを作る意義



大量生産時のコストの安さ
高速、高集積度
Embedded Arrayとは?

メモリやCPUなどのあらかじめ設計されたレイアウト
を使うことができるゲートアレイ
Embedded Array
RAM
CPU
…
Random Logic
Embedded Arrayの設計(1)RTL設
計、Coreの決定
VHDL,Verilog HDLによる設計
標準シミュレーションツールによりシミュレーション
RTL(Register Transfer Level)シミュレーション
バグ
(Cadence Verilog-XL, Mentor Qhsim)
機能レベル設計を決定、使用Embedded Coreを決定
Embedded Arrayの設計(2)

Embedded Coreと機能レベル設計がかたま
れば、フロアプランを並行して進めることがで
きる
Wafer Sign Off
(Embedded Coreの配置を決めること)
拡散層の設計が可能になる
Embedded Arrayの設計(3)
HDL記述(Gold記述)
ベンダーから合成ライブラリ
の提供
Critical Path Error
論理合成、圧縮
Synopsys社Design Compiler 面積超過
ベンダーからシミュレーション用
ライブラリの提供
標準シミュレーションツールによる仮遅延シミュレーション
X問題
Embedded Arrayの設計(4)

合成したネットリストを提出(1st Data In)

ベンダ側でクロックツリー、Jtag等を付加
配置・配線(ベンダー側で行う場合と
自分で行う場合がある)
Back Annotation:配線遅延データを設計ファイルに
フィードバックすること
Critical Path Error
Embedded Arrayの設計(5)

テストベクトル作成、提出





RTL設計時から行う必要がある
実負荷シミュレーション後のネットリスト提出(2
nd Sign Off)
サンプル出荷
サンプルテスト
量産
ルータチップ内部レイアウト図
RDTルータチップパッケージ
MBP-lightのレイアウト
MBP-lightの外観
スイッチチップとMBP-lightを用いて作った並列計算機JUMP-1
システムLSI
チップ
センサ
Analog
FPGA コア
プロセッサコア
DRAM



SRAM
様々なコアが混載
プロセッサはコアに過ぎない。
消費電力、コスト、他のブロックとの接続のしやすさが
場合によっては性能より重要
ハードウェア処理部
コアプロセッサ
Martini の諸元
デザインルール
0.14μm
ダイサイズ
272.91mm2
メモリ総量
538KB
I/O 伝送周波数
RHiNET-2,3/SW
800MHz
OIP-SW
250MHz
内部動作周波数
コア部
66MHz
DIMM ホストI/F
133MHz
スイッチI/F
125MHz
パッケージ
784 BGA
ASIC版 NIC


コントローラに専用ASICを開発
PCI bus/ DIMM slot
Martini
SO-DIMM
光インタコネクション
ASICを用いて製作したPCクラスタRHiNET
セルベースド設計






小規模なゲート、大規模なIPの全てが自由な位置に配
置可能
そうはいっても、ゲートはやはり並べて配置する
配置、配線を設計者が制御する必要がある
90nmより進んだプロセスでは、Embedded Arrayでは
高い性能を得ることが難しくなり、セルベースド設計に移
行せざるを得ない
SoC(System on-a Chip)は主にセルベースド設計
配置、配線操作のオーバヘッドの増大
System on a Chip (SoC)
組み込み
CPU
アクセラレータ
特定の性能だけ要求されるの
ならば、その部分を強化するア
クセラレータを装備すれば高い
性能価格比が得られる
オンチップバス
オンチップネットワーク
RAM
I/O
I/O
専用ハードウェアを装備する
のが最も基本的なSoC
専用ハードウェアに
よるアクセラレータ
要求分析
ハードウェア/ソフトウェア
協調設計の流れ
上流の設計技術、高
位合成などの発達
下流の設計コスト増大
の問題
システム仕様
ハードウェア、ソフトウェア
切り分け
ハードウェア仕様
ハードウェア機能合成
ハードウェア
ソフトウェア仕様
インタフェース生成
インタフェース
組み合わせ、協調検証
システム
プログラム生成
プログラム
セルベースド設計

合成したネットリストを作成(ここまでは
Embedded Arrayと同じ)
バックエンド:
このステップが大変!
配置・配線
クロックツリー生成
ホールドタイム合わせ
ルールチェック、密度チェック
Back Annotation:配線遅延データを設計ファイルに
フィードバックすること
Critical Path Error
セルベースド設計




バックエンド(配置・配線)以降の負担が大きい
65nm以降、日本の半導体は低リークプロセスが主流と
なり、性能はイマイチ(FPGAの倍程度)
FPGAでできることは、FPGAでやった方が良い
動的リコンフィギャラブルプロセッサMuCCRA


パワーゲーティングを施したCPU Geyser


パワーゲーティングが目的なので、、
超低消費電力Silent Mega Array


FPGAのライバルなので、、
電力測定が目的なので、、
三次元ワイヤレス接続MuCCRA-Cube

三次元ワイヤレス接続を持つ立体コンピュータ
動的リコンフィギュラブルプロセッサMuCCRAの改良版レイアウト
PE
MULT
CONF
MEM
MuCCRA-2 Floor Plan [ASSCC07]
•ASPLA’s 90nm
•2.5mmX2.5mm
(Core: 1.5X1.5)
16
MuCCRA-3 フロアプラン[ERSA09][FPT09]
コンテキストメモリ
の深さ:32
Core Density:86%
メモリ比率:19.4%
チップ:2.1mmX4.2mm
工数:3-4人1.5カ月-2カ月
32
配線後
Geyser-1
e-shuttle 65nm
 Vdd=1.2V
4.2 mm
Shifter
ALU
MULT
DIV
リークモニタ
チップの積層の写真
Inductive-Coupling
PE
PE Link
PE PE
Down
PE
PE
PE
PE
PE
PE
PE
PE
PE
PE
PE
PE
Inductive-Coupling
Up Link
2.5mm
Four Stacked Chips on a PCB Board
Technology: 90nm, Chip Thickness: 85mm, Glue: 10mm
5.0mm
Data Memory
今後の授業との関連
計算機構成同演習
LSI設計の流れ
ディジタル回路
コンピュータアーキテクチャ
VLSI設計演習
SoC設計論
4年春 Verilogによる設計演習
レイアウト演習
大学院 Cレベル設計
システム設計 外部講師
SoC設計演習
大学院 Cレベル設計
システム設計演習 早稲田で他の
大学生と一緒にやる
システムLSI特論
大学院 電子工学科
黒田先生