タイミング制約を緩和するクロッキング方式の提案 - 坂井修一研究室 - 東京大学

タイミング制約を緩和するクロッキング方式の提案
喜多 貴信 †
塩谷 亮太 †‡
五島 正裕 †
† 東京大学大学院 情報理工学系研究科
1
背景
坂井 修一 †
‡ 日本学術振興会特別研究員 DC
2 提案手法
近年の微細化に伴って,回路遅延のばらつき増加が,
提案手法は,ロジックの出力が早く確定することが
プロセッサ設計において大きな問題となっている.回
多い性質を利用して,高クロック・低電圧でプロセッサ
路遅延がばらつくと,回路が同期した動作をするため
を動作させる.タイム・ボローイングの強化と,ロジッ
のタイミング制約を満たすことが難しくなる.回路遅
クの出力予測,の2つを利用して,ロジックの出力が
延の動的な変化によって信号のタイミングに齟齬が生
早く確定する確率をさらに高めている.万一タイミン
じ,設計者の想定外の動作(タイミング・フォールト)
グ・フォールトが発生したら,Razor を用いて検出・回
が生じることがあるからである.従来は最悪ケースで
復することで,正常動作を保証する.
も動作するようなマージンをとることで対処してきた
入力ばらつき
が,ばらつきが増大していくと非常に大きなマージン
ロジックの遅延は入力によって異なる.図 2 は 64bit 桁
を要し悲観的になりすぎる.
上げ先見加算器において,ある桁の出力が確定する時
動的タイミング・フォールト検出・回復
最悪ケースとは,
「経路上のトランジスタ・配線(Process)
刻の分布を示している.製造ばらつきがなければ,
「遅延
が全て最悪で,かつ電圧 (Voltage) や温度 (Temperature)
40ps(桁上がりなし)が確率 20%で発生」というよう
に離散的な分布(左上)となる.これに左下の各パスの
も動作範囲ギリギリ,かつクリティカル・パスが活性
製造ばらつきを掛け合わせると,右のような分布を得
化するような入力 (Input) が来た場合」のことである.
る.出力確定時刻は早いことが多いのが分かる.時刻 0
しかし,このようなケースが実際に発生する確率は極
は,出力が前サイクルから変化しなかった場合で,これ
めて低い.
も含めて考えれば遅延が 100ps を超える確率は 15%に
タイミング・フォールトが起きたら検出・回復でき
満たない.製造ばらつきによる遅延の変動は± 30ps 程
る手段を用意してやれば,タイミング・フォールトが
度であるのに対して,入力ばらつきによる変動(桁上
発生するギリギリまで,動的にプロセッサの電圧を下
がりなしとありの差)は 100ps 以上と大きい.類似の
げたり,周波数を上げたりすることができる(DVFS:
性質が多くのロジックに当てはまる.
Dynamic Voltage and Frequency Scaling).Razor[1] は,
特殊なフリップ・フロップ(FF)を用いてタイミング・
図 3 は,前述の桁上げ先見加算器が2ステージ連続して
フォールトを検出し,エラーを起こした命令を再実行
いる時,ステージ間が FF で区切られている場合(上)
して回復する.カナリア FF[2] は,タイミング・フォー
と何もなく単に連結されている場合(下)の,出力確
動的なタイム・ボローイング
ルトの発生を予報し,電圧を上げたり,周波数を下げ
定時刻の分布を表している.FF は1ステージ目で出力
ることで未然に防ぐ.
が早く確定するのに関わらず,1サイクル終了まで待っ
1世代前のプロセス
ト
ラ (ばらつき小)
ンジ
スタ
数
平均値の速度向上
出力変化なし
桁上がりなし
桁上がりあり
0.5
0.4
微細化したプロセス
(ばらつき大)
確
率
0.3
64bit桁上げ先見加算器の
出力確定までの時間の分布
0.2
遅延小に偏っている
0.1
0.012
0
最悪値(律速値)の速度向上
速度
図 1: 製造ばらつきが引き起こす微細化の効果の減少
0
50
0.08
確
率
密
度
100
150
200
250
パスの製造ばらつき
300
350
0.06
0.008
0.004
0.04
0
0.02
0
0
0
†Takanobu KITA
†‡Ryota SHIOYA
†Masahiro GOSHIMA
†Syuichi SAKAI
†Dept. of Information and Communication Eng, the Univ. of Tokyo
‡Research Fellowship for Young Scientists DC
確
率
密
度
50
100
150
200
時間(ps)
250
300
350
50
100
150
200
時間(ps)
図 2: 64bit 桁上げ先見加算器の入力ばらつき
250
300
350
確率
密度
FFでステージごとに
信号を区切った場合
の入力ばらつき
0
0
m
m
2サイクル
0
確率
密度
Short
φ
時間
0
0
2m
Short
Critical
Critical
φ
提案手法
タイム・ボローイングをすると
結果確定が早い確率が増加
0
※ Short < 0.5 < Critical
2相ラッチ
φ
時間
stall
Pred
Pred
Short
Critical
Short
skewed
φ
stall
skewed
Razor
Critical
error
2サイクル
図 4: 提案手法(下)と2相ラッチ(上)
図 3: タイム・ボローイングをした場合の入力ばらつき
1 stage
1 stage
てから次のステージへ出力を伝える.一方後者は,1
ステージ目を早く通過した信号は ”時間の貯金 ”を持っ
time
clk
予測によって
遅延小の頻度
が増加
た状態で2ステージ目を開始するため,トータルで2
ステージ通過に要する時間は短くなる.同様に,仮に
1ステージ目で桁上がりがあって遅れても( ”時間の
借金 ”を負っていても),2ステージ目を早く通過す
れば,トータルの遅延は短くなる.このように前後の
遅延の上限が伸びた
から,信号は間に合う
ステージ間で時間を融通する(タイム・ボローイング)
と,タイミング制約が緩和される.これを利用したク
ロッキング方式として2相ラッチがある.
最悪ケースが制約を
満たさないと動かない
動的TF
検出・回復
回路構成と動作
提案手法の回路には,ロジックの出力を予測する回路
図 5: 提案手法(右)と二相ラッチ(左)の動作
(Pred)が付加されており,これをセレクタで切り替え
ながら次段に流す.予測のヒット率が高ければ,入力
ばらつきはさらに遅延小に偏る.
タイミング・チャート(図 5)は縦軸が時間,横軸が
回路内の信号の伝達方向を示している.入力の違いに
よってロジックの出力確定するまでの時間は異なる様
子を多数の線で重ねて表している.大部分の線は傾き
が緩やか,つまり早期に出力が確定しているが,稀に
遅いケースもある.いくつかのステージでクリティカ
ルパスが活性化して「時間の借金」が累積しても,予
まとめ
製造ばらつき対策手法は数多く提案されているが,実
は製造ばらつきによる遅延の変動は,入力ばらつきの
それに比べればとても小さい.提案手法は遅延が大き
くばらつくこと前提として,逆に変動を利用する手法
となっているため,ばらつきを吸収して高クロック化
や低電圧化を達成できる.
測が成功すれば借金を大幅に返済できる.万一,借金
参考文献
が嵩んで破綻しても,すなわちタイミング故障が発生
[1] D. Blaauw, S. Kalaiselvan, K. Lai, Wei-Hsiang Ma,
しても,前述のように検出・回復することができる.
限は1サイクルであったが,提案手法ではショート・パ
S. Pant, C. Tokunaga, S. Das, and D Bull. Razor II:
In Situ Error Detection and Correction for PVT and
SER Tolerance. In Int’l Symp. on Solid-State Circuits
スに遅延素子を挿入することにより 1.5 サイクルまで
Conference (ISSCC), 2008.
2相ラッチでは半 FF ロジック区間あたりの遅延の上
拡大している.これによって遅延(借金)が累積して
もタイミング・フォールトが発生しにくくなると同時
に,予測回路による借金返済のチャンスも増えている.
[2] 佐藤寿倫, 国武勇次. ばらつき耐性を持つカナリア
FFを利用したデザインマージン削減による省電
力化. 情報処理学会論文誌, pp. 2029–2042, 2008.