Document

スーパーカミオカンデに
おけるDAQシステム
1, イントロダクション
2, SKオンラインDAQ の構造
3, T2Kビームとの同期
4, 近傍超新星爆発時の対応
5, まとめ
東北大学
ニュートリノ科学研究センター
山田 悟
1, イントロダクション
スーパーカミオカンデ検出器
Water Cherenkov detector
13,000 PMTs are equipped in
50,000 tons water tank
ν
Charge and timing information of
Cherenkov
PMT hits are recorded
light
©Scientific American
Obtain Cherenkov
Ring images
List of physics topics of the SK detector
- Atomospheric neutrino oscillation : Δm2, θ23
- Solar neutrino oscillation : Δm2, θ12
- Neutrino from accerelator(T2K) : search for θ13
- Search for neutrino from supernova (burst or diffused)
- Proton decay search
3
SK Electronics (installed in 2008)
QTC-Based Electronics with Ethernet
(QBEE)
Network
Interface Card
PMT
signal
Ethernet
Readout
60MHz Clock
TDC Trigger
Calibration Pulser
QTC
TDC
FPGA
Features
• 24channel input
• QTC (custom ASIC)
• Charge measurement
• wide dynamic range
(>2000pC)
• multi-hit TDC (AMT3)
• Data is sent to Online system
via Ethernet
• External 60MHz clock is used
for synchronization with other
Qbees
• On-board pulsar for charge
calibration
• Low power consumption
( < 1W/ch ) 4
Data-readout via Ethernet
QBEE throughput from analog pulsar
Input to a readout PC
throughput rate (MB/s)
Custom Network Interface Card
12
10
8
6
4
2
0
MAX :
11.8MB/s
(~95Mbps)
Requirement
0
4
8
12
16
20
input data rate (MB/s)



TCP/IP firmware (SiTCP *)
and interface logic are
implemented on FPGA
IP address is set by dip switch
32MB SDRAM
* Developed by Uchida-san(KEK)


Required data transfer speed :
(PMT dark noise) 10kHz x 6byte x 24ch
= 1.5MB/sec/board
Fast enough. Reaches the
theoretical limit of 100BASE-TX !!
5
2, SKオンラインDAQ の構造
SKオンラインシステムアップグレードの動機
a, より低エネルギーの太陽ニュートリノを観測する
(エネルギー閾値を下げた大量のデータを処理できるように)
b, 超新星背景ニュートリノの探索等のためによりintelligentなトリガーを用いたい
( e.g. ニュートリノイベントとそれによって発生した中性子によるガンマ線との遅延同時計測
→ハードウェアトリガーを無くしてで全ヒットを取るシステムを目指す,
Record Every Hit system
•従来のシステム
トリガーモジュールがある時間内の
PMTヒット数をモニタ
閾値を
超えた場合
Event Trigger
Event triggerが出されたhitのみ
がオンラインシステムに送信される
Higher rate
Complex trigger
•新システム
ハードウェアでトリガーはかけない ->全ヒットがオンラインで処理される
オンラインDAQにおいて、ソフトウェアトリガーがデジタイズされたヒット情報を
みてイベントビルディングとリダクションを行う
7
SKオンラインシステムの概略図
24PMTs
30QBees
QBee
QBee
.
.
.
.
.
.
13,000
PMTs
QBee
QBee
1hit cell
= 6bytel
(ch, T, Q)
Ethernet
Sorting
Data from 30Qbee
Merger
Software
trigger
Merger
Software
trigger
Merger
Software
trigger
550
20
10
QBees
Front-end PCs
Merger PCs
Organizer
Front
End PC
Front
End PC
Front
End PC
QBee
Event builder
Recorded
Data:
9MB/s
typical
Disk
Offline
analysis
オンラインDAQの特徴
- front-end エレクトロニクスからオフラインにいたるまで、イーサネットでTCP/IP通信を
用いるコンポーネントで構成されている
- オンラインPCは4コアCPUのLinux PCで、C言語で書かれたマルチスレッドのアプリケーショ
ンが走る
- 分散処理のため、イベントビルディングは10PC、40プロセスが.並列して処理を行い、
data flow managerデーモンがデータの振り分けを担当している
8
SK DAQシステム坑内Network構成
坑外 offline
システムへ
コントロールルーム
×10
SW:24GbE
GPS
PC
Backup
FEPC
SW:48G
SW:48G
SW:48GbE
青: 100Base-T
黒:Gigabit Ethernet
周辺hut×4
SW:24G
Controller
, etc
TRG
PC
Organizer
Merger PC
中央ハット
FEPC
FEPC
FEPC FEPC FEPC
SW:24G
SW:48G
SW:48G SW:48G
QB×about20 QB×30
QB×30
QB×30
SW:48G
QB×30
9
Function of software in front-end PC
Hit-DATA cell Format ( 3Words/hit )
15 14 13 12
ch
1st_Word
front-end
Electronics front-end
(24ch/Board)
QBee
QBee
.
.
.
.
QBee
2nd_word
PC
collector
collector
3rd_Word
TRG
9
Bit
8
7
6
5
4
3
2
1
0
QTC gate
Event # count
TDC
Allocated memory
of fixed size
FIFO
FIFO
Event #
n
To
Merger
n+1
.
.
.
.
pthread_create
collector
Range
11 10
n+2
Quick
sort
FIFO
Sender
n+3
.
Sort data
.
in time order
.
Collect. Data
FIFO
by event #
10
Performance of Front-end PC
To make use of multi core CPUs,
data in different time blocks are
sorted in parallel by multithreaded functions
↓
effective for the improvement of
throughput
offline
Function
To collect data From 30 Qbees
and sort the hit cells in time order
~550
QBs
20
10
1
Front Front Orga
End End nizer
PC
PC
PC
Performance with dummy data
Front-end PC can handle up
to 15kHz dark rate
( PMT dark rate = 4 ~ 5kHz )
11
Data flow manager (1)
役割
20台のfront-end PCからのデータを後段の40個のmerger プロセスに
分散させる → データの送信先指示、受信確認作業を行う
Network shared memory*
Data flow manager
Control distributing
of data
(各PC間でTCPを用いて
通信を行い、localにあるshared
memoryの内容を同期させる機
能を持つデーモンプロセス。
Belleグループによって開発、使
用されている。)
20ms
Time window
Block Block Block
1
2
3
FEPC
Switch
Block Block Block
1
2
3
FEPC
Block
1
Block
1 Merger
Block
2 Merger
Block
2
PC
PC
12
Data flow manager (2)
イベントビルディングのためには20台のFront-end PCから1台のmerger processにデータ
を送ることが必要 → 送信が集中してbottle neckとなる
これを避けるために、data flow managerで一度に複数の送信命令を出すようにした
例)
Data flow managerが
命令キュー内の
命令キュー内の
送信命令を出すrate
エントリ数 = 3
エントリ数 = 1
request:destination
Req10 : MGR0
Req11 : MGR1
Req12 : MGR2
Req13 : MGR3
Req14 : MGR4
Req15 : MGR5
Required rate
time
1個の命令が完了
してから次の命令を
出す.
time
Req10 : MGR0
Req11 : MGR1
Req12 : MGR2
Req13 : MGR3
Req14 : MGR4
Req15 : MGR5
request :destination
3個の命令を
同時に出し、各
FrontEnd PCが進み具合
に応じて送信を
行う
→ 各front-end PCから送るデータの行き先が分散され、全体のthroughputも上昇した
13
~550
QBs
20
Front
End
PC
10
Mer
ger
PC
1
Orga
nizer
PC
offline
Performance of the Online system
Change the threshold of the software trigger
and measure the efficiency of Online DAQ’s data processing.
process data w/o loss
- 12kHz of
Event Trigger rate
can be processed
without data loss,
which is much
larger than the max.
Trigger rate in the
previous System
(~4kHz )
- Bottleneck is the
disk write on the
organizer PC
( max. ~50MB/s)
14
Function of Merger
FEPC
Event
Header
.
.
.
.
Block
Header
data
.
.
.
.
Software
trigger
receiver
Merge the data from front-end PCs
And sort in time order
Heap sort
FEPC
event n
receiver
n+1
n+2
n+3
n+4
n+5
FEPC
Block header
receiver
event header
data
15
Function of Software trigger
Software trigger
Trigger windowをずらしながらdataをscan
Mergerからのデータ
全FEPCからの1344 event分(22ms)
が時間順にソートされた状態
200ns
200ns
Window内のhitsumが閾値を超えると
“Software”
event
“Software”
event
Offline (DISK)
Typical Trigger type
* Super Lowe
(低エネルギー太陽ニュートリノ解析)
* LowE, HIghE
( 大気ニュートリノ解析)
• T2K trigger (T2K用データ、T2Kビームに同期してデータを取り出す)
* After trigger (ニュートリノ反応後にできた中性子によるガンマ線測定)
16
稼働状況
Replacement work was done for 2weeks in the end of Aug. 2008.
After the installation of the DAQ system, it started working since Sep. 6. DAQ
system is stable and 24hrs operation is ongoing.
Installed DAQ system in an elec. Hut
Front-end PCs
and network switches
Qbees
1か月間のData-takingの状況
Running time
= 97%
Normal run
= 91%
17
3, T2Kビームとの同期
T2K (neutrino beam from Tokai to Kamioka) trigger

By using GPS data of SK and Tokai sites, PMT hits within ±500μs are
recorded as T2K triggered event ( 1st priority in software trigger )
check
From Tokai
T2K
triggered
data
Offline
Disk
T2K
triggered
data
3rd Reduction
SK-GPS data
HITSUM
Triggered
data
2nd Reduction
Merger
+
Software
trigger
1st Reduction
Every hit
data
Tokai-GPS
Data
Online trigger monitor at SK
Spill information
coming from J-PARC
19
4, 近傍超新星爆発時の対応
超新星爆発が起こった場合のSKでのイベントレート
SK: 宇宙線検出 → 通常時は安定なtrigger rate
107
106
event rate [Hz]
Event Rate [Hz]
# of events/10s
500光年で起こった場合の
SKでのイベントレートの時間変化
105
104
Prev
Distance between earth and SN (kpc)
21
103
102
ベテルギウスが爆発した場合
総イベント数 : ~30M events
Max. event rate : ~ 30MHz
time [s]
Setup of the SN burs test
Mimic a SN burst by a light pulsar (occupancy ~1.5 %)
Flash rate
Laser diode
1s
~10MHz
~5MHz
attenuator
Pre-scale = 1
2s
7s
~1MHz
Pre-scaler
SK tank
Time
pulsar
Duration = 10s
Max. flashing rate of this system = 10MHz
Max. event rate from the SN burst at the distance of 500ly will become 30MHz
So we usually increase the occupancy (x4: 6-7%) to mimic those high rate case.
Estimation of the Limitation factor
from DAQ system for processing SN burst data (reminder)
定常的なイベントレートは
Limitation of Online DAQ processing speed A, SLE trigger
rate : 12-13kHz
ボトルネックはdisk 書き込み
Max. rate=14kHz
38kevents total
1/700 atten.
(5kpc 位の距離での爆発)
Occupancy (∼2%)
Event counter information on
DFM (Data flow manager) monitor
少し処理が遅れるが
直ぐに復帰する
40秒くらいであれば、FE ボードの
バッファに貯めておける。
-> O.K. @ 38kevents
更にレートを上げると
LD flashing condition : 7.2 Mevents and larger occupancy(~6.7%) case.
A : usual
Data processing
B : No disk writing onto
the disk
Processing
SN burst data
Merger PC
Organizer
Disk
Online DAQの通常運転状態でベテルギウスburst を処理するのは難しい
SN burst時間 (10s程度 )のデータを逃さないようにする方向で対応
まとめ
•
SKのオンラインDAQ
• 2008年夏にフロントエンドエレクトロニクスと一緒にアップグレード
• ハードウェアトリガーでイベントを選別せず、データはすべてオンラインPC
に送ってそこで処理(ソフトウェアトリガー)
• イベントビルディングは複数のPCで分散。エレキーPC、PC同士の接続は
イーサネットで行う。
• 複数PC間の調整はnetwork shared memoryで行う
•
その他に求められること
• T2Kビームとの同期
• 突発的なhigh rateへの対応(SN burst)
• ディスク書き込みがbottle neck
• SN burstのような短時間(~10s)のものに対しては
メモリバッファに貯めて処理を待つ方針でいる。
加えて情報量を減らした(時間当たりのhit数のみ)データを
取得するシステムを開発中。
26