ATLAS実験における解析環境

ATLAS実験における
シミュレーション&解析環境
東大ICEPP
田中純一
2005年1月22日
第一回LHC物理解析研究会
1
概要

道具



プログラミング言語は?
環境は?フレームワークは?
データ


実験データ
MCデータ



どこにある?どうやってアクセスする?
データの流れ:どうやってつくる?
我々の現状

何をやっているか?
第一回LHC物理解析研究会
話の中で、
“ローマ”という言葉が
でてきたら、
今年6月にある
ATLAS物理WSのこと
2005年1月22日
2
プログラミング言語

C++言語



Python


ATLAS実験専用の解析フレームワーク
ROOT
解析ジョブの引数に与えるテキストファイル内でオプションを記述す
る。
例:>> athena Higgs_VBF_tautau.py [return]
Fortran


Generator周辺の仕事
C++はSherpaだけ(?)、Herwig++とPythia7はまだ。
第一回LHC物理解析研究会
2005年1月22日
3
解析環境

Athena “アセナ”


ATLAS実験専用の巨大なフレームワーク
何もかも行う(予定)。




実験データのReconstruction
MCデータの生成
物理解析
Grid “グリッド”

世界規模で接続されたPCの集合体


約60000CPUs(3GHz Xeon換算)@2008
約16PB(テープ)+約30PB(ディスク)@2008
第一回LHC物理解析研究会
2005年1月22日
4
Athena環境の開発状況
ローマ
第一回LHC物理解析研究会
2005年1月22日
5
データ
基本は以下の3種類。
 RAW



ESD



実験データ、1.6MB/evt、HLT=~200Hz
例:物理事象=100Hzと仮定すると、
100x1年分(107)x1.6MB/evt = 1.7PB/年
MCデータ(Full)も実験データと同じ形式にする。2.0MB/evt
Event Summary Data、0.5MB/evt
Reprocessに耐える内容を保持する予定。
AOD

Physics Analysis Object Data、0.1MB/evt
第一回LHC物理解析研究会
2005年1月22日
6
流れ
Generator
Geant4
- simulation
- digitization
Fast
simulation
RAW
Reconstruction
ESD
Analysis
第一回LHC物理解析研究会
AOD
2005年1月22日
7
シミュレーション

Full Simulation



Geant4とGeant3
Geant4の実装は終了して、テスト段階に入った。
Fast Simulation

ハドロンコライダーでは必須。



Full Simulationで統計的に十分なイベントを生成することはできない。
例:s=1nbのプロセス、10fb-1相当、1イベント5分を1ヶ月で生成する。
(10-9x10x1015x5) / (1ヶ月=5x104) = 103CPU
(10-9x10x1015x5) x 2MB/evt = 108MB = 100TB
Full Simulationのパフォーマンスを再現するように再調整が必
要。
第一回LHC物理解析研究会
2005年1月22日
8
データアクセス
ESD
Analysis


AOD
AODは必要最小限の情報のみ保持。
データ解析中にAODにない情報(例えばセル)にアクセスし
ようとすると、該当するESDを探し出し必要な情報を取得
することができる。

Athena環境では実現している。
第一回LHC物理解析研究会
2005年1月22日
9
データ生成

グリッドを利用する。



データ管理
実験データのReprocess
MCデータの生成


“ローマ”ための公式データが生成されている。
データチャレンジ(DC)プロジェクト:DC1、DC2(now)、DC3
グリッド上で実験データをきちんとプロセスできるかどうか?
 グリッド上でMCデータを生成できるかどうか?
 グリッド上のデータを利用して解析できるかどうか?
等の検証するR&Dが行われている。

第一回LHC物理解析研究会
2005年1月22日
10
第一回LHC物理解析研究会
2005年1月22日
11
CERN
グリッド
CERN分室
第一回LHC物理解析研究会
2005年1月22日
日本
12
我々の現状
第一回LHC物理解析研究会
2005年1月22日
13
流れ(現状)
Generator

Geant4
- simulation
- digitization
Fast
simulation
RAW

ESDとAODはやっと姿を
見せたところ。
CBNT

Reconstruction

ESD
AOD
Analysis

CBNTを生成してROOT
で解析している。

CBNT
第一回LHC物理解析研究会
Combined ntuple
ROOTファイル
我々はこれでローマを目
指す。
2005年1月22日
14
単位はMeVとmm
第一回LHC物理解析研究会
2005年1月22日
15
Generator周辺の話題
B.Webber TeV4LHC@FNAL

Matrix Element


Grappa(日本製), Alpgen,
MadGraphなどなど。
Fragmentation
General tool





Jet cone/kT
Hadronization
Parton Shower
Pythia, Herwigなど
Sherpa
N(N)LO
これらの道具を駆使してデータを
生成している。


Signal:Higgs & SUSY(mSugra)
BG:tt、W+njets、Z+njets、…
ME+PS
p
PDF
p
PDF
Underlying Event
第一回LHC物理解析研究会
2005年1月22日
16
Higgsの話題:VBF H->tt


HiggsのFirst Discoveryを目指して!
Full Simulationでやるべきこと




TauIDの研究(進行中)
Et missingの研究
Forward Jetの研究
Fast Simulationでやるべきこと

Z+njetsの影響(進行中)
第一回LHC物理解析研究会
2005年1月22日
17
Forward Jets
Tau
第一回LHC物理解析研究会
2005年1月22日
18
解析ツール

Particle ID関連は整備中@CERN
B-tagging … モニター中
 E/gamma
 Jet & MissingEt … ここをやりたい。
 Muon
 Tau … 参戦中
開発はどんどん進んでいる。
複数の開発が同時に進むことも多い。
どれも使おうと思えば使えるが、Performanceには?が多い。
 ATLAS Physics TDR(1999)と比較して。

第一回LHC物理解析研究会
2005年1月22日
19
資源

データ生成はICEPPの計算機で行っている。



NonGrid
約100CPUs
約30TB

データはICEPPの計算機に存在する。

ICEPPの計算機ではAthena環境が利用できる。


CERNからミラーしている。
来年度からはCERN分室もフル活用。

我々(人の話)もCERNへお引越し。
第一回LHC物理解析研究会
2005年1月22日
20
まとめ

解析環境


データ生成と管理


実験開始に向け整いつつある。
@グリッドを目指している。
自前の解析環境


CERN & TOKYO
資源:データ保持とそのReprocessは十分可能(30fb-1ぐらいま
で)
第一回LHC物理解析研究会
2005年1月22日
21
予定

ATLAS物理ワークショップ



2005年6月7日ー11日@ローマ
予想:Full simulationのValidationが中心
アトラス物理本



ポスト・ローマはこれ!
2006年後半リリースを目指す。
実験データの解析(発見論文)のため、
大きな貢献をすることが最重要課題。
第一回LHC物理解析研究会
2005年1月22日
22
…To CERN

2007年に向け本拠地CERNへ
第一回LHC物理解析研究会
2005年1月22日
23