HSC戦略枠サーベイの データベースとその使い方

HSC戦略枠サーベイの
データベースとその使い方
高田唯史
(国立天文台HSCサブプロ/天文データセンター)
山田善彦、小池美知太郎、峯尾聡吾、古澤久徳、安田直樹 他 HSC解析ソフトウェアチーム
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
今日の講演内容
•HSC戦略枠サーベイのデータ
•HSC戦略枠サーベイのデータベース
•HSC戦略枠サーベイデータベースの使い方
•今後の拡張機能予定
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
何故データベースが必要か?
• データが数(例えば10億程度の天体数、300万ほどのCCDデータファ
イル数)・量(1年もたたないうちから既に~50TB)共に多すぎて、デー
タそのものを全て持ってくるのは大変だし、保管する場所も個人では
持ちにくい。(財力+根性で不可能ではないかも、、)
• 自分に必要な分だけ欲しい情報を持ってくるには、多次元空間で定
義されたデータだけを高速で拾い出してくる必要がある。
• リレーショナルデータベースを筆頭に、データベースというものは、ま
さに、多次元空間上で情報を高速に切り出してくるためにある。
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
提供されるHSC戦略枠サーベイデータの種類
• カタログデータベース
• サマリーテーブル(1天体について1レコードに情報がまとまっている)
• Coaddの各バンド画像上の天体カタログ
• Source & Forced Source
• Ccdの画像上の天体カタログ
• Source & Forced Source
• 画像・カタログファイル(FITSファイル)
•
•
•
•
•
処理済みCCD画像(CORR)
Warp済みExposure画像(Warp)
モザイク補正後のCCD画像(CALEXP)
Coaddの各バンド画像(?,?.fitsまたはcalexp)
Ccd、Coaddに付属した天体カタログ
• Match(キャリブ用カタログとのマッチングの結果のカタログ)
• Src(天体カタログ)
• Force(天体カタログ)
• 公開用のデータベースのdumpファイル
• あなたの手元でもデータベース本体を持つことが出来る、、(現在~2TB)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
HSC戦略枠サーベイのデータベースの作成
• 画像についてはメタデータ(画像の取得時刻、座標、フィルター、
シーイング、測光ゼロ点、イメージクオリティ等)をDB登録
• カタログについては基本的に全ての情報をDB登録
• パイプラインのはき出す画像とカタログのうちサイエンスやエンジニ
アリングに必要だと思われる全ての情報を何らかの形でDBに登録し、
検索可能にすることが基本ポリシー
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
画像メタ情報
Visit processing(reduceFrames)
Every CCD
Exposure processing(exposureQa)
Every exposure
Mosaicking (mosaic)
Every (Tract, Patch + Filter)
Stacking + Stack Measurement (stack)
Every (Tract, Patch + Filter)
Apply Mosaic Result to CCDs
(calibrateExposure)
Every CCD 2015/3/20
Pipeline Procedures
Visit Images Meta Data
(CORR)
Frame
Frame_HPX11
Frame_Mng
Exposure Meta Data
(expQaMeta)
Exposure
Exposure_Mng
Mosaic Solutions
(wcs & fcr)
Wcs
Wcs_Mng
Fcr
Fcr_Mng
Warped Visit Images
(warp) Warped
Warped_HPX11
Warped_Mng
Stack Images Meta Data
(calexp)
Mosaic
Mosaic_HPX11
Mosaic_Mng
Mosaic Calibrated CCD Images Meta Data
(CALEXP)
日本天文学会2015年春季年会 HSC企画セッションB04r
Pipeline Outputs
CalibFrame
CalibFrame_HPX11
CalibFrame_Mng
DataBase tables
天体カタログ
Visit processing(reduceFrames)
Every CCD
Exposure processing(exposureQa)
Visit Matched Sources
frame_matchlist
frame_matchphoto
Visit Bright Sources
frame_icsourcelist
frame_icsoucephoto
Visit Sources
Every exposure
Mosaicking (mosaic)
Stack Matched Sources
Stacking + Stack Measurement (stack)
Every (Patch + Filter)
Forced Stack Measurement
(forcedPhotCoadd)
mosaic_icsourcelist
mosaic_icsourcephoto
Stack Sources
mosaic_sourcelist
mosaic_sourcephoto
Every (patch + Filter + RefFilter)
Forced Visit Sources
Every CCD Apply Mosaic Result to CCDs
(calibrateCatalog)
2015/3/20
Every CCD Pipeline Procedures
mosaic_matchlist
mosaic_matchphoto
Stack Bright Sources
Forced Stack Sources
Forced Visit Measurement
(forcedPhotCcd)
frame_sourcelist
frame_sourcephoto
Mosaic Calibrated Visit Sources
日本天文学会2015年春季年会 HSC企画セッションB04r
Pipeline Outputs
mosaic_forcelist
mosaic_forcephoto
frame_forcelist
Frame_forcephoto
frame_calsourcelist
frame_calsourcephoto
DB tables
Mosaic_Forcelist + Mosaic_ForcePhoto
ID
Mag1
Mag2
…………..
1
23.0
23.1
HSC‐G
1
22.9
23.0
HSC‐R
1
22.8
22.9
HSC‐I
1
22.0
22.1
HSC‐Z
1
21.5
21.6
HSC‐Y
2
……..
……..
……..
2
……..
……..
……..
サマリーテーブル作成
FILTER01
各バンドのCoadd画像上で検出された同一天体の情報を1レコードに
(Coaddのマルチバンドカタログ)
ID
gMag1
rMag1
iMag1
zMag1
yMag1
gMag2
rMag2
iMag2
zMag2
yMag2
1
23.0
22.9
22.8
22.0
21.5
23.1
23.0
22.9
22.1
21.6
2
…..
…..
…..
…..
…..
……………
Frame_Forcelist + Frame_ForcePhoto
ID
Mag1
Mag2
MJD
1
23.0
23.1
53888
……
HSC‐G
1
22.9
23.0
53889
……
HSC‐G
ID
gMag1
rMag1
iMag1
zMag1
yMag1
gMag2
rMag2
iMag2
zMag2
yMag2
MJD
1
22.9
23.1
53890
……
HSC‐G
1
……..
………
……….
………
………
……….
………
22.9
22.9
53891
……
HSC‐G
1
23.0
23.0
53892
……
HSC‐G
1
……..
……..
HSC‐R
{23.1,
23.0,
23.1,
22.9,
23.0}
……..
1
{23.0, 22.9, 22.9, 22.9, 23.0}
{53888,
53889,
53890,
53891,
53892}
2
…..
…..
…..
…..
…..
1
……..
……..
HSC‐R
2015/3/20
FILTER01
各バンドのCCD画像上で検出された同一天体の情報を1レコードに
(時系列データの基本部分)
日本天文学会2015年春季年会 HSC企画セッションB04r
サマリーカタログ作成時に付加している情報
•
•
•
•
•
銀河座標値
(cx,cy,cz)座標値
HEALPixインデックス(order=18)
銀河系による吸収値(Schlegel et al. 1998)
統計値
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
ストアド関数(Stored Function)
https://hscdata.mtk.nao.ac.jp:4443/hsc_ssp/dr_early/common/stored_functions.html
• データベース上で動く関数群
– 統計値計算(weighted mean, median, quantile, skewness, kurtosis他)
– 時間変換(MJD<‐>DATETIME)
– 座標変換(赤道<‐>銀河)
– 単位変換(等級<‐>Flux,Jy,cgs)
– HSC独自の変換(HSCA?????????? <‐> visit、ccd)
– WCSに関する便利な関数
– 形状計算(determinant radius他)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
HSCデータベースの使い方
• HSC戦略枠データ検索・取得用サイト
• カタログデータの探し方(Coadd天体マルチバンドカタログ)
• 画像データの探し方
• 外部カタログ(Value‐Addedも含む)とのリンク
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
HSC戦略枠データ検索・取得用サイト
• https://hscdata.mtk.nao.ac.jp:4443/hsc_ssp/
• アクセスするにはユーザーアカウントが必要です。(戦略枠Co‐Iの証)
• カタログ検索(CAS:Catalog Archive Server)
• Direct SQL Search: 細かい注文型検索
https://hscdata.mtk.nao.ac.jp:4443/datasearch/
• Form Search (SQL Generator): おきまりコース型検索
https://hscdata.mtk.nao.ac.jp:4443/datasearch/photoobj_searches/new?experimental=1
• Skymap(Explorer:カタログの画像へのオーバープロット)
https://hscdata.mtk.nao.ac.jp:4443/hsc_ssp/dr_early/skymaps/ (COSMOS) https://hscdata.mtk.nao.ac.jp:4443/hsc_ssp/dr_early/skymaps/?tract=1 (SXDS)
• Schema Browser: データベーステーブルの中身を知るためのオンライン辞書
https://hscdata.mtk.nao.ac.jp:4443/schema_browser2/
• 画像・ファイル検索(DAS: Data Archive Server)
• フォーム検索: https://hscdata.mtk.nao.ac.jp:4443/das_console/
• 直接アクセスによるwgetでのファイル取得も可能
• ストアド関数
• 検索補助用の関数群
https://hscdata.mtk.nao.ac.jp:4443/hsc_ssp/dr_early/common/stored_functions.html
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
戦略枠データリリース(S14A_0+S14A_0b)のカタログデータベース
Release
Survey
Filters
DB Schema
Tracts
No. of records(Coadd)
S14A_0
UDEEP
(COSMOS)
g,r,i,z,y
ssp_s14a0_udeep_20140523a
0
880,792(i‐selected)
S14A_0
WIDE
(GAMA15)
i,y
ssp_s14a0_wide_20140523a
9369‐9376
9612‐9619
9855‐9861
10,548,142(i‐selected)
S14A_0b
UDEEP
(COSMOS)
g,r,i,z,y
ssp_s14a0b_udeep_20150121a
0
880,187(i‐selected)
672,301(z‐selected)
602,061(y‐selected)
S14A_0b
UDEEP
(SXDS)
g,r,i,z,y
ssp_s14a0b_udeep_20150121a
1
1,303,520(i‐selected)
568,503(z‐selected)
720,781(y‐selected)
S14A_0b
WIDE
(XMM)
g,r,i,z,y
ssp3_4_1_20141224
8279‐8285
8520‐8527
8762‐8769 9006‐
9010
29,818,944
S14A_0b
WIDE
(GAMA09)
g,r,i,z,y
ssp3_4_1_20141224
9314‐9316
9556‐9560 9799‐
9801 10042‐10043
20,737,413
S14A_0b
WIDE
(VVDS)
g,r,i,z,y
ssp3_4_1_20141224
9451‐9453
9694‐9696 9936‐
9938
13,398,315
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
7670万レコード
カタログデータの探し方
カタログ検索初期画面
サーベイの種類
検索方法
サマリーテーブル検索画面にアクセス
https://hscdata.mtk.nao.ac.jp:4443/datasearch/
photoobj_searches/new?experimental=1
ログイン: すばるSTARSのアカウント
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(2)
検索条件入力
Coneサーチ
tract指定 等
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
検索条件入力
フラッグ
True
False
使わない
カタログデータの探し方(3)
アウトプット情報の指定
アウトプットの表示順指定
表示の最大数の指定
2015/3/20
出来上がったSQL文の確認
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(4)
プレビュー
少ないLimit数で確認(Preview)
後、最終クエリーをキューに投
げる。
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(5)
From: [email protected]
件名:SSP Catalog Search ‐ Your job has been finished : catalog‐job 2015‐03‐13
Your job has finished.
データ検索終了後、
こんなメールが登録先に届く
name: catalog‐job 2015‐03‐13
status: done
SQL:
SELECT
main.object_id, main.ra2000, main.decl2000, main.a_g, main.a_r, main.a_i, main.a_z, main.a_y, main.gmag_kron, main.rmag_kron, main.imag_kron, main.zmag_kron, main.ymag_kron, main.gmag_kron_err, main.rmag_kron_err, main.imag_kron_err, main.zmag_kron_err, main.ymag_kron_err
FROM
ssp_s14a0b_udeep_20150121a.photoobj_mosaic__deepcoadd__yselect AS main
LEFT JOIN ssp_s14a0b_udeep_20150121a.mosaic_forceflag__deepcoadd__yselect AS z_flag ON main.object_id = z_flag.object_id AND z_flag.filter01 = 'HSC‐Z' LEFT JOIN ssp_s14a0b_udeep_20150121a.mosaic_forceflag__deepcoadd__yselect AS y_flag ON main.object_id = y_flag.object_id AND y_flag.filter01 = 'HSC‐Y'
WHERE
(main.detect_is_tract_inner = 't' AND main.detect_is_patch_inner = 't') AND (main.gmag_kron >= 25 AND main.ymag_kron <= 22) AND (main.imag_kron ‐ main.zmag_kron >= 2 AND (main.zmag_kron ‐
main.ymag_kron BETWEEN ‐1 AND 1)) AND (z_flag.flux_kron_flags = 'f' AND y_flag.flux_kron_flags = 'f' AND z_flag.flux_kron_flags_psffactor = 'f' AND y_flag.flux_kron_flags_psffactor = 'f' AND z_flag.flux_kron_flags_radius = 'f' AND y_flag.flux_kron_flags_radius = 'f' AND z_flag.flux_kron_flags_smallradius = 'f' AND y_flag.flux_kron_flags_smallradius = 'f' AND z_flag.flags_pixel_edge = 'f' AND y_flag.flags_pixel_edge = 'f' AND z_flag.flags_pixel_interpolated_any = 'f' AND y_flag.flags_pixel_interpolated_any = 'f' AND z_flag.flags_pixel_interpolated_center = 'f' AND y_flag.flags_pixel_interpolated_center = 'f' AND z_flag.flags_pixel_saturated_any = 'f' AND y_flag.flags_pixel_saturated_any = 'f' AND z_flag.flags_pixel_saturated_center = 'f' AND y_flag.flags_pixel_saturated_center = 'f' AND z_f
lag.flags_pixel_cr_any = 'f' AND y_flag.flags_pixel_cr_any = 'f' AND z_flag.flags_pixel_cr_center = 'f' AND y_flag.flags_pixel_cr_center = 'f' AND z_flag.flags_pixel_bad = 'f' AND y_flag.flags_pixel_bad = 'f' AND z_flag.flags_pixel_suspect_any = 'f' AND y_flag.flags_pixel_suspect_any = 'f' AND z_flag.flags_pixel_suspect_center = 'f' AND y_flag.flags_pixel_suspect_center = 'f')
ORDER BY
main.object_id ASC
LIMIT
1000
job list:
https://hscdata.mtk.nao.ac.jp:4443/datasearch/catalog_jobs
CSV:
https://hscdata.mtk.nao.ac.jp:4443/datasearch/catalog_jobs/download/9125de4b72f57f54c5318509590764dba3dbb3a75fd929d8a2da375bcb56a873
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(5)
Job List
自分の打ったクエリーの内
容とアウトプットへのリンク
をリストしたもの
30秒ごとに更新されていて、
自分のクエリーの動作状況
も確認出来る。
Jobの状態
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
OutputのCSVファイルへのリンク
カタログデータの探し方(6)
Skymap(Explorer)を起動し
て、ダウンロードしたカタロ
グの分布等のチェック
●画像色合い変更可能
●Mini <‐> Background
●カタログのロードとオーバー
プロット可能
●マークの色の変更可能
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(7)
●カタログ表示可能
●マークした天体情報表示可能
●カタログとの連動可能
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
カタログデータの探し方(8)
スキーマブラウザ
各DBテーブルの詳細を表示
欲しい・使いたい情報のカラム名を知る
Direct SQL Searchで複雑な検索をした
い場合には、特に注意をしながらみて
ください。
将来的には、各カラムについて値がど
のように求められているかのアルゴリ
ズムのページへのリンクを持つように
する予定。(アルゴリズムページが未
整備、、、、)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
画像データファイルの探し方
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
画像データの探し方(2)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
画像データの探し方(3)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
画像データの探し方(4)
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
Coadd Warp
取得可能な
画像データ
2015/3/20
CCD
日本天文学会2015年春季年会 HSC企画セッションB04r
外部データ(+Value‐Added)とのリンク
• 分光赤方偏移カタログとのクロスマッチング
• 測光赤方偏移データカタログ(HSC‐based)とのリンク
• 未実装
近赤外線カタログとのリンクは未設定
他波長(具体的には近赤外線やUバンド)データとの結合解析結果のハンド
リング
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
今後の検索機能拡張予定など
• カタログ検索
SkymapからSQLを打てるようにする
Jobs Listから直接CSVをSkymapにオーバープロット
My Queryの保存機能
DASとの連携機能
時系列系のデータ検索は今後の課題
• 画像検索+α
小領域切り出し機能
• ドキュメント等の充実
チュートリアルページ
ユーザーマニュアルの充実
サンプルクエリーの充実(よりサイエンスカタログに近いもの)
講習会の開催
検討(修正)事項
カタログの保存容量制限の工夫(1回のクエリーでの最大保存容量が小さい)
プレビュー用のクエリー時間が短すぎる?
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
Skymap機能は進化中、、、、
WIDEサーベイ見れる
RA,DEC表示
Miniウィンドウの導入
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
Skymap機能は進化中、、、、
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
データ検索時の注意事項
(しつこいようですが、、、)
• まずリリースノートを読んでデータ利用に対する制限について理解して下さい。
• データ生成の流れを知り、どのようなデータが取得できるのかを理解して下さ
い。
• ストアド関数(データベース上で利用可能な関数)をうまく利用して下さい。
• フラッグの指定を注意深く行って下さい。
• 限界等級の情報を指定して下さい。
• Skymap等を使って、思った通りのサンプルが取得できているのかの確認を
行って下さい。
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r
まとめ
• HSC戦略枠サーベイのデータベースは、科学的成果を出していく上
でのキーの1つである
カタログ検索+確認ツールが使えるようになってきている
SQLがそれほどわからなくても、とりあえずカタログが取得はできる
• カタログ検索、画像検索とも、今後も機能追加が進む
• 機能拡張と同時に、SQL等の知識をどう伝達して、効率的なデータ取
得・解析を促進するかが今後の課題
• パイプラインの進化に合わせたデータベース(検索)進化が今後もま
すます求められる(スピードとユニークさ)
• Value‐Addedデータの増加が見込まれるので、対応方法を明確化し
ていく必要がある
2015/3/20
日本天文学会2015年春季年会 HSC企画セッションB04r