国立天文台電波天文データ公開用システムの開発

天文GRID
JVOプロジェクト
国立天文台
2015/10/1
Data Grid Mini WorkShop
大石雅寿
共同研究者
国立天文台
 水本好彦
 安田直樹
 白崎裕治
 田中昌宏
お茶の水女子大
 増永良文
2015/10/1
富士通株式会社
 門前弘邦
 瓦井健二
 石原康秀
 谷中洋司
 山口 靖
 石田みつてる
 齋藤紀男
Data Grid Mini WorkShop
すばる望遠鏡
2015/10/1
Data Grid Mini WorkShop
2015/10/1
Data Grid Mini WorkShop
2015/10/1
Data Grid Mini WorkShop
45m大型電波望遠鏡
2015/10/1
Data Grid Mini WorkShop
2015/10/1
データベース化は現代天文学の常識
Data Grid Mini WorkShop
ALMA
2015/10/1
Data Grid Mini WorkShop
Time and Spectral Dimensions
The Multiwavelength Crab Nebulae
Crab star
1053 AD
X-ray,
optical,
infrared, and
radio
views of the nearby
Crab Nebula, which is
now in a state of
chaotic expansion after
a supernova explosion
first sighted in 1054
A.D. by Chinese
Astronomers.
2015/10/1
Data Grid Mini WorkShop
Slide courtesy of Robert Brunner @ CalTech.
現代天文学の要請
宇宙開闢直後の物理
 銀河形成の謎
 大規模構造形成の謎
 宇宙の平均密度の決定
etc.
→ 均質なサーベイデータを用いた統計的
処理が必須

2015/10/1
Data Grid Mini WorkShop
天文学者の欲求




感度を上げたい!
たくさんのデータを取りたい!
広い領域を見たい!
多波長で見ないと正しい宇宙像は得られ
ないぞ!
2015/10/1
Data Grid Mini WorkShop
大型望遠鏡による観測データ



野辺山電波望遠鏡:~1TB/yr
すばる望遠鏡
:~20TB/yr
ALMA(予定)
:~PB/yr
良質なデータ(特にサーベイデータ)の洪水
ディジタル化・アーカイブ化されている
2015/10/1
Data Grid Mini WorkShop
Archiveを用いた天文学研究
• large fraction of astro-papers based on
archives
• HST archive use growing faster than
archive
30
Gbytes/Day
25
20
15
10
5
Already more retrieval than ingest!
0
1994.8
1995.3
1995.8
1996.3
Ingest
1996.8
Year
2015/10/1
1997.3
1997.8
1998.3
Retrievals
Ingest
1998.8
Data Grid Mini WorkShop
1999.3
graphics from
US NVO
project
既存DBの問題点




URLを知らないとアクセスできない
FITSヘッダの内容が統一されていない
各波長に対応した様々な解析ソフト
→他波長のデータへのアクセスの障壁
較正済みデータとは限らない
→較正には観測装置の癖を知らなくては
ならない
2015/10/1
Data Grid Mini WorkShop
データ処理する人間の意識
それほどは変わらない
従来の方法では処理しきれないデータ
→なんとかならないか
2015/10/1
Data Grid Mini WorkShop
計算機環境の激変により・・・

高性能計算機資源が高速ネットワークで
接続
→遠隔地の計算機資源をあたかもローカ
ル計算機のように利用することが可能
→単細胞生物から多細胞生物への進化に
対応
2015/10/1
Data Grid Mini WorkShop
計算機利用パラダイムの転換
高度化した計算機環境+情報処理技術
を組み合わせることによって可能になる
新たな天文研究スタイルを確立しよう
2015/10/1
Data Grid Mini WorkShop
Japanese Virtual Observatory

分散DBによるDigital Universeの構築

多波長データを統合したDB基盤を開発

大量データに対する統計的処理による新
しいスタイルの天文学研究環境の確立
2015/10/1
Data Grid Mini WorkShop
JVO Home Page
http://jvo.nao.ac.jp/
2015/10/1
Data Grid Mini WorkShop
Digital Universe
Data Cube
Dec.
λ/Freq.
数値宇宙
R.A.
+ Time
望遠鏡による観測データ
2015/10/1
Data Grid Mini WorkShop
実宇宙
Virtual Telescope/Observatory
Digital Universeを観測し,そのデータを
解析・処理することにより天文学的知見を生
み出す抽象化された観測装置
いつでも,どこからでも,天候などに左右され
ずに観測することができる
2015/10/1
Data Grid Mini WorkShop
観
測
アイデア
実望遠鏡での
データ
検
解
アイデア
析
研究発表
観測
2015/10/1
索
データ
解
仮想望遠鏡での
観測
Data Grid Mini WorkShop
析
2015/10/1
Data Grid Mini WorkShop
検索でデータが見つからない
→ VOが,「観測手順書」を作成し,実望遠
鏡の制御システムに渡す
→ 「手順書」が承認されれば,実観測
→ 観測データを取得
→ VOに登録
VOは,成長する観測装置!
2015/10/1
Data Grid Mini WorkShop
JVOの必要機能




(内部)データフォーマットの共通化
異なるDBを統一的に検索
多様なデータ解析機能
マイニングなどの高度な解析機能
実望遠鏡との連携機能
VO内データの品質保証のために必須
2015/10/1
Data Grid Mini WorkShop
Grid上で動くものは・・・

データは原則として移動させない(負荷が
高すぎる)

必要なモジュールを移動させる
結果を手元に持ってくる
結果をうまく可視化することが重要


2015/10/1
Data Grid Mini WorkShop
DBの配置

観測データは,望遠鏡(観測所)におかれ
ることが望ましい
←→ DBの内容を保証

多波長データを利用するためには,必然
的に,分散データベースとなる
←→ 異なるDBMSを用いた環境
2015/10/1
Data Grid Mini WorkShop
プロトタイプ(初版)の作成



まずは,分散DBへの透過的アクセス法を
確立する。
検索言語(JVO Query Language)の動作
確認
閉じたサブネット内で実装
2015/10/1
Data Grid Mini WorkShop
プロトタイプで対象とする
観測データ



Subaru SuprimeCAM
Sloan Digital Sky Survey (SDSS)
2μm All Sky Survey (2MASS)
これらを用いて構想した枠組みの実効性を
示す
→ その後対象データを拡大する
2015/10/1
Data Grid Mini WorkShop
JVOプロトタイプ概念設計案
• JVOプロトタイプは Subaru, SDSS, 2MASS の DB に直接接続する。
• 他のVOとの接続はプロトタイプではサポートしないが、Subaru DB等への
接続と同様の方法で接続可能なように設計する。
• 検索で頻繁に使われるデータはJVO内部にコピーとして持つ必要はない
か。
• JVO に直接接続するDBは RDB または OODB で構築する。
• 検索結果はキャッシュされ、効率良く絞り込み検索などが行える。
Subaru DB
JVO
検索
データ解析
検索指示
検索結果
解析結果
画像表示
検索結果
SDSS DB
User
検索指示 検索結果
2MASS DB
2015/10/1
Data Grid Mini WorkShop
他のVO(NVO,AVO,etc)
Registry
Registryがもつデータベース
Registry は JVO がアクセス可能な DB/VO に関する情報を保持し、JVO からの問い合
わせにたいして、リクエストされた条件を満たすDB/VO のサーバーアドレスやアクセス
方法等を返す。
データベースカタログ 望遠鏡カタログ
観測装置カタログ
フィルターカタログ
DB/VO ID
DB/VO 名
種別 DB or VO
サーバーアドレス
Telescope ID
Detector ID
アクセス方法
コメント文
天体カタログ
天体名
天体種別
赤経
赤緯
HTM
座標誤差(赤経)
座標誤差(赤緯)
等級
等級誤差
距離
絶対等級
波長
Telescope ID
Telescope 名
VO ID
設置場所
緯度
経度
高度
口径
Detector ID
Detector 名
Telescope ID
DB/VO ID
波長域(下限)
波長域(上限)
検出感度曲線デー
タ
視野
フレームカタログ
フレームID
観測開始時刻
露出時間
中心座標(赤経)
中心座標(赤緯)
観測装置ID
フィルターID
限界等級
seeing
frame URL
天体カタログ、フレームカタログは本体 DB/VO からとってくるべきもので
2015/10/1
Data Grid Mini WorkShop
あるが、Quick
Search を行えるように、検索頻度の高い項目についてそ
のデータベースを Registory に保持しておくのはどうか?
Filter ID
Filter名
Detector ID
波長域(下限)
波長域(上限)
透過曲線デー
タ
天体名 resolver
天体名 <--> 座標変換サービス
検索要求
Webブラウザ
Web
ブラウザ
JVO用
ブラウザ
JVO Query
Language 利用者独自
GT2から呼び出
で記述 サービス
せるコマンドを
JVO QLを 想定
各DB毎の検
索命令に
parse
JVO
ポータル
研究者
JVO用
Viewer
skycat
UDDIサーバ
(FreeSoft)
Globus Toolkit
サービス
レジストリ
セキュリティ管理
資源管理
データ管理
検索命令を発
行し,データを
転送する
実際の検索を依
頼するサーバを
resolveする
2015/10/1
天体カタログDB
データアーカイブ
サービス
データ
管理DB
データ
Globus
Toolokit V2
を適用
仮想観測
Contoroller
天体カタログ
検索サービス
Data Grid Mini WorkShop
解析サービス
JVO Query Language(1)
カタログ検索
create view myEROtable as
select s.Bmag,
s.Rmag,
t.Hmag,
t.Kmag,
...,
sr.BOX(POINT(s.ra,s.dec),w,h)
as Rimage,
tk.BOX(POINT(s.ra,s.dec),w,h)
as Kimage,
...
from
SUBARU s,
2MASS t,
...,
SUBARU.R sr,
2MASS.K tk,
...
where XMATCH(s,b,...) < 3 arcsec
and
(s.Rmag-t.Kmag) > 6 mag
and
BOX(POINT(ra0,dec0), w0, h0)
2015/10/1
Data Grid Mini WorkShop
and
...
Create view with the user
specified name in JVO
system.
Select attributes from each
catalog server. Column
names can be expressed
in UCD.
Select cutout images from
each image data server.
Image
area
can
be
specified by BOX or
CIRCLE operand.
Select the catalog server.
Select the image data server.
Cross-match distributed
catalogs.
Query condition based on
distributed catalog.
Specify search area with the
same syntax as cutout
image specification.
Partition to
small segment
JVO Query Language(2)
画像検索
AREA table
s t
a1
a2
a3
select s.a,
t.a,
...
from
SUBARU.R s,
2MASS.K t,
cutout request
...
OVERLAP
where (s.AREA() OVERLAP t.AREA()) as a s.AREA()
SUBARU.R s
2015/10/1
Data Grid Mini WorkShop
t.AREA()
2MASS.K t
ユーザーインターフェースとしての検索条件
項目
1. 領域を指定して検索(天球座標または天体名)
7. 画像の属性を指定して検索
例1
例2
例3
例4
赤経・赤緯と半径で円領域を指定。
例1 視野が X 以上の画像データ。
複数の赤経・赤緯の組合わせで領域指定。
8. 観測装置を指定
天体名と半径で領域指定。
例1 望遠鏡の名前を指定。
フィールド名(HDF、SDF等)を指定。
例2 観測装置名を指定。
2. 観測時刻を指定して検索
9. データベースを指定
例1 観測時刻が T1~T2 の範囲にあるもの。
例1 スバル Suprim-Cam のデータベースを指
例2 観測時刻の間隔が dT1以上 dT2以下である。
定。
3. 波長を指定して検索
例2 survey 型観測のデータベースのみ検索。
例1 電波、可視光、赤外、X線、ガンマ線、その他を指定。
例3 pointing 型観測のデータベースのみ検索。
例2 波長がλ1~λ2 の範囲のデータ。
例3 U, V, B, G, R, I, J, K, L, M, N で指定。
* 複数指定の場合 and か or を指定する。 問題点
4. 観測条件を指定して検索
例1 seeing が X 以下、限界等級が M 以上。
例2 AO観測のデータが欲しい。
検索条件によっては大量のデータをDBから
とってくることになる。例えば、領域指定なしの
検索を行うと大量のデータか検索条件にマッ
チしてしまう。そのよう場合はどうするか?
5. 天体の属性(位置以外)を指定して検索
例1 見かけの明るさを指定。
例2 絶対等級を指定。
例3 距離、redshift、photometric redshitt。
例4 種族を指定。恒星、銀河、SN、連星系、パルサー、
Data Grid Mini WorkShop
AGN、 2015/10/1
クエサー、GRB、XRB、SGR
Redhat Linux
JVO Prototype System Architecture
GSDL
UDDI Maintenance Tool
JVO Client
Apache Tomcat
Netscape Communicator
JVO Service (X match)
Maintenance Tool
UDDI4J
soapuddi
Apache
SOAP
① Applet
DownLoad
Globus Toolkit (Server)
Java2SE 1.4
Java2SE 1.4
Hypertext
contents
Redhat Linux
JVO Service
Gb Ether
Solaris8 (Possible at Linux)
JVO
Controller
UDDI Registory / Servlet Engine
2Mass
DataBase
JVO Service
(select)
• register
• update
• delete
JDBC
SQL
library
Java2 Plugin
JVO Client
(applet)
③ Find Service
② Request
Observation
JVO Controller
DB Service
Java2SE 1.4
PostgreSQL (DBMS)
UDDI4J
•
•
•
•
Image
Data
SUBARU
SupCam
z-band
UDDI
Data
get & parse GSDL
pre condition check
execute Service
post condition check
⑤ execute Service
⑤’ execute Service
Internet
③ get GSDL
Check status
④’ Get GSDL
by GridFTP
⑥’ spawn Service
GridFTP
SQL
library
JVO Service
(select)
SQL
library
JVO Service
(image)
Image
Data
2015/10/1
GSDL
⑥ spawn Service
JVO Service
(count)
Free Software
In House Software
Commercial Software
Function
JVO Service (image)
JVO Service (X match)
Globus Toolkit (Server)
Globus
Toolkit
GSDL
Globus Toolkit (Server)
JVO Service
SUBARU
DataBase
SUBARU
DataBase
JVO Service
⑦ issue SQL
GSDL
(copy)
④ Get GSDL
by GridFTP
AVO
2Mass DB
Redhat Linux
Globus Toolkit (Client)
NVO
PostgreSQL
JVO Server
Monitoring
Globus
Toolkit
DB Service
Image
Data
(copy)
JVO Service
(X match)
Image
Data
(copy)
The following free software is included by globus toolkit.
• OpenSSL (Secure Socket Library)
• OpenLDAP (LDAP Server)
• wu-ftpd (ftp server)
Data Grid Mini WorkShop
JVO Service
(select)
SQL
library
JVO Service
(count)
SQL
library
⑦’ issue SQL
Copy imate data
by GridFTP
Copy imate data
by GridFTP
Image
Data
(copy)
Image
Data
DB Service
ORACLE
SUBARU
SupCam
i-band
Prototypeの動作




JVO QLを読み込む
「観測手順書」を作成し,各ステップを実行
必要な段階で,Registryにコンタクトしなが
ら手順書を展開
時にとっては,手順書のステップが
dynamicに増加
2015/10/1
Data Grid Mini WorkShop
JVO Prototype Architecture
Solaris8 (Possible at Linux)
Redhat Linux
UDDI Maintenance Tool
UDDI Registory / Servlet Engine
Java2SE 1.4
Java2SE 1.4
Maintenance Tool
Apache Tomcat 4.x
JVO Client
Globus Toolkit (Server)
JVO Service
soapuddi
UDDI4J
Apache
SOAP
JDBC
Hypertext
contents
PostgreSQL
RDB
JVO Server
Java2 Plugin
…
Java2SE 1.4
JVO Client
(applet)
SQL library
DB Service
Applet
Down Load
Netscape Communicator
JVO Service
JVO Controller
Redhat Linux
UDDI4J
JVO Service
Globus Toolkit (Client)
JVO Service
Globus Toolkit (Server)
JVO Service
SQL library
Globus Toolkit (Server)
DB Service
PostgreSQL
JVO Service
DB Service
RDB
RDB
Free Software
2015/10/1
Commercial Software
In House Software
Function
Data Grid Mini
SQL library
ORACLE
The following free software is included by globus toolkit.
• OpenSSL (Secure Socket Library)
WorkShop • OpenLDAP (LDAP Server)
• wu-ftpd (ftp server)
JVOプロトタイプ画面
仮想観測名
を指定
JVO QLの指定
(分散データのSQL拡張)
実行・停止・clearの指示
サービス実行制御の
ログ表示
サービスの実行履歴・予定 (動的に変化)
[実行先ホスト名、コマンド名、結果]
2015/10/1
Data Grid Mini WorkShop
プロトタイプ実装で分かったGTK
の問題


Job実行先での環境変数が継承されない
→環境変数取得やコマンドを実行するshell
scriptを用意し,そのscriptをGridFTPし,
そのshellを起動してscriptを実行
利用者のアカウントが全てのマシンにある
とは限らない
→動作時のアカウントはglobusのみ
2015/10/1
Data Grid Mini WorkShop
プロトタイプ実装で分かったGTK
の問題(続き)

Job実行開始までのOverhead大きすぎる
→JVOでのJobは多くはbatch処理的なの
でそれほど問題ではない。Foreground的
処理をGridで行なうのは現状では問題。
→お知恵を拝借したい
2015/10/1
Data Grid Mini WorkShop
今後の展開—来年あたり


プロトタイプ第2版の作成
解析システムの実装(使用中のコンポー
ネントを接続)
セキュリティの確保(サブネット越え+
Firewall越え)
世界のVOとの接続
International Virtual Observatory
Allianceへの参加を通し,接続形態の
共通化に貢献
2015/10/1
Data Grid Mini WorkShop
JVO 解析機能
1. データベースの統計処理
指定したデータベース、天空領域について以下の天空マップを作る。天球の指定した
範囲がど れだけの時間・回数・波長で観測されたのかを視覚的に確認するため。
例1 観測時間マップ
例2 観測回数マップ
例3 波長域数マップ
例4
2. ユーザーデータベースの解析
例1 クラスタリング解析による新種天体の探索。
例2 LogN-LogP 分布の作成。
例3 特定天体のスペクトルの表示。
例4 天体2or3次元分布の表示。
例5 天体のライトカーブ表示。
3. 画像データの解析
例1 モザイキング。ユーザーが指定した領域のみの画像を切り出す。
例2 マルチカラー表示。多波長で取られた画像を波長毎に色をつけて合成する。
例3 deconvolution を行う。
例4 天体抽出、種族分類、カタログ化。
例5 トランジェント天体、変光星の探索。
例6 重力レンズ効果の探索。宇宙重力場、Cosmic String、Dark Matter
例7 high-z 天体候補の探索。
4. simulation 機能
例1 例えば、HSTの画像をSubaruで見た場合画像に変換する。
2015/10/1
Datasimulation
Grid Mini機能。
WorkShop
例2 重力レンズ効果の
例3 ...
2015/10/1
Data Grid Mini WorkShop
Java NEWSTAR




パラメータ入力画面をJavaで作成
プラットフォーム依存性を排除
解析の本体部はサーバーに置き,HORB
で通信
AIPSを用いたファイル管理(VAXタイプ)
→ 通常のUNIXファイルとして管理
2015/10/1
Data Grid Mini WorkShop
2015/10/1
Data Grid Mini WorkShop
世界のVO



NVO (USA), AVO (EU),AstroGrid (UK)
Germany, Canada, Russia, Australia
India, China, JAPAN
各国のVOを相互接続するための規約作り
→ International Virtual Observatory
Alliance (IVOA)
2015/10/1
Data Grid Mini WorkShop
MVC
天文台殿
天体カタログDB
MVC
サービス
サービス
天体カタログ
サービス
MVC
VO用
ブラウザ
JVO
ポータル
Web
サーバ
セキュリティ管理
VO用
Viewer
ワーク
フロー
サービス
サービス
利用者独自
サービス
セキュリティ管理
資源管理
データ管理
仮想観測実行
サービス
仮想観測
指示
研究者
天体カタログ
天文台殿
DA/DB
サービス
サービス
DB/DA
サービス
資源管理
データ管理
サービス
レジストリA
セキュリティ管理
資源管理
DB
Data
データ管理
GRID環境 A
サービス
レジストリC
Web
サーバ
サービス
レジストリB
資源管理
セキュリティ管理
VO用
ブラウザ
セキュリティ管理
研究者
VO用
Viewer
2015/10/1
GRID環境 C
サービス
サービス
サービス
セキュリティ管理
VO
ポータル
サービス
サービス
サービス
資源管理
他システム
データ管理
処理
データ管理
資源管理
セキュリティ管理
データ管理
資源管理
データ管理
サービス
他システム
サービス
サービス
サービス
pipeline
他システム
サービス
サービス 処理
処理
他システム
処理
Data Grid Mini WorkShop
GRID環境 B
今後の展開—数年後



制御システムとの接続
すばる,野辺山の制御系は分散WS
GRIDインターフェースを付けてVOに
接続
ALMAデータの接続(年間Pbyteを生産)
一般用&教育用interface
2015/10/1
Data Grid Mini WorkShop
波及効果



大学・大学院教育の支援
初等・中等教育の支援
Public outreach
2015/10/1
Data Grid Mini WorkShop
DB天文学

光学赤外線電波天文学/電波X線天文学

大量データの統計処理
→物理量を精度よく決定
→天文学は精密科学へと変貌する
未知天体の発見ラッシュ

2015/10/1
Data Grid Mini WorkShop
mystery outliers
2015/10/1
Data Grid Mini WorkShop
graphics from
US NVO
project
2015/10/1
Data Grid Mini WorkShop