UFCORIN による GOES X 線ライトカーブにおける太陽フレアの全自動予測

時系列予測機UFCORINを利用した
GOES X線ライトカーブにおける
太陽フレア予報研究
村主崇行(計算科学研究機構),羽田裕子, 磯部
洋明, 柴田一成, 柴山拓也 (京都大学), 根本茂
(京都大学・株式会社ブロー ドバンドタワー), 駒崎
健二 (株式会社ブロードバンドタワー)
我々のやりたいこと
太陽フレア
予兆現象の
発見的解明
リアルタイム
宇宙天気予報
の実現
機械学習による自動フレア予測
蓄積しつつある膨大な太陽観測データ
ある時刻から24時間以内に
起こるフレアの最大値を予報。
予測対象
GOES X線フラックス
1e-05
• GOES衛星による太
陽X線フラックスを
予測対象とする。
1e-06
• ある時刻から24時
間後までのGOES X
線フラックスの最大
値を計算する。
1e-07
0
50
100
150
200
250
300
時刻 (hour)
赤 : GOES衛星が観測したX線フラックス
緑 : ある時刻から24時間後までの
GOESフラックスの最大値
350
• その最大値を、予
報を出す時点での
情報のみから予測
する。
予測値
予報実験結果(2011‐2012,時間分解能1hr)
将来24時間以内のX線フラックスの最大値
観測量の増大
• 天文学者が1つ1つのデータを人の手を使っ
て解析をしていくのは困難。(SDOの場合:1日
に約1.5TBのデータを取得)
• フレア予測を自動化することで、膨大なデータ
の扱いが可能になる。
無数に考えられる特徴量(波長、
スケール、パターン…)の中から
フレアの予兆になっているものを
機械的に探索することで、フレア
トリガーの発見につながる。
宇宙天気とは
• 太陽フレアやコロナ質量放出(CME)により地球に高エネル
ギー粒子が到達したり磁気嵐が起こる現象。
• 衛星の故障や大停電を引き起こすことがある。
宇宙利用が増大する現代には宇宙天気予報が必要
1989年の大磁気嵐で故障した
アメリカの変圧器
2000年の太陽フレアの影響で
大気圏に再突入したあすか衛星
© NICT
UFCORIN(ゆふこりん)
• Universal Forecast Constructor by Optimized Regression of Inputs ‐‐‐入力データの回帰分
析最適化に基づく汎用予報構築機
• 入力として与えられた時系列データを回帰分
析(実数列から実数を予測)することにより、
一般的な時系列データの予測を可能にした
予報エンジン。
UFCORIN
ロゴも現在試作中!!(by.羽田)
機械学習とは?
• 学習=既知のデータに基づき、未知の状況
にも適用できるモデル(経験、知識、智慧・・・)
を獲得すること
• これを機械にやらせるのが機械学習
機械学習の基本的な流れ:
訓練データを学習機に見せてモデルを学習させ、
試験データで予測精度を測る
訓練データ
機械学習機
試験データの「問題」部分
モデル
予測
試験データの「正解」部分
予測精度
66%
機械学習が普及した理由
特徴表現と学習手法の分業
• 特徴表現:各分野の専
• 機械学習ライブラリ:
門家が、対象を数値化
特定の分野に依存し
する
ないモデル作り
明日のフレア
を予知したい
ゴリラの
気持ちを
知りたい
特徴ベクトル:事例から
抽出した抽象的な特徴
アイテム1
72,234,130
81,342,560
90,000,000
アイテム2
2,019,050
4129,260
8,200,000
アイテム3
424,200
282,800
????
140,000
機械学習を利用する上で必要なこと
データ(特徴表現)を
用意するだけ!
UFCORINの特徴量表現
テキストファイル
↓
時刻
データ
別のデータ・・・・
UFCORINに与える特徴データの方針
• ある時刻の太陽に対して複数個定義されるよ
うなデータは使わない。
– 黒点あたり、活動領域あたりの量など。領域検出
が曖昧だったり、時間がかかる懸念があるため。
• 任意の時刻に、太陽全体に対して1つの値
が定まるような量を入力として与える。
利用した特徴データ
• 期間: 2年間(2011/01/01‐2012/12/31)
• 時間分解能:1時間
• SDO/HMI全球磁束積分
• SDO/HMI全球画像をWavelet変換したもの
• GOES X線フラックスの過去の値(時間平均、
最大値)
Wavelet変換
実空間
Wavelet空間
特徴的な位置・波長を持つパターンを検出で
きる
Wavelet変換による黒点特徴検出の検証
(by 高棹さん)
活動領域のHMI画像
Waveletスペクトル
• 複雑そうな活動領域ほ
ど短波長側のパワーが
大きい。
• シンプルな単極の黒点
のWaveletスペクトルは
黒点のサイズに対応す
るピークを持つ。
• 複雑な構造の黒点の
Waveletスペクトルは顕
著なピークを持たず、な
だらかな冪構造に近い。
ある時刻から24時間以内に
起こるフレアの最大値を予報。
予測対象
GOES X線フラックス
1e-05
• GOES衛星による太
陽X線フラックスを
予測対象とする。
1e-06
• ある時刻から24時
間後までのGOES X
線フラックスの最大
値を計算する。
1e-07
0
50
100
150
200
250
300
時刻 (hour)
赤 : GOES衛星が観測したX線フラックス
緑 : ある時刻から24時間後までの
GOESフラックスの最大値
350
• その最大値を、予
報を出す時点での
情報のみから予測
する。
予報精度の評価
• 2011‐2012の2年間平均で、Xクラスフレアが
24時間以内に起こる確率は3%
• 常に「Xクラスフレアは起こらない」と予測
⇒的中率97%を誇る優秀な予測機
• 予報精度をきちんと評価できる尺度が必要
• True Skill Statisticsという指標を使う
Contingency Tableと
True Skill Statistics(TSS)
予報 ○
予報 ×
観測 ○
観測 ×
TP(True Positive)
FP(False Positive)
FN(False Negative) TN(True Negative)
• TSSは予報性能を0...1 (無相関...完全予報)の実数で
評価する指標の一種。
• 事象の活動度が長期的に変動してもTSSは不変という
特徴を持つことから、フレア予報精度の指標として優
れている(Bloomfield et. al. 2012)
低調期
予報 ○
予報 ×
観測 ○
観測 ×
100
10
1
1000
活発期
予報 ○
予報 ×
観測 ○
観測 ×
200
9
2
900
UFCORINのContingency TableとTSS
Cクラス
予報 ○
予報 ×
観測 ○
観測 ×
4591
276
1867
1624
Mクラス
予報 ○
予報 ×
観測 ○
観測 ×
1235
1438
571
5279
Xクラス
予報 ○
予報 ×
観測 ○
観測 ×
170
716
86
7551
予報
○
予報
×
観測 ○
TP(True Positive)
FN(False
Negative)
観測 ×
FP(False Positive)
TN(True Negative)
2年分の模擬予報を実行し、その当否をもと
に性能評価指数TSSを算出した。
UFCORINのTSSと先行研究との比較
先行研究はすべて、特定のActive Regionの集合
を選んで予報を行っている。
我々は、2年間の連続した期間に対して、AR等
を検出せず全球画像のみを用いて、先行研究と
同等のTSSを達成!!
社会影響の定量化は
予報の最適化に必須!
予報閾値
X class
C class
実際のイベント C class
M class
X class
社会影響の定量化は
予報の最適化に必須!
X class
予報閾値
False Positives
False Negatives
X class イベント
UFCORIN:結論
Universal Forecast Constructor by Optimized Regression of INputs
• 時系列データを入力とし、時系列データを予測
する汎用予報システム
• 太陽全磁束、磁場画像のWavelet特徴量、GOES X線フラックスの過去値を用いて、将来24時間の
X線フラックスの最大値を予測することで、フレア
を予報
• Xクラス、 ≧ Mクラス、 ≧ Cクラスフレアに対して、
予報精度 TSS = 0.692, 0.470, 0.566を達成
UFCORIN:今後の課題
Universal Forecast Constructor by Optimized Regression of INputs
• リアルタイムフレア予測
• 入力データ量を増やして予測精度の向上
– (SDO/AIAなど by.羽田さん)
• 入力データ量を減らして予測精度を下げない様な
本質的な情報の抽出
• X線以外の波長で観測される宇宙天気現象も予測
• 他の機械学習手法を試す
– ナイーブベイズ(特徴量との因果関係を推論できる)、
ニューラルネット(特徴量の自動抽出に優れる)など
• 将来的には、Solar‐Cなどの太陽観測衛星の運用に
役立てて頂けるような、太陽全球内でのフレア発生
位置予報にも取り組みたい。
• SDO/HMI全磁束
• SDO/HMI画像
Wavelet変換
• GOES X‐Ray Flux
の過去値
GOES X‐Ray Flux
将来24時間最大値
GOES X‐Ray Flux
最大値の予測値
予報(〇or×)
観測(〇or×)
機械学習 と
通常のプログラミングの違い
どちらもコンピューターに望みの動作をやっても
らうという目的は同じだが・・・、
機械学習は
• データさえあれば使える
• データを増やすだけで性能が上がる
• データを交換することで応用が効く
• データ量によっては人間をも凌駕しうる
システム構成
(2014年当時)
• CPU : Intel Xeon (4 core x 10 台)、 メインメモリ : 16 G / 台
• ビッグデータ解析で用いられるHadoopシステム(分散処理シ
ステム)
• Map & Reduce アルゴリズムによる分散
• ブロードバンドタワー社内に設置
※現在はAmazon Cloud上のシス
UFCORINの使い方
時系列データファイル
予報戦略ファイル
これらのテキストファイルをファイル
サーバーにアップする。
3分待つ
Wavelet変換による黒点特徴検出の検証
(by 高棹さん)