時系列予測機UFCORINを利用した GOES X線ライトカーブにおける 太陽フレア予報研究 村主崇行(計算科学研究機構),羽田裕子, 磯部 洋明, 柴田一成, 柴山拓也 (京都大学), 根本茂 (京都大学・株式会社ブロー ドバンドタワー), 駒崎 健二 (株式会社ブロードバンドタワー) 我々のやりたいこと 太陽フレア 予兆現象の 発見的解明 リアルタイム 宇宙天気予報 の実現 機械学習による自動フレア予測 蓄積しつつある膨大な太陽観測データ ある時刻から24時間以内に 起こるフレアの最大値を予報。 予測対象 GOES X線フラックス 1e-05 • GOES衛星による太 陽X線フラックスを 予測対象とする。 1e-06 • ある時刻から24時 間後までのGOES X 線フラックスの最大 値を計算する。 1e-07 0 50 100 150 200 250 300 時刻 (hour) 赤 : GOES衛星が観測したX線フラックス 緑 : ある時刻から24時間後までの GOESフラックスの最大値 350 • その最大値を、予 報を出す時点での 情報のみから予測 する。 予測値 予報実験結果(2011‐2012,時間分解能1hr) 将来24時間以内のX線フラックスの最大値 観測量の増大 • 天文学者が1つ1つのデータを人の手を使っ て解析をしていくのは困難。(SDOの場合:1日 に約1.5TBのデータを取得) • フレア予測を自動化することで、膨大なデータ の扱いが可能になる。 無数に考えられる特徴量(波長、 スケール、パターン…)の中から フレアの予兆になっているものを 機械的に探索することで、フレア トリガーの発見につながる。 宇宙天気とは • 太陽フレアやコロナ質量放出(CME)により地球に高エネル ギー粒子が到達したり磁気嵐が起こる現象。 • 衛星の故障や大停電を引き起こすことがある。 宇宙利用が増大する現代には宇宙天気予報が必要 1989年の大磁気嵐で故障した アメリカの変圧器 2000年の太陽フレアの影響で 大気圏に再突入したあすか衛星 © NICT UFCORIN(ゆふこりん) • Universal Forecast Constructor by Optimized Regression of Inputs ‐‐‐入力データの回帰分 析最適化に基づく汎用予報構築機 • 入力として与えられた時系列データを回帰分 析(実数列から実数を予測)することにより、 一般的な時系列データの予測を可能にした 予報エンジン。 UFCORIN ロゴも現在試作中!!(by.羽田) 機械学習とは? • 学習=既知のデータに基づき、未知の状況 にも適用できるモデル(経験、知識、智慧・・・) を獲得すること • これを機械にやらせるのが機械学習 機械学習の基本的な流れ: 訓練データを学習機に見せてモデルを学習させ、 試験データで予測精度を測る 訓練データ 機械学習機 試験データの「問題」部分 モデル 予測 試験データの「正解」部分 予測精度 66% 機械学習が普及した理由 特徴表現と学習手法の分業 • 特徴表現:各分野の専 • 機械学習ライブラリ: 門家が、対象を数値化 特定の分野に依存し する ないモデル作り 明日のフレア を予知したい ゴリラの 気持ちを 知りたい 特徴ベクトル:事例から 抽出した抽象的な特徴 アイテム1 72,234,130 81,342,560 90,000,000 アイテム2 2,019,050 4129,260 8,200,000 アイテム3 424,200 282,800 ???? 140,000 機械学習を利用する上で必要なこと データ(特徴表現)を 用意するだけ! UFCORINの特徴量表現 テキストファイル ↓ 時刻 データ 別のデータ・・・・ UFCORINに与える特徴データの方針 • ある時刻の太陽に対して複数個定義されるよ うなデータは使わない。 – 黒点あたり、活動領域あたりの量など。領域検出 が曖昧だったり、時間がかかる懸念があるため。 • 任意の時刻に、太陽全体に対して1つの値 が定まるような量を入力として与える。 利用した特徴データ • 期間: 2年間(2011/01/01‐2012/12/31) • 時間分解能:1時間 • SDO/HMI全球磁束積分 • SDO/HMI全球画像をWavelet変換したもの • GOES X線フラックスの過去の値(時間平均、 最大値) Wavelet変換 実空間 Wavelet空間 特徴的な位置・波長を持つパターンを検出で きる Wavelet変換による黒点特徴検出の検証 (by 高棹さん) 活動領域のHMI画像 Waveletスペクトル • 複雑そうな活動領域ほ ど短波長側のパワーが 大きい。 • シンプルな単極の黒点 のWaveletスペクトルは 黒点のサイズに対応す るピークを持つ。 • 複雑な構造の黒点の Waveletスペクトルは顕 著なピークを持たず、な だらかな冪構造に近い。 ある時刻から24時間以内に 起こるフレアの最大値を予報。 予測対象 GOES X線フラックス 1e-05 • GOES衛星による太 陽X線フラックスを 予測対象とする。 1e-06 • ある時刻から24時 間後までのGOES X 線フラックスの最大 値を計算する。 1e-07 0 50 100 150 200 250 300 時刻 (hour) 赤 : GOES衛星が観測したX線フラックス 緑 : ある時刻から24時間後までの GOESフラックスの最大値 350 • その最大値を、予 報を出す時点での 情報のみから予測 する。 予報精度の評価 • 2011‐2012の2年間平均で、Xクラスフレアが 24時間以内に起こる確率は3% • 常に「Xクラスフレアは起こらない」と予測 ⇒的中率97%を誇る優秀な予測機 • 予報精度をきちんと評価できる尺度が必要 • True Skill Statisticsという指標を使う Contingency Tableと True Skill Statistics(TSS) 予報 ○ 予報 × 観測 ○ 観測 × TP(True Positive) FP(False Positive) FN(False Negative) TN(True Negative) • TSSは予報性能を0...1 (無相関...完全予報)の実数で 評価する指標の一種。 • 事象の活動度が長期的に変動してもTSSは不変という 特徴を持つことから、フレア予報精度の指標として優 れている(Bloomfield et. al. 2012) 低調期 予報 ○ 予報 × 観測 ○ 観測 × 100 10 1 1000 活発期 予報 ○ 予報 × 観測 ○ 観測 × 200 9 2 900 UFCORINのContingency TableとTSS Cクラス 予報 ○ 予報 × 観測 ○ 観測 × 4591 276 1867 1624 Mクラス 予報 ○ 予報 × 観測 ○ 観測 × 1235 1438 571 5279 Xクラス 予報 ○ 予報 × 観測 ○ 観測 × 170 716 86 7551 予報 ○ 予報 × 観測 ○ TP(True Positive) FN(False Negative) 観測 × FP(False Positive) TN(True Negative) 2年分の模擬予報を実行し、その当否をもと に性能評価指数TSSを算出した。 UFCORINのTSSと先行研究との比較 先行研究はすべて、特定のActive Regionの集合 を選んで予報を行っている。 我々は、2年間の連続した期間に対して、AR等 を検出せず全球画像のみを用いて、先行研究と 同等のTSSを達成!! 社会影響の定量化は 予報の最適化に必須! 予報閾値 X class C class 実際のイベント C class M class X class 社会影響の定量化は 予報の最適化に必須! X class 予報閾値 False Positives False Negatives X class イベント UFCORIN:結論 Universal Forecast Constructor by Optimized Regression of INputs • 時系列データを入力とし、時系列データを予測 する汎用予報システム • 太陽全磁束、磁場画像のWavelet特徴量、GOES X線フラックスの過去値を用いて、将来24時間の X線フラックスの最大値を予測することで、フレア を予報 • Xクラス、 ≧ Mクラス、 ≧ Cクラスフレアに対して、 予報精度 TSS = 0.692, 0.470, 0.566を達成 UFCORIN:今後の課題 Universal Forecast Constructor by Optimized Regression of INputs • リアルタイムフレア予測 • 入力データ量を増やして予測精度の向上 – (SDO/AIAなど by.羽田さん) • 入力データ量を減らして予測精度を下げない様な 本質的な情報の抽出 • X線以外の波長で観測される宇宙天気現象も予測 • 他の機械学習手法を試す – ナイーブベイズ(特徴量との因果関係を推論できる)、 ニューラルネット(特徴量の自動抽出に優れる)など • 将来的には、Solar‐Cなどの太陽観測衛星の運用に 役立てて頂けるような、太陽全球内でのフレア発生 位置予報にも取り組みたい。 • SDO/HMI全磁束 • SDO/HMI画像 Wavelet変換 • GOES X‐Ray Flux の過去値 GOES X‐Ray Flux 将来24時間最大値 GOES X‐Ray Flux 最大値の予測値 予報(〇or×) 観測(〇or×) 機械学習 と 通常のプログラミングの違い どちらもコンピューターに望みの動作をやっても らうという目的は同じだが・・・、 機械学習は • データさえあれば使える • データを増やすだけで性能が上がる • データを交換することで応用が効く • データ量によっては人間をも凌駕しうる システム構成 (2014年当時) • CPU : Intel Xeon (4 core x 10 台)、 メインメモリ : 16 G / 台 • ビッグデータ解析で用いられるHadoopシステム(分散処理シ ステム) • Map & Reduce アルゴリズムによる分散 • ブロードバンドタワー社内に設置 ※現在はAmazon Cloud上のシス UFCORINの使い方 時系列データファイル 予報戦略ファイル これらのテキストファイルをファイル サーバーにアップする。 3分待つ Wavelet変換による黒点特徴検出の検証 (by 高棹さん)
© Copyright 2024 ExpyDoc