スライド 1

評価・予測分科会
assessment and projection
データに基づく評価と予測
使われてこそのデータ
考えるべきこと
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
情報の
流れ
• データのしまい方・つ
なぎ方
• データの提供の仕方
評価:予測
•データの解析の仕方
•解析結果の利用の仕方
利用を意
識した情
報整備
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
寄せ集めることを意図して取られたデータ
寄せ集められることを意識せずに取られたデータ
人が取ったデータを集めて解析するときの留意点
• データの精度(測定,同定,見逃し…)
• サンプルのバイアス(調査努力の偏在,不在
データの不在…)
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
サンプル数・カバーする範囲と,精度とのト
レードオフ
調査項目の選定:重要だが調査が困難な
こと,簡単に測れるがあまり情報にならな
いこと…
他の調査と比較して解析できること(他の
地点,他の時点(過去,将来))
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
分科会での発表の例
植物の絶滅リスク
粗く広くカバーする
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
分科会での発表の例
日本列島の多様性ホットスポット解析
•データのしまい方・つなぎ方
•データの提供の仕方
データを集める・つなげることで,時空間
的な広がりが大きくなる
• 生データの解析結果を集めて二次的な
解析をする(メタ解析 )
• 多くの人がそれぞれに集めた生データを
寄せ集めて解析する
•データのしまい方・つなぎ方
•データの提供の仕方
大小,新旧,国際・国内,さまざまなしくみ
すでに他の分科会の基調講演で紹介されて
いるはず.
•データの解析の仕方
•解析結果の利用の仕方
分科会での発表の例
植物の絶滅リスクと生態的特性との関係
-系統関係も考慮して
すでになされた解析結果の組み合わせ
•データの解析の仕方
•解析結果の利用の仕方
統計的検定は有効か
• 興味があるのは,ある要因の影響があるかない
かではない(そもそも,厳密に影響がゼロというこ
とはまずない)
• 影響の大きさに興味がある
• 帰無仮説を立てての仮説検定は,こうした状況に
は不向きなことが多い.
第一種の過誤
偶然の現象を,意味があるもの(なんら
かの背景による必然)と誤って解釈
統計的に有意→実は影響がないのに,
影響があるかのようなデータが偶然得
られた確率が十分に小さい.
↑「有意な影響」が検出されるまでなにも
しなくてよいのか?
統計的検定(影響の有無など)以外の統計手法
モデル選択:現象をよりよく表現する統計モデルを選ぶ
ベイズ統計:事前の情報(パラメータの事前分布)と追加
されたデータを組み合わせ,情報をアップデート
↑データが少しずつ得られる場合に有効かも
ベイズ推定の説明
データによる事前分布のアップデート
得られた事後分布を,次の解析時に
事前分布として使う.
•データの解析の仕方
•解析結果の利用の仕方
○か×かではないアウトプット(確率予報)の
使い方
• リスク評価(ハザードの大きさ x ハザード
の発生確率)
• 効果の期待値を最大化するような保全努
力の配分
• …
統計モデルとプロセスモデル
当てはまりがよいモデル
現象のメカニズムを表現するモデル
↑
これらは必ずしも排他的ではない.
シミュレーション+統計
プロセスを踏まえた統計モデル
統計モデルとプロセスモデル
分科会での発表の例
環境の空間的異質性を考慮したシカの分
布拡大モデル
外来生物の分布拡大予報
統計モデルとプロセスモデル
メカニズムの理解が不正確だと,統計的な
解析も正しくできない.
・たとえば偽反復:メカニズムを踏まえれば
あきらかに独立ではないデータを,独立だ
として解析
統計モデルとプロセスモデル
分科会での発表の例
環境の長期トレンドとランダムな変動のもと
での分布限界の動態のモデル
メカニズムの理解が結果の解釈を左右する
• 既存データの掘り出し方・生かし方
• 新しいデータの取り方
• データのしまい方・つ
なぎ方
各段階で様々な留
意点あるはず
• データの提供の仕方
→出し合って考える
評価:予測
•データの解析の仕方
•解析結果の利用の仕方
•データの解析の仕方
•解析結果の利用の仕方
「評価・予測の試み」ではなく,使える
ツール・使われるツールとして責任を
持って提供するにはどうしたらよいか?