JBONインターフェースWG報告

JBONインターフェースWG
報告
矢原 徹一
九州大学大学院理学研究院
検討経過


2009年4月15日:第一回WG(東大駒場)
 九大:矢原
 東大:伊藤元己、神保宇嗣、柴崎亮介、長井正彦、大手信人
 国環研:松永恒雄、真板英一、小川安紀子
 遺伝研:菅原秀明
 森林総研:阿部真
 農環研:楠本良延、岩崎亘典
 JAXA:磯口修
 JAMSTEC:山本啓之
 環境省:阪口法明、鈴木真野
 自然研:鋤柄直純、米田政明
 産総研:岩男弘毅(by Skype)
2009年4月16日:JBON Portal 打ち合わせ(東大駒場)
 矢原、伊藤、神保
ワークショップ2日間の議論も考慮に入れて提案
第一回WG議題



GEO BONに関する経過説明
GEOSS-AP symposiumの報告
検討事項



情報交換:どんなシステムが利用可能か?
ニーズの検討:どんなデータを見たいか?
実行計画:JBON Portalをどう作るか?
どんなシステムが利用可能か?





GBIF:http://www.gbif.org/
 日本サイト:http://bio.tokyo.jst.go.jp/GBIF/gbif/japanese/
 日本ポータル:http://gbif.ddbj.nig.ac.jp/
DDBJ:http://www.ddbj.nig.ac.jp/index-j.html
JaLTER:http://www.jalter.org/
 ILTERに準拠:EMLによりメタデータ管理
RuLIS:
http://gbif.ddbj.nig.ac.jp/pdf/2006/nokanken_yamamoto.pdf
GEO GRID:http://www.gtrc.aist.go.jp/project_geo
GBIFとILTER

GBIFは標準化されたデータベース


Darwin Core 形式でデータが入力される
階層的IDでデータが管理される


データ自体を検索・ダウンロード可能
ILTERはメタデータ(データ属性を記述するデータ)をサ
ポート

データ形式はさまざま(表形式、画像など)


メタデータはEML(xmlのメタデータ形式)で標準化
データは階層的IDを持たない

データ自体を検索・ダウンロードすることに制約あり
GBIFとILTERの違いの背景

GBIF:分類学者の関心に依拠


分布記録(標本または観察記録)に焦点
個体や個体群の状態記録は(最初は)扱わない



状態記録を扱えるように拡張は可能
しかし、状態変量(たとえば個体数)の定義、調査努力、など
生態学的に重要な情報を自由に記述できない
ILTER:生態学者の関心に依拠


特定のプロットでのさまざまな記録に焦点
状態変量はとても標準化できないので、メタデータの
標準化だけを考える
GBIF Darwin Core


必須項目
 DateLastModified:レコードの最終更新日
 InstitutionCode:機関コード 例:QDAI
 CollectionCode:各機関内の収集品別ID 例:YAKUDATA
 CatalogNumber:収集品内のレコード別ID 例:33967
 ScientificName: 学名
非必須項目
 BasisOfRecord:レコードの種類の略称





(O) 観察、(S)標本、 (L) 生物種 、(G)遺伝資源
YearIdentified, MonthIdentified, DayIdentified
Longitude, Latitude
Sex:性別
ほか 項目を拡張することは可能
GBIFポータルの分布図作成機能
作図例:ススキ(Miscanthus sinensis)の検索結果
北米東部に広く帰化していることがわかる
ITER EML






メタデータの水準を5段階に設定
1:Identification(最低限の情報)
2:Discovery(1+地域・分類群・時間)
3:Evaluation(2+方法・属性概要など)
4:Access(3+データへのアクセス法)
5:Integration(4+属性詳細)
ITER EML Identification








Title:データ名 屋久島植物分布データベース
Creator:作成者 矢原徹一
Contact:連絡先 九州大学生態科学研究室
Publisher:出版元 出版されていることが前提
Publication Date:出版日
Keywords:キーワード
Abstract:要旨
Dataset/distribution (i.e. URL for dataset
information):データのありか(ウェブサイトなど)
メタデータを科研費DBのように検索でき
れば良い
検索ツールとしてGoogle Earthを活用

緯度・経度がタグとなる
データは


メタデータを地図上に表示
水質、森林プロット、魚、な
どカテゴリー別にKMLファ
イルを作成
種名がタグとなるデータ

GBIFに依拠してDB化



EMLを部分利用



Darwin Core を拡張
個体数、減少要因などの
状態変量を追加
データセットの属性情報を
蓄積
Data paper に対応
短期入力目標を特定
Data paper


生態学会大規模長期専門委員会で検討中
類似モデル:Molecular Ecology Resources


当初はマイクロサテライトのプライマー発表に特化し
たジャーナル
Ecological Researchの投稿種目を新設




いずれは”Ecological Research Resources”に
1-2ページでデータベースの概要を紹介
URLを記載
被引用度がWeb of Scienceで評価される
Global Earth Observation Grid
産業技術総合研究所グリッド技術研究センター ウェブサイト より
Global Earth Observation Grid
農業景観に関する調査・情報システムRuLIS
RuLIS : Rural Landscape Information System
RuLISの目的
ある地域で観察された事象が、全体的傾向なのか、局所的な傾
向なのかを的確に評価するため、農業生態系における多様な生
物生息地の変動を地域~国土スケールで効果的にモニタリング
し、種、生態系、景観の各レベルにわたる詳細なデータを、体系
的、効果的に収集・蓄積・利用するためのフレーム。
RuLISの特徴
●全国農業生態系区分と、詳細モニタリング地区の2段階
●3次メッシュ体系による各種データの統合と、解析単位の組替
・国土数値情報、メッシュ気候値、自然環境基礎調査などとの統合が可能
・行政区、流域界などの利用、グリッド単位の結合(1x1、3x3、10x10など)
●各種データ(メッシュ、ポリゴン、ポイント)を地理情報で結合
・ほ場図(農法、整備)や植生図(ポリゴン)、生物分布(ポイント)などを結合
調査・情報システムRuLISのフレーム
1 全国の農村景観(農
業生態系)を類型化
(60タイプ)
風土による景観、生物
相の違いを考慮した調
査・解析を行う
地形、土壌、気象、植生
等の自然立地条件や農
業立地条件を利用した
農業生態系の類型化
(3次メッシュ単位)
legend
64
66
67
68
農業生態系の分類
利根川流域における6つのクラス
・全国の農業生態系を60のクラスに分類 ● 6-e 内陸部の水田景観
● 6-f 下流域低地水田景観
*この地図はレベル3で表示
● 6-g 下流域台地谷津田景観
● 6-h 下流域台地市街地景観
2 関東地方(利根川流
域)の水田景観で生
態系をモニタリング
広域データと詳細デー
タの結びつけと、生態
系の変化の解析を行う
モニタリング地点における土地被覆分類等の調
査手順の汎用化、サンプルプロットにおける調査
手順の汎用化等、調査システムの確立
生態系に関するデータの収集
legend
Monitoring Sites
* RuLIS
Rural Landscape Information System
利根川流域におけるモニタリング地点
1.土地被覆の現況状況
2.土地被覆の変化の把握
3.地区内の植生把握
4.希少種の分布
5.外来種の分布
current land cover
既存の植生調査データ等の収集
JBON Portal:データベース統合の要
地上データとリモセンデータ
とのI/Fを構築
GBIFを生態データ用に拡張し
JaLTERとのI/Fを構築
GBIF
JaLTER
GEO Grid
JBON
DDBJ
RuLIS
生物多様性に関するあらゆるデータベースを連結
JBON Portal の段階的構築

まずすぐにできることから始める




3月プレコンファレンスまでの目標を決める





データベースのリンクサイト
評価ツールのリンクサイト
調査マニュアルのリンクサイト
GBIF Darwin Core の拡張
日本の絶滅危惧種分布データベース
保護管理区分のデジタル化 など・・・提案募集
COP10までの目標:アジアへの拡張
その後の展開を考えておく
日本の絶滅危惧種分布データベース

環境省RDBデータ



河川水辺の国勢調査データ







Location: グリッドまたはGPS情報
状態変量:個体数、減少要因
非公開種データは
パスワードで管理
Location: 河川名+地点名(GPS情報に変換可)
状態変量:有無、画像
非生物情報:水質、横断測量データなど
田んぼの生き物調査データ
森林のデータ
博物館標本データ(入力がかなり進んでいる)
その他:個人所有のデータ
短期目標:他の可能性


アジアの標準植生図
日本の保護管理区分データベース





自然公園各種管理区分
国有林各種管理区分
シカ柵データベース
植物形質データベース
他のアイデア募集

提案した人は仲間を集めて実行しよう
データ提供と利用のインセンティブ

日浦提案





データペーパー
科研費、推進費などでデータ登録義務化
メタ解析の共著者
強制収容型データ入力キャンプ 森林DB春の学校
小池提案



矢原提案:目標を設定して協力
*入力戦隊イレルンジャー
ER論文の基データを電子化(義務化)
未発表データ市場をつくる
 データはあるがアイデアがない人とアイデアはあるがデータ
がない人の縁組支援
歴史的データをニーズを持つ人が協力して電子化
データベース作成に対する科研費