講演者名:武田英明 (国立情報学研究所・教授) 要旨: 科学はオープンで


講演者名:武田英明

要旨:
(国立情報学研究所・教授)
科学はオープンであるべきということは期待されていたが、実際にはなかなかそうはならなかった。
政治的あるいは法律的、倫理的、経済的、システム的理由などいろいろな障害があったからである。し
かし Internet/Web 技術は大きな変革をもたらした。Internet/Web 技術は単に技術的にオープンにする
仕組みを提供したということではない。Internet/Web 技術は社会そのものを変え、オープンに向かせ
ている。結果として、オープンサイエンスは技術的に可能であるだけでなく、向かうべく科学の未来と
なっている。
オープンサイエンスの実現には学術文化から科学の方法に至る科学の様々な面を変えていかないとい
けない。しかし、端緒としてふさわしいのは研究データの処理である。現代の科学の多くの研究ではデ
ータなしでは実施できない。データは研究の入力であり、処理するものであり、結果である。データの
共有を実現することは、共同研究を加速し、オープンにデータを公開するものも容易になり、オープン
サイエンスを実現する第一歩となる。
研究者が研究活動におけるデータをスムーズに共有するにはそのためのフレームワークが必要である。
もちろん、Internet/Web 技術が普及する前から特定の領域の科学や研究コミュニティにおいてはデー
タ共有はなされてきた。しかし、Internet/Web 時代の研究データ共有はドメインやコミュニティを超
えた共有であり、そのための必要条件は異なる。大きな点としては、アクセス容易性、持続性、了解可
能性である。データは形式的にも意味的にもアクセス可能でないといけない。またデータは持続的でな
いといけない。さらにはデータは単に同じドメインやコミュニティに属さない他の研究者にとっても理
解可能でないといけない。
このような研究データ共有を実現するにはいくつかのレイヤーに分けて考えるのがよいであろう。最
初のレイヤーはデータそのもので、次はそのフォーマットである。これらはドメインやコミュニティに
おけるデータ共有でも存在したレイヤーである。3 番目と 4 番目はメタデータとメタデータのスキーマ
である。これらはドメインやコミュニティを超えてデータを理解可能にし、検索などで意味的にアクセ
ス可能にするために必要なものである。5 番目は識別子のレイヤーである。これはシステム的にアクセ
ス可能にするためおよび持続性を維持するために必要である。各レイヤーはそれぞれきちんと定義され、
グローバルに共有されないといけない。識別子レイヤーの要素としての DOI(Digital Object Identifier)
はその良い例である。このような要素を構築・共有する努力を重ねていくことが、よい研究データ共有
フレームワーク構築に必要である。