アブストラクト - 科学技術情報プラットフォーム


講演者名:村山泰啓(情報通信研究機構・統合データシステム研究開発室長)

要旨:「オープンサイエンスと 科学データ保存事業 ICSU-WDS」
オープンサイエンスが国際的な科学や研究の形、さらにはより広い社会へ大きな影響を与える可
能性が議論されている。何百年間も印刷文化が支えてきた書籍・文献による知恵の蓄積・活用に加
えて、生まれて 70 年程度の電子情報通信技術基盤が、飛躍的な「知恵」の利活用・有効活用を可
能にするかもしれない時代のきざし、と言ってもよいだろう。
インターネット上の情報資産は一般に、多様性、量、内容ともに大変にバラエティに富んでいる。
近年は IoT(Internet Of Things)のように社会の新たな利便性向上に資する未来が描かれる。多
様な情報が一様に人手を介さず通信され処理されて新たな情報を生成したりイノベーションとな
る未来図を夢想するが、現時点ではその端緒についたばかりである。まずは必要な分野・応用・目
的に適した処理系やデータを設計、作成して活用することが重要であろう。
ところで国際的にオープンサイエンスの文脈で語られる電子データについては、比較的静的な情
報資源である「データセット」
、とくに「研究データ(科学やその他専門的な情報資産一般といっ
てもよい)
」とそのアクセシビリティ、相互運用性、引用可能性、再利用やデータ基盤が議論され
ている。インターネット上の研究データを、信頼できる情報資産としてきちんと保管・管理して、
互いに顔を知らない者同士でも利活用して新たな成果を出せる未来が想定される。そこではおそら
くデータの公開・非公開問題よりは、相互運用可能な様式・作法を国際的に構築してデータを整備
しておくことの方が肝要なのかもしれない。
データの保全・再利用を考えるとき、どんなデータをどれくらい残すべきか、文献資産と同じよ
うに 50 年、100 年以上も残すのか、巨大なデータの膨大な(と想定される)維持コスト、などと
多々問題がある。科学研究の領域では 1957-58 年からワールド・データ・センター(WDC)とい
う国際事業が開始され、当時散逸の心配された重要なデータを国際体制下で保全、活用してきた。
1950 年代のデータ転送はデータブックやマイクロフィルムの輸送だったが、いまではインターネ
ットで世界中の計算機同志が相互交換可能な技術基盤がある。技術とシステムを改めて見直し、各
国アカデミー・学術会議の総意により 2008 年にワールド・データ・システム(ICSU-WDS)に改
組された。現在、その国際事務局を情報通信研究機構でホストしている。物事の判断基準となるべ
き科学データ・専門データをその信頼度、また保全の持続性などの観点から国際体制を構築しなが
ら、データ資源を世界へ配信していくための組織事業である。
図書館分野では収蔵すべき書籍を目利きし、長期の保管管理技術を向上させ、書籍の貸借・複写
を行う世界的ネットワークを構築して、すぐれた技術と社会の基盤がある。電子データについては、
保全すべきデータの種類・形式・粒度・作法、その判断基準や方法論、典拠情報の管理手法をはじ
めとして、必要な技術基盤とその上にあるべき利用システム、社会システムの構築はこれからであ
る。こうした情報流通の新しい形をめざして WDS、CODATA、RDA 等の国際組織が尽力している。
これらはより上位層のインフラとして機能すると思われる。WDC、WDS の過去約 60 年のデータ
管理・保全・利活用の実績は、求められる新たなデータ資産の保全・管理・利活用の手法確立に向
けて、得難い指針を与えてくれる貴重な財産であり活動となるであろう。